JP2002515738A - Nucleic acid analysis - Google Patents

Nucleic acid analysis

Info

Publication number
JP2002515738A
JP2002515738A JP52712297A JP52712297A JP2002515738A JP 2002515738 A JP2002515738 A JP 2002515738A JP 52712297 A JP52712297 A JP 52712297A JP 52712297 A JP52712297 A JP 52712297A JP 2002515738 A JP2002515738 A JP 2002515738A
Authority
JP
Japan
Prior art keywords
nucleic acid
probe
oligonucleotide
array
hybridization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP52712297A
Other languages
Japanese (ja)
Inventor
ジェイ. ロックハート,デビッド
チー,マーク
ガンダーソン,ケビン
レイ,チャオキアン
ウォディカ,リサ
ティー. クロニン,マウリーン
リー,ダンニー
エム. トラン,ヒュ
マツザキ,ハジメ
エイチ. マックガル,グレン
ディー. バロン,アンソニー
Original Assignee
アフィメトリックス,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アフィメトリックス,インコーポレイティド filed Critical アフィメトリックス,インコーポレイティド
Publication of JP2002515738A publication Critical patent/JP2002515738A/en
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/052Imidazole radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/12Triazine radicals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

(57)【要約】 本発明は、2つ又はそれ以上の試料間の核酸存在量(例えば発現レベル)の差異を確認するための簡易方法を提供する。本方法は、多数(例えば、1,000以上)の任意に選択された異なるオリゴヌクレオチドプローブを含有し、各々の異なるプローブの配列及び位置が公知であるアレイを提供することを包含する。2つ又はそれ以上の試料からの核酸試料(例えば、mRNA)をプローブアレイとハイブリダイズさせて、ハイブリダイゼーションのパターンを検出する。試料間のハイブリダイゼーションパターンの差異は、それらの試料間の種々の遺伝子の発現の差異を示す。本発明はさらに、核酸の末端標識方法を提供する。一実施態様では、本方法は核酸を提供し、標識化オリゴヌクレオチドを提供し、次にオリゴヌクレオチドを核酸と酵素的に結紮することを包含する。したがって、例えば核酸がRNAである場合、標識化オリゴヌクレオチドはRNAリガーゼを用いて結紮し得る。別の実施態様では、末端標識は、核酸を提供し、標識化ヌクレオシドトリホスフェートを提供し、そしてターミナルトランスフェラーゼを用いてヌクレオシドトリホスフェートを核酸に付着させることにより成し遂げ得る。   (57) [Summary] The present invention provides a simple method for confirming differences in nucleic acid abundance (eg, expression level) between two or more samples. The method involves providing an array containing a large number (eg, 1,000 or more) of arbitrarily selected different oligonucleotide probes, wherein the sequence and location of each different probe is known. A nucleic acid sample (eg, mRNA) from two or more samples is hybridized to a probe array to detect a hybridization pattern. Differences in hybridization patterns between samples indicate differences in the expression of various genes between the samples. The present invention further provides a method for end-labeling a nucleic acid. In one embodiment, the method includes providing the nucleic acid, providing a labeled oligonucleotide, and then enzymatically ligating the oligonucleotide to the nucleic acid. Thus, for example, where the nucleic acid is RNA, the labeled oligonucleotide can be ligated using RNA ligase. In another embodiment, end labeling can be accomplished by providing the nucleic acid, providing a labeled nucleoside triphosphate, and attaching the nucleoside triphosphate to the nucleic acid using terminal transferase.

Description

【発明の詳細な説明】 核酸分析法 関連出願に対する引照 本発明は、1996年1月23日提出のU.S.S.N.60/010,47 1の一部継続であり、そして1997年1月9日提出の「Labeling of Nucleic Acids」に対する暫定特許出願(発明者:Lockhart、Cronin、Lee、Tran、Matsuz aki、McGall及びBarone)の一部継続である(これらの記載内容は、参照により 本明細書中に含まれる)。 発明の背景 本発明の開示内容の一部は、版権保護を受けるべき材料を含む。本版権所有者 は、特許及び商標事務所の特許ファイル又は記録に現れるまさしくその形態での 特許文書又は特許開示内容のいずれかによる電子写真式リダクションに対する異 議はないが、そうでない場合にはいかなる版権もすべて、保有する。 多数の疾病状態は、遺伝子DNAのコピー数の変化による、又は特定の遺伝子 の転写のレベルの変化による(例えば、イニシエーションの制御、RNA前駆体 の提供、RNAプロセッシング等)、種々の遺伝子の発現レベルの変化を特徴と する。例えば、遺伝物質の損失及び獲得は悪性形質転換及び進行に重要な役割を 演じる。これらの獲得及び損失は、少なくとも2種類の遺伝子により「駆動」さ れると考えられる。癌遺伝子は腫瘍形成の正の調節因子であるが、一方腫瘍抑制 遺伝子は腫瘍形成の負の調節因子である(Marshall,Cell,64:313-326(1991);W einberg,Science,254:1138-1146( 1991))。したがって、非調節性増殖の活性化の一つのメカニズムは、癌遺伝子 タンパク質をコードする遺伝子の数を増大すること又はこれらの癌遺伝子の発現 のレベルを増大すること(例えば、細胞又は環境の変化に対して)であり、別の メカニズムは遺伝物質を損失すること又は腫瘍抑制因子をコードする遺伝子の発 現レベルを低減することである。このモデルは、神経膠腫の進行に関連した遺伝 物質の損失及び獲得により支持される(Mikkelson et al.,J.Cell Biochem.4 6:3-8(1991))。したがって、特定の遺伝子(例えば腫瘍遺伝子又は腫瘍抑制 因子)の発現(転写)レベルの変化は、種々の癌の存在及び進行の道標として役 立つ。 同様に、細胞周期及び細胞発達の制御、並びに疾病は、特定遺伝子の転写レベ ルの変動を特徴とする。したがって、例えばウイルス感染はしばしば、特定ウイ ルスの遺伝子の発現の増大を特徴とする。例えば、単純ヘルペス、エプスタイン ーバーウイルス感染(例えば感染性単核球症)、サイトメガロウイルス、水痘− 帯状疱疹ウイルス感染、パルボウイスル感染、ヒト乳頭腫ウイルス感染等は、す べて、それぞれのウイルス中に存在する種々の遺伝子の発現の増大を特徴とする 。特徴的ウイルス遺伝子の発現レベル増大の検出は、疾病状態の有効な診断を提 供する。特に、単純ヘルペスのようなウイルスは静止期に入り、短期間の迅速な 複製中に出現するだけである。特徴的ウイルス遺伝子の発現レベルの増大は、こ のような活発な増殖(及びおそらくは感染)状態の検出を可能にする。 遺伝子発現をモニタリングする、又は定量するための「伝統的」ハイブリダイ ゼーションプロトコールの使用は問題である。例えばほぼ同一分子量の2つ又は それ以上の遺伝子産物は、それらが電気泳動法により容易に分離されないために 、ノーザンブロットで識別するのが難しいか又は不可能であることを立証する。 同様に、ハイ ブリダイゼーション効率及び交差反応性はプローブ中の遺伝子の特定サブ配列( 領域)に伴って変化するので、標的遺伝子に対する1つのプローブに関して、あ るいは2〜3つのプローブに関してさえ、正確且つ信頼できる測定値を得るのは 難しい。 VLSIPSTM技術の開発は、非常に小さな表面積を占める多数の異なるオリ ゴヌクレオチドプローブのアレイを合成するための方法を提供した(米国特許第 5,143,854号及びPCT特許公告WO90/15070参照)。米国特 許出願第082,937号(1993年6月25日提出)は、標的核酸の完全配 列を提供するために、そして特異的ヌクレオチド配列を含有する核酸の存在を検 出するために用い得るオリゴヌクレオチドプローブのアレイの作製方法を記載す る。 種々の遺伝子の発現における核酸存在量の差又は変化を測定する従来の方法( 例えば、示差的表示、SAGE、cDNAシーケンシング、クローンスポッティ ング等)は、適切な配列特異的プローブを設計するために、標的配列についての 仮定を、あるいはそれに関する事前の知識を要する。他の方法、例えば差引きハ イブリダイゼーションは事前の配列知識を要しないが、しかし示差的に発現され る核酸に関する配列情報を直接提供する訳ではない。 発明の要約 本発明は、一実施態様において、多数の予選択遺伝子の発現をモニタリングす る方法(本明細書中では「発現モニタリング」と呼ぶ)を提供する。別の実施態 様では、本発明は2つ又はそれ以上の核酸(例えばRNA又はDNA)試料の組 成の差を確認する方法を提供する。核酸存在量が試料が得られる生物学的試料中 の発現レベルを反映する場合、本発明は2つ又はそれ以上の試料間の発現プロフ ィールの差異を確認する方法を提供する。これらの「一般的差異スクリーニング 法」は、迅速で、適用が簡単で、発現が2試料間で異なる特定の配列に関する先 験的仮定を必要とせず、そして存在量が試料間で異なる核酸に関する直接的配列 情報を提供する。 一実施態様では、本発明は2つ又はそれ以上の核酸試料間の核酸レベルの差異 の確認方法を提供する。本方法は、(a)表面に付着したプローブオリゴヌクレ オチドを包含する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し;(b )上記の核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして、上 記の核酸試料中の核酸と上記の核酸又はそのサブ配列と相補的である上記の1つ 又はそれ以上のアレイ中の上記のプローブオリゴヌクレオチドとの間にハイブリ ッド二重鎖を形成し;(c)上記の1つ又はそれ以上のアレイを核酸リガーゼと 接触させ;そして(d)ハイブリダイゼーションの差異が上記の核酸レベルの差 異を示す上記の核酸試料間のハイブリダイゼーションの差異を確定する工程を包 含する。 別の実施態様では、2つ又はそれ以上の核酸試料間の核酸レベルの差異を確定 する方法は、以下の工程を包含する:(a)定常領域及び可変領域から成るプロ ーブオリゴヌクレオチドを包含する1つ又はそれ以上のオリゴヌクレオチドアレ イを提供し;(b)上記の核酸試料を上記の1つ又はそれ以上のアレイとハイブ リダイズして、上記の核酸試料中の核酸と上記の核酸又はそのサブ配列と相補的 である上記の可変領域との間にハイブリッド二重鎖を形成し;そして(c)ハイ ブリダイゼーションの差異が上記の核酸レベルの差異を示す上記の核酸試料間の ハイブリダイゼーションの差異を確定する。 さらに別の実施態様では、2つ又はそれ以上の核酸試料間の核酸レベルの差異 を確定する方法は、以下の工程を包含する:(a)1 つ又はそれ以上の高密度オリゴヌクレオチドアレイを提供し;(b)上記の核酸 試料を上記の1つ又はそれ以上のアレイとハイブリダイズして、上記の核酸試料 中の核酸と上記の核酸又はそのサブ配列と相補的である上記の1つ又はそれ以上 のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重鎖を形成し ;そして(c)ハイブリダイゼーションの差異が上記の核酸レベルの差異を示す 上記の核酸試料間のハイブリダイゼーションの差異を確定する。 さらに別の実施態様では、2つ又はそれ以上の核酸試料間の核酸レベルの差異 を確定する方法は、以下の工程を包含する:(a)特定予選択遺伝子又はmRN A由来の核酸とハイブリダイズするのに選択されないプローブオリゴヌクレオチ ドを各々包含する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し;(b )上記の核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして、上 記の核酸試料中の核酸と上記の核酸又はそのサブ配列と相補的である上記の1つ 又はそれ以上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二 重鎖を形成し;そして(d)ハイブリダイゼーションの差異が上記の核酸レベル の差異を示す上記の核酸試料間のハイブリダイゼーションの差異を確定する。 別の実施態様では、2つ又はそれ以上の核酸試料間の核酸レベルの差異を確定 する方法は、以下の工程を包含する:(a)無作為選択、偶発的選択、ヌクレオ チド組成偏向選択から成る群から選択される方法により選択されるヌクレオチド 配列又はサブ配列を包含するプローブオリゴヌクレオチド及び予選択長の考え得 るすべてのオリゴヌクレオチドを各々包含する1つ又はそれ以上のオリゴヌクレ オチドアレイを提供し;(b)上記の核酸試料を上記の1つ又はそれ以上のアレ イとハイブリダイズして、上記の核酸試料中の核酸と上記の核酸又はそのサブ配 列と相補的である上記の1つ又はそれ以 上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重鎖を形成 し;そして(c)ハイブリダイゼーションの差異が上記の核酸レベルの差異を示 す上記の核酸試料間のハイブリダイゼーションの差異を確定する。 別の実施態様では、2つ又はそれ以上の核酸試料間の核酸レベルの差異を確定 する方法は、以下の工程を包含する:(a)無作為選択、偶発的選択、ヌクレオ チド組成偏向選択から成る群から選択される方法により選択されるヌクレオチド 配列又はサブ配列を包含するプローブオリゴヌクレオチド及び予選択長の考え得 るすべてのオリゴヌクレオチドを各々包含する1つ又はそれ以上のオリゴヌクレ オチド配列を提供し;(b)上記のアレイ上のプローブオリゴヌクレオチドの位 置及び配列を記載するソフトウエアを提供し;(c)上記の核酸試料を上記の1 つ又はそれ以上のアレイとハイブリダイズして、上記の核酸試料中の核酸と上記 の核酸又はそのサブ配列と相補的である上記の1つ又はそれ以上のアレイ中のプ ローブオリゴヌクレオチドとの間にハイブリッド二重鎖を形成し;そして(d) 上記のハイブリダイジングが上記の核酸レベルの差異を示すように上記のソフト ウエアを操作する。 本発明はさらに、多数の遺伝子の発現を同時にモニタリングする方法を提供す る。一実施態様において、これらの方法は、(a)前記遺伝子の1又は複数のRN A転写物を含んで成る標的核酸、又は該RNA転写物に由来する核酸のプールを提供 し;(b)前記核酸のプールを表面に固定化したプローブオリゴヌクレオチドを 含んで成るオリゴヌクレオチドアレイにハイブリダイズせしめ;(c)前記オリ ゴヌクレオチドアレイをリガーゼと接触せしめ;そして(d)前記アレイへの前 記核酸のハイブリダイゼーションを定量し、ここでこの定量が前記遺伝子の転写 のレベルの測定値を提供する。 2以上の核酸サンプル間の核酸レベルの相違を同定するための他の実施態様は 、(a)予選択ヌクレオチド中で各対の成員が互いに異なるプローブオリゴヌク レオチドの対を各々包含する1つ又はそれ以上の対のオリゴヌクレオチドを提供 し;(b)上記の核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズ して、上記の核酸試料中の核酸と上記の核酸又はそのサブ配列と相補的である上 記の1つ又はそれ以上のアレイ中の上記のプローブオリゴヌクレオチドとの間に ハイブリッド二重鎖を形成し;(c)ハイブリダイゼーションの差異が上記の核 酸レベルの差異を示す上記の核酸試料間のハイブリダイゼーションの差異を確定 する工程を包含する。 多数の遺伝子の発現を同時にモニタリングする別の方法は、以下の工程を包含 する:(a)定常領域及び可変領域から成るプローブオリゴヌクレオチドを包含 する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し;(b)1つ又はそ れ以上の上記の遺伝子のRNA転写体を包含する標的核酸、又は上記のRNA転 写体由来の核酸のプールを提供し;(c)1つ又はそれ以上の核酸の上記のプー ルを表面上に固定されたオリゴヌクレオチドプローブのアレイとハイブリダイズ し;そして(d)上記の核酸と上記のハイブリダイゼーションを定量するが、こ の場合、定量は上記の遺伝子の転写のレベルの測定を提供する。 本発明はさらに、2つ又はそれ以上の核酸試料間の核酸レベルの差異を確認す るための核酸アレイの作製方法を提供する。一実施態様では、本方法は以下の工 程を包含する:(a)定常領域及び可変領域から成るプローブオリゴヌクレオチ ドを包含するオリゴヌクレオチドアレイを提供し;(b)1つ又はそれ以上の上 記の核酸試料を上記のアレイとハイブリダイズして上記の可変領域と、上記の可 変領域と相補的なサブ配列を包含する上記の核酸試料中の核酸との ハイブリッド二重鎖を形成し;(c)上記のハイブリッド二重鎖を包含する試料 核酸を上記のプローブオリゴヌクレオチドアレイに付着させ;そして(d)非付 着核酸を除去して上記のアレイに付着した試料核酸を保有する高密度オリゴヌク レオチドアレイを提供する。 別の実施態様では、2つ又はそれ以上の核酸試料間の核酸レベルの差異を確認 するための核酸アレイの作製方法は、以下の工程を包含する:(a)高密度アレ イを提供し;(b)上記のアレイを上記の2つ又はそれ以上の核酸試料の1つ又 はそれ以上のと接触させ、それにより上記の2つ又はそれ以上の核酸試料の1つ の核酸が上記のアレイのプローブオリゴヌクレオチドとハイブリッド二重鎖を形 成し;(c)上記のハイブリッド二重鎖を包含する試料核酸を上記のプローブオ リゴヌクレオチドアレイに付着させ;そして(d)非付着核酸を除去して上記の アレイに付着した試料核酸を保有する高密度オリゴヌクレオチドアレイを提供す る。 本発明はさらに、本明細書中に記載した方法の実行のためのキットを提供する 。一キットは、表面に付着したプローブオリゴヌクレオチドを包含する1つ又は それ以上のオリゴヌクレオチドアレイを含入する容器、及びリガーゼを含有する 容器を包含する。別のキットは、定常領域及び可変領域から成るプローブオリゴ ヌクレオチドを包含する1つ又はそれ以上のオリゴヌクレオチドアレイを含有す る容器を包含する。このキットは、上記の定常領域又はそのサブ配列と相補的な 定常オリゴヌクレオチドを任意に含む。 本発明の好ましい高密度オリゴヌクレオチドアレイは、100以上の異なるプ ローブオリゴヌクレオチドを包含する。この場合、各々の異なるプローブオリゴ ヌクレオチドは、アレイの予定領域に局在する。各々の異なるプローブオリゴヌ クレオチドは末端共有結合 を介して表面に付着する。そして上記の異なるプローブオリゴヌクレオチドの密 度は1cm2当たり約60以上の異なるオリゴヌクレオチドである。高密度アレイ は、本明細書中に記載されたアレイベースの方法のすべてに用い得る。発現モニ タリングに用いられる高密度アレイは、典型的には1つ又はそれ以上の予選択遺 伝子由来の核酸と相補的であるよう選択されるオリゴヌクレオチドプローブを含 む。これに対比して、一般的差スクリーニングアレイは、無作為に、偶発的に、 恣意的に選択されるプローブオリゴヌクレオチドを含有し得るか、又は特定(予 選択)長の考え得るすべての核酸配列を包含する配列又はサブ配列を含む。 好ましい実施態様では、特定長の考え得るすべての核酸を包含するオリゴヌク レオチド又はオリゴヌクレオチドサブ配列のプールは、考え得るすべての6me rs、考え得るすべての7mers、考え得るすべての8mers、考え得るす べての9mers、考え得るすべての10mers、考え得るすべての11me rs及び考え得るすべての12mersから成る群から選択される。 本発明はさらに、核酸の標識方法を提供する。一実施態様では、本方法は以下 の工程を包含する:(a)核酸を提供し;(b)上記の核酸を増幅してアンプリ コンを形成し;(c)上記のアンプリコンを断片化して上記のアンプリコンの断 片を形成し;そして(d)標識部分を少なくとも1つの上記の断片と結合させる 。 別の実施態様では、本方法は以下の工程を包含する:(a)核酸を提供し;( b)上記の核酸を転写して転写核酸を形成し;(c)上記の転写核酸を断片化し て上記の転写核酸の断片を形成し;そして(d)標識部分を少なくとも1つの上 記の断片と結合させる。 さらに別の実施態様では、本方法は以下の工程を包含する:(a)支持体と結 合する少なくとも1つの核酸を提供し;(b)上記の 核酸とターミナルトランスフェラーゼで結合され得る標識部分を提供し;(c) 上記のターミナルトランスフェラーゼを提供し;そして(d)上記のターミナル トランスフェラーゼを用いて上記の標識部分を上記の核酸と結合させる。 さらに別の実施態様では、本方法は以下の工程を包含する:(a)支持体と結 合する少なくとも2つの核酸を提供し;(b)上記の核酸のモノマー単位の数を 増大して前記少なくとも2つの核酸上に共通の核酸テイルを形成し;(c)上記 の共通核酸尾部を認識し得る標識部分を提供し;そして(d)上記の共通核酸尾 部及び上記の標識部分を接触させる。 さらに別の実施態様では、(a)支持体と結合する少なくとも1つの核酸を提 供し;(b)上記の核酸にリガーゼを用いて結合され得る標識部分を提供し;( c)上記のリガーゼを提供し;そして(d)上記の標識部分をリガーゼを用いて 上記の核酸部分に結合させる。 本発明はさらに、本明細書中に記載される式の化合物を提供する。定義 本明細書中で用いる場合、オリゴヌクレオチドのアレイとは、1つ又はそれ以 上の固体支持体に(好ましくは単一末端共有結合を介して)結合される多数の異 なる(連続)オリゴヌクレオチドを示すが、ここで、多数の支持体が存在する場 合には、各々の支持体は複数のオリゴヌクレオチドを保有する。「アレイ」とい う用語は、支持体(単数又は複数)上のオリゴヌクレオチドの全集合又はその部 分集合を示す。「同一アレイ」という用語は、2つ又はそれ以上のアレイを指す ために用いられる場合、実質的に同一の存在量でそこ に同一オリゴヌクレオチド種を有するアレイを意味するよう用いられる。オリゴ ヌクレオチド種の空間的分布は2つのアレイ間で異なるが、しかし好ましい実施 態様では、それは実質的に同一である。2つのアレイが同一であるよう設計され 、合成される場合でさえ、オリゴヌクレオチドプローブの存在量、組成及び分布 の変動が認められる、と認識される。これらの変動は、好ましくは、かすかであ るかおよび/または本明細書中に記載されているような対照の使用により補償さ れる。 「大量平行スクリーニング」という語句は、少なくとも約100、好ましくは 約1000、さらに好ましくは約10,000、そして最も好ましくは約1,0 00,000の異なる核酸ハイブリダイゼーションの同時スクリーニングを示す 。 「核酸」又は「核酸分子」という用語は、一本鎖又は二本鎖形態のデオキシリ ボヌクレオチド又はリボヌクレオチドポリマーを示し、別記しない限り、天然ヌ クレオチドと同様に機能し得る天然ヌクレオチドの公知の類似体を包含する。 オリゴヌクレオチドは、約2〜約1000ヌクレオチド、さらに典型的には約 2〜約500ヌクレオチドの長さの範囲の一本鎖核酸である。 本明細書中で用いる場合、「プローブ」は1つ又はそれ以上の型の化学結合に より、通常は相補的塩基対合により、通常は水素結合形成により相補的配列の標 的核酸と結合し得るオリゴヌクレオチド、と定義される。本明細書中で用いる場 合、オリゴヌクレオチドプローブは、天然塩基(即ちA、G、C又はT)又は修 飾塩基(7−デアザグアノシン、イノシン等)を包含し得る。さらに、オリゴヌ クレオチドプローブ中の塩基は、ハイブリダイゼーションを妨げない限り、ホス ホジエステル結合以外の結合により連結される。した がって、オリゴヌクレオチドプローブは、構成塩基がホスホジエステル結合より むしろペプチド結合により連結されるペプチド核酸である。 「標的核酸」という用語は、オリゴヌクレオチドプローブが特異的にハイブリ ダイズする核酸(しばしば生物学的試料に由来し、したがって試料核酸とも呼ば れる)を示す。標的核酸は本質的に核酸のあらゆる供給源(例えば化学合成、増 幅反応、法試料等が挙げられるが、これらに限定されない)から得られる、と認 識される。それは、検出されるべき1つ又はそれ以上の標的核酸の存在又は非存 在であるか、あるいは定量されるべき1つ又はそれ以上の標的核酸の量である。 検出される標的核酸は、それらが特異的に結合する(ハイブリダイズする)対応 するプローブ(単数又は複数)の核酸配列と相補的であるヌクレオチド配列を優 先的に有する。標的核酸という用語は、プローブが特異的にハイブリダイズする 大型核酸の特異的サブ配列を、あるいは存在量(濃度)および/または発現レベ ルを検出するのが望ましい全配列(例えば遺伝子又はmRNA)を示す。 「連結可能オリゴヌクレオチド」又は「連結可能プローブ」又は「連結可能オ リゴヌクレオチドプローブ」とは、リガーゼ(例えばT4DNAリガーゼ)の使 用により別のオリゴヌクレオチドに連結され得るオリゴヌクレオチドを示す。連 結可能オリゴヌクレオチドは、好ましくはデオキシリボヌクレオチドである。連 結可能オリゴヌクレオチドを包含するヌクレオチドは、好ましくは「標準」ヌク レオチド;A、G、C及びT又はUである。しかしながら、誘導、修飾又は代替 ヌクレオチド(例えばイノシン)は、その存在が連結反応を妨げない限りは、存 在し得る。連結可能プローブは、標識が連結反応を妨害しない限り、標識される か、そうでなければ修飾さ れ得る。同様に、ヌクレオチド間結合は、修飾が連結を妨害しない限り、修飾さ れる。したがって、いくつかの場合には、連結可能オリゴヌクレオチドはペプチ ド核酸である。 「サブ配列」とは、核酸の長い配列の一部を包含する核酸の配列を示す。 「ゆらぎ」(wobble)とは、オリゴヌクレオチド中の特定位置での縮重を指す 。完全縮重又は「4方向」ゆらぎとは、核酸の集合(例えば、ゆらぎ位置でDN Aに関してはA、G、C又はT、RNAに関してはA、G、C又はUを有するオ リゴヌクレオチドプローブ)を示す。ゆらぎは、ヌクレオチドを、A、G、Cあ るいはT又はUを有する塩基対であるイノシンと置換することにより近似する。 典型的には、オリゴヌクレオチドの化学合成中に生じる完全縮重ゆらぎを含有す るオリゴヌクレオチドは、ゆらぎが導入される特定結合段階で4つの異なるヌク レオチドモノマーの混合物を用いることにより調製される。 「架橋」という用語は、架橋核酸に関して用いられる場合、相補的核酸配列を 変性するために用いられる典型的条件下で分離されないよう核酸を付着させるこ とを示す。架橋は、好ましくは核酸間の共有結合の形成を包含する。核酸を架橋 する方法は、本明細書中に示されている。 「支持体に結合される」という語句は、共有結合、水素結合、イオン相互作用 、疎水性相互作用又はその他の方法による付着を含めて、直接的又は間接的にそ こに結合されることを意味する。 「アンプリコン」は、PCR又はその他の方法による核酸の増幅の産物である 。 「核酸を転写する」とは、デオキシリボ核酸からリボ核酸の生成、そしてその 逆(リボ核酸からデオキシリボ核酸の生成)を意味す る。核酸は、DNA依存性RNAポリメラーゼ、逆転写酵素又はその他の方法に より転写される。 標識部分とは、本明細書中に記載した又は当業界で公知の種々の方法により検 出され得る部分を意味する。 「複雑性」という用語は、Britten et al.,Methods of Enzymol.29:363(19 74)により確定されたようなこの用語の標準的意味に従って、本明細書中で用い られ(核酸複雑性のさらなる説明に関しては、Cantor and Schimmel Biophysica l Chemistry:Part III,1228-1230も参照)。 「実質的に結合する」とは、プローブ核酸と標的核酸との間の相補的ハイブリ ダイゼーションを示し、標的ポリヌクレオチド配列の所望の検出を達成するため にハイブリダイゼーション培地の緊縮性を低減することにより適応され得る小ミ スマッチを包含する。 「〜との特異的ハイブリダイズ」という語句は、特定のヌクレオチド配列が複 合混合物(例えば全細胞性)DNA又はRNA中に存在する場合に緊縮条件下で その配列と優先的にある分子が結合、二重鎖化又はハイブリダイズすることを示 す。 「緊縮条件」という用語は、プローブがその標的サブ配列と優先的にハイブリ ダイズし、他の配列とは少ししか、又は全くハイブリダイズしない条件を示す。 緊縮条件は配列依存性であり、異なる環境では異なる。配列が長いほどより高温 で特異的にハイブリダイズする。一般に、緊縮条件は、限定イオン強度及びpH での特異的配列に関する融点(Tm)より約5℃低いように選択される。Tmは、 標的配列と相補的なプローブの50%が平衡状態(標的配列は一般に余分に存在 するので、Tmでは、プローブの50%は平衡状態で占められる)で標的配列と ハイブリダイズする温度である(限定イオン強度、pH及び核酸濃度下)。典型 的には、緊縮条件は、p H7.0〜8.3で塩濃度が少なくとも約0.01〜1.0M Naイオン濃度( 又はその他の塩)であり、温度は短いプローブ(例えば10〜50ヌクレオチド )に関しては少なくとも約30℃である。緊縮条件はさらに、脱安定化剤、例え ばホルムアミドの付加により達成され得る。 「完全マッチプローブ」という用語は、特定の標的配列と完全に相補的である 配列を有するプローブを示す。被験プローブは、典型的には標的配列の一部(サ ブ配列)と完全に相補的である。完全マッチ(PM)プローブは、「被験プロー ブ」、「正規化対照」プローブ、発現レベル対照プローブ等である。しかしなが ら、完全マッチ対照又は完全マッチプローブは、「ミスマッチ対照」又は「ミス マッチプローブ」と識別される。発現モニタリングアレイの場合には、完全マッ チプローブは典型的には、標的核酸の特定の配列又はサブ配列(例えば、特定遺 伝子)と相捕的であるように予選択(設計)される。これに対比して、一般的差 異スクリーニングアレイでは、特定標的配列は、典型的には公知でない。後者の 場合、完全マッチプローブは予選択されない。この情況での完全マッチプローブ という用語は、下記のような1つ又はそれ以上の特定の予選択ヌクレオチドにお ける完全マッチとは異なる対応する「ミスマッチ対照」からのプローブを識別す るためである。 「ミスマッチ対照」又は「ミスマッチプローブ」という用語は、発現モニタリ ングアレイでは、配列が特定の標的配列と完全に相補的でないよう慎重に選択さ れるプローブを示す。高密度アレイ中の各々のミスマッチ(MM)対照に関して は、好ましくは、同一特定標的配列と完全に相補的である対応する完全マッチ( PM)プローブが好ましくは存在する。「一般的」(generic)(例えば無作為、 恣意的、偶発的等)アレイでは、標的核酸(単数又は複数)は公知 でないため、完全マッチ及びミスマッチプローブは先験的に確定、設計又は選択 できない。この場合、プローブは好ましくは対として提供され、この場合、プロ ーブの各対は1つ又はそれ以上の予選択ヌクレオチドが異なる。したがって、対 のプローブのどれが完全マッチであるかは先験的には公知でないが、一方のプロ ーブは特定の標的配列と特異的にハイブリダイズし、対の他方のプローブは標的 配列に関してはミスマッチ対照として作用する。完全マッチ及びミスマッチプロ ーブは対として提供される必要はないが、しかし特定予選択ヌクレオチド中で互 いに異なるプローブの大きい方の集合(例えば、3、4、5又はそれ以上)とし て提供されると思われる。ミスマッチ(単数又は複数)はミスマッチプローブの どこにでも位置し得るが、末端ミスマッチは、それが標的配列のハイブリダイゼ ーションを妨害するとはあまり考えられないので、それほど望ましくない。特に 好ましい実施態様では、ミスマッチは試験ハイブリダイゼーション条件下では標 的配列との二重鎖を最も脱安定化すると思われるので、ミスマッチはプローブの 中心又はその近くに位置する。特に好ましい実施態様では、完全マッチは単一の 中心に位置するヌクレオチドにおいてはミスマッチ対照と異なる。 「バックグラウンド」又は「バックグラウンドシグナル強度」という用語は、 標識標的核酸とオリゴヌクレオチドアレイの成分(例えば、オリゴヌクレオチド プローブ、対照プローブ、アレイ基質等)との間の非特異的結合又はその他の相 互作用に起因するハイブリダイゼーションシグナルを示す。バックグラウンドシ グナルは、アレイ成分それ自体の固有の蛍光によっても生成される。単一バック グラウンドシグナルが全アレイに関して算出されるか、あるいは異なるバックグ ラウンドシグナルがアレイの各々の領域に関して算出される。好ましい実施態様 では、バックグラウンドはアレイ又はア レイの領域中の最低1%〜10%のプローブに関する平均ハイブリダイゼーショ ンシグナル強度として算出される。発現モニタリングアレイ(即ち、ここではプ ローブは特異的核酸(遺伝子)とハイブリダイズするよう予選択される)では、 異なるバックグラウンドシグナルが各々の標的核酸に関して算出される。異なる バックグラウンドシグナルが各標的遺伝子に関して算出される場合、バックグラ ウンドシグナルは各遺伝子の最低1%〜10%のプローブに関して算出される。 もちろん、当業者は、プローブが特定の遺伝子と十分ハイブリダイズし、したが って標的配列と特異的に結合していると思われる場合、それらはバックグラウン ドシグナル算出に用いられるべきでないと考える。あるいは、バックグラウンド は、試料中に見出されるいかなる配列とも相補的でないプローブ(例えば、反対 センスの核酸又は試料中に見出されない遺伝子、例えば試料が哺乳類起源のもの である場合には細菌遺伝子に向けられるプローブ)とのハイブリダイゼーション により生じる平均ハイブリダイゼーションシグナル強度として算出される。バッ クグラウンドはさらに、いかなるプローブをも欠いたアレイの領域により生成さ れる平均シグナル強度として算出される。 「定量する」という用語は、核酸の存在量又は濃度(例えば、遺伝子の転写レ ベル)を定量する情況で用いられる場合、絶対又は相対定量化を示す。絶対定量 化は、公知濃度の1つ又はそれ以上の標的核酸(例えば対照核酸、例えばBio B又は公知量での標的核酸それ自体)を含入し、そして非公知物のハイブリダイ ゼーション強度を公知の標的核酸に照会することにより(例えば、標準曲線の生 成により)、成し遂げられる。あるいは、相対定量化は、2つ又はそれ以上の遺 伝子間、あるいは2つ又はそれ以上の処理間のハイブリダイゼーションシグナル を比較して、ハイブリダイゼーション強 度の変化を、そして含蓄的に転写レベルを定量することにより成し遂げられる。 「配列同一性のパーセンテージ」又は「配列同一性」は、比較ウインドウ又は スパン上の2つの最適に一直線に並べられた配列又はサブ配列を比較することに より確定されるが、この場合、比較ウインドウ内のポリヌクレオチド配列の一部 は、2つの配列の最適整列のために参照配列(付加又は欠失を包含しない)と比 較した場合、任意に付加又は欠失(例えばギャップ)を包含し得る。パーセンテ ージは、同一サブユニット(例えば核酸塩基又はアミノ酸残基)が両方の配列に 生じてマッチ位置数を生じ、マッチ位置数を比較のウインドウ内の位置の総数で 割り、その結果に100を掛けて、配列同一性のパーセンテージを出す。配列同 一性パーセンテージは、プログラムGAP又はBESTFIT(下記参照)を用 いて算出する場合、デフォルトギャップ重量を用いて算出される。 比較のために配列を一直線に並べる方法は、当業界では十分公知である。比較 のための配列の最適整列は、スミスとウォーターマン(Smith and Waterman,Ad v.Appl.Math.,2:482(1981))の局所的相同性算法により、ニードルマンと ウンシュ(Needleman and Wunsch,J.Mol.Biol.,48:443(1970))の相同性 整列算法により、ピアソンとリップマン(Pearson and Lipman,Proc.Natl.Ac ad.Sci.USA 85:2444(1988))の同様の方法に関する吟味により、これらの算 法のコンピューター処理実行(Intelligenetics,Mountain View,Californiaに よるPC/GeneプログラムでのCLUSTAL、Wisconsin Genetics Softw are Package,Genetics Computer Group(GCG),575 Science Dr.,Madison,Wi sconsin,USAでのGAP、BESTFIT、FASTA及びTFASTA等が挙 げられるが、これらに限定されない)により、あるいは検閲によ り実施し得る。特に、CLUSTALプログラムを用いて配列を整列するための 方法は、Higgins and Sharp,(Gene,73:237-244(1988)及びCABIOS 5:151-153 (1989))により十分説明されている。図面の簡単な説明 図1は、オリゴヌクレオチドアレイを用いた発現モニタリングの略図を示す。 抽出ポリ(A)+RNAをcDNAに変換し、次にこれを標識リボヌクレオチド トリホスフェートの存在下で転写する。Lは、ビオチン又は染料、例えばフルオ レセインである。RNAを、マグネシウムイオンの存在下で加熱して断片化する 。二次元DNAプローブアレイを含有する流動細胞中でハイブリダイゼーション を実行する。非ハイブリダイズ化RNAを除去するための短時間の洗浄工程後、 走査共焦点顕微鏡を用いてアレイを走査する。cDNA中間体を用いずに細胞性 mRNAが直接標識される代替物が、実施例に記載されている。画像分析ソフト ウエアは、走査アレイ画像を試験フィルムに変換するが、この場合、特異的物理 的位置での観察強度は特定のプローブアレイに関連する。 図2Aは、16,000以上の異なるオリゴヌクレオチドプローブを含有する 高密度アレイの蛍光画像を示す。本画像は、ネズミB細胞(T10)cDNAラ イブラリーから転写され、13の特異的RNA標的と1:3,000(約100 コピー/細胞と等価の50pM)のレベルでスパイクされるビオチン標識無作為 断片化センスRNAのハイブリダイゼーション(40℃で15時間)後に得られ た。任意の位置での輝きは、特定のオリゴヌクレオチドプローブとハイブリダイ ズされた標識RNAの量を示す。図2Bは、IL−2及びIL−3RNAに対す るプローブを含有する小部分のアレイ(図2Aの矩形領域)を示す。比較のため に、図2Cは、非スパイク 化T10RNA試料(T10細胞はIL−2及びIL−3を発現しない)を用い たハイブリダイゼーション後のアレイの同一領域を示す。シグナル強度の変動は 高度に再現可能で、ハイブリダイゼーション効率の配列依存性を反映した。アレ イの中心十字及び四隅は、一定濃度(50pM)でハイブリダイゼーション溶液 に付加されたビオチン標識オリゴヌクレオチドと相補的である対照配列を含有す る。図の境界付近の画像の鮮明度は、読み取り装置の解像度(11.25μm) により限定され、アレイ合成の空間的解像度にはよらなかった。各合成図の縁領 域のピクセルは、画像の定量的分析においては故意に無視した。 図3は、11の異なるRNA標的に関するハイブリダイゼーション強度(各遺 伝子に関するPM−MM強度差の平均)対濃度の対数/対数プロットを提示する 。このハイブリダイゼーションシグナルは標的濃度に定量的に関連していた。実 験は、本明細書の実施例及び図2に説明されているように実施した。10サイト カインRNA(+bioB)を、1:300,000〜1:3000の範囲のレ ベルで標識T10RNA中にスパイクした。シグナルは、1:300の頻度まで 濃度の上昇と共に増加し続けたが、しかし反応は、プローブ部位の飽和のために 、高レベルで直線下になった。直線範囲は、短時間のハイブリダイゼーションを 用いることにより、高濃度にまで拡張し得る。T10細胞中で発現される遺伝子 からのRNA(IL−10、β−アクチン及びGAPDH)はさらに、cDNA ライブラリーをプローブすることにより得られた結果と一致するレベルで検出さ れた。 図4は、PMA及びカルシウムイオノフォアで刺激後の種々の時間でのネズミ 2D6Tヘルパー細胞中のサイトカインmRNAレベルを示す。刺激後0、2、 6及び24時間目にポリ(A)+RNA を抽出し、RNAポリメラーゼプロモーターを含有する二重鎖cDNAに変換し た。次に、cDNAプールをビオチン標識リボヌクレオチドトリホスフェートの 存在下で転写し、断片化して、2及び22時間、オリゴヌクレオチドプローブア レイとハイブリダイズした。ハイブリダイゼーション前に公知量で試料中にスパ イクされた細菌RNA(ビオチンシンセターゼ)に関して得られたシグナルを用 いて比較することにより、蛍光強度をRNA度数に変換した。50,000のシ グナルは、約1:100,000〜1:5,000の度数に対応し、100のシ グナルは1:50,000の度数に対応する。IL−2、IL−4、IL−6及 びIL−12p40に関するRNAは、これらの実験においては約1:200, 000のレベルより上では検出されなかった。誤差バーは、異なる時点での同一 RNAに関するレベルに対する既定RNAに関するレベルでの概算不確定性(2 5パーセント)を反映する。相対不確定性概算は、反復スパイク実験の結果を、 そしてT10及び2D6細胞(未刺激化)の両方からの標本中のIL−10、β −アクチン及びGAPDH RNAの反復測定を基礎にした。絶対度数の不確定 性は、ハイブリダイゼーション効率におけるメッセージ対メッセージ差、並びに mRNA単離、cDNA合成、並びにRNA合成及び標識工程での差異を含む。 絶対度数の不確定性は、3つのうちの1因子であると概算される。 図5は、118の遺伝子に対する63,000以上の異なるオリゴヌクレオチ ドプローブを含有するアレイの蛍光画像を示す。標識ネズミB細胞RNA試料を 一夜ハイブリダイゼーション後に、画像を得た。各々の四角の合成領域は50x 50μmで、特異的オリゴヌクレオチドの107〜108個のコピーを含有する 。約15分で、7.5μmの解像度でアレイを走査した。明るい行は、高レベル で存在するRNAを示す。低レベルRNAは、ハイブリダイゼーションパターン の定量的評価を基礎にして、疑いの余地なく検出された。約1:300,000 〜1:100の範囲のレベルで。計21のネズミRNAを検出した。中心の十字 、隅のチェックボード及び上部のMUR−1領域は、全試料に付加された標識対 照オリゴヌクレオチドと相補的なプローブを含有する。 図6は、本発明の実施態様のソフトウエアを実行するために用いられるコンピ ューターシステムの例を示す。 図7は、本発明の実施態様のソフトウエアを実行するために用いられる典型的 コンピューターシステムのシステムブロック図を示す。 図8は、完全マッチ及びミスマッチプローブの対のハイブリダイゼーション強 度を比較することにより遺伝子の発現をモニタリングする工程の高レベルフロー を示す。 図9は、デシジョンマトリックスを用いて遺伝子が発現されるか否かを確定す る工程のフローを示す。 図10A及び10Bは、ベースライン走査データと実験走査データを比較する ことにより遺伝子の発現を確定する工程のフローを示す。 図11は、プローブの数が低減又は削減された後に遺伝子の発現をモニタリン グするためにプローブの数を増大する工程のフローを示す。 図12a及び12bは、プローブオリゴヌクレオチド/連結反応系を説明する 。図12は一般に、プローブオリゴヌクレオチド/連結反応系の種々の構成成分 を説明する。図12bは、プローブオリゴヌクレオチド/連結反応系を用いた非 完全相補的標的:オリゴヌクレオチドハイブリッドの識別を説明する。 図13a、13b、13c及び13dは、連結/ハイブリダイゼーション反応 の種々の構成成分を説明し、種々の連結戦略を説明する。図13aは、そのいく つかが種々の実施態様において任意である連結/ハイブリダイゼーション反応の 種々の構成成分を説明する。図13bは、プローブオリゴヌクレオチドの末端の ミスマッチを識別する連結戦略を説明する。図13cは、試料オリゴヌクレオチ ドの末端のミスマッチを識別する連結戦略を説明する。図13dは、プローブ末 端と試料末端の両方での識別を改良するための方法を説明する。 図14a、14b、14c及び14dは、試料核酸の制限消化と一緒に用いら れる連結識別を説明する。図14aは、SacI(6カッター)及びHsp92 II(4カッター)の認識部位及び切断パターンを示す。図14bは、(標的) 核酸試料に及ぼすSacI切断の作用を説明する。図14cは、SacI及びS phIで消化され、5’Cを有する〜1kbゲノム断片を生じる6Mbゲノム( 即ち大腸菌)を説明する。図14dは、これらの断片の一般的差異スクリーニン グチップとのハイブリダイゼーション/連結、並びに適切な核酸とハイブリダイ ズするためのプローブとしてのそれらのサブ配列の使用(フォーマットI)を、 あるいは断片が標識され、オリゴヌクレオチドアレイとハイブリダイズ/連結さ れ、そして直接分析される(フォーマットII)ことを説明する。 図15a、15b、15c、15d及び15eは、一般的差異スクリーニング アレイ上の示差的表示DNA断片の分析を説明する。図15aは、アンカー化ポ リ(T)プライマーを用いたポリ(a)mRNAの逆転写による一次鎖cDNA 合成を示す。図15bは、3’末端の工学処理制限部位及び縮重塩基(N−A、 G、C、T)を含有するPCR反応のための上流プライマーを説明する。図15 cは、一次cDNAの無作為プライム化PCRを示す。図15dはPCR産物の 制限消化を示し、図15eは、その5’末端による一般的連結アレイ上のPCR 産物の分類を示す。 図16a、16b及び16cは、試料1及び試料2核酸に対する複製1及び複 製2間の差を説明する。図16aは、正常細胞株である試料1に関する複製1及 び複製2間の差を示す。図16bは、試料2(腫瘍細胞株)に関する複製1及び 複製2間の差を示す。図16cは、2つの複製を平均した試料1及び2間の差を プロットする。 図17a、17b及び17cは、濾過された図16A、16b及び16cのデ ータを説明する。図17aは、各オリゴヌクレオチド対の差に関する試料1の複 製1及び2のハイブリダイゼーション強度の相対変化を示す。図17bは、図1 7Aと同様の方法で正規化し、濾過し、そしてプロットした各オリゴヌクレオチ ド対の差に関する試料2の複製1及び2の比を示す。図17cは、各オリゴヌク レオチド対の差に関して2つの複製を平均した試料1及び試料2の比を示す。比 率は図17Aと同様に算出するが、しかし図16cの場合と同様に、正規化後の [(X21k1+X22k2)/2]/[(X11k1+X12k2)/2]及び[(X11k1+X12k2 )/2]/[(X21k1+X22k2)/2]の絶対値を基礎にした。 図18は、CIAP処理を用いた断片化後標識を説明する。 図19は、高密度オリゴヌクレオチドアレイ上のハイブリダイゼーション後末 端標識の略図を提示する。 図20は、ハイブリダイゼーション及び末端標識前に高密度アレイの予備反応 を用いる末端標識の略図を提示する。 図21は、ハイブリダイゼーション後TdTアーゼ末端標識呼正確度の測定の 結果を説明する。 図22は、高密度オリゴヌクレオチドアレイ上のオリゴdT標識を説明する。 図23は、本明細書中に開示した方法に用いるのに適した種々の標識試薬を説 明する。図23aは、種々の標識試薬を示す。図23bは、さらに他の標識試薬 を示す。図23cは、非リボース又は非−2’−デオキシリボース含有標識を示 す。図23dは、糖修飾ヌクレオチド類似体標識23dを示す。 図24は、1組の一般的n−merタイルプローブを用いた標的DNA分子の 再シーケンシングを説明する。 図25は、4−mer一般的アレイ上に存在する4つのタイルアレイを説明す る。 図26は、標的の第8位置での塩基呼出を説明する。 図27は、塩基得票表を説明する。 図28は、正確度スコア変換をHIVデータに適用する効果を説明する。 図29は、強度比較による突然変異検出を説明する。 図30は、HIVゲノム中の突然変異のバブル形成検出を説明する。 図31は、誘導差異最近傍プローブスコアリングを説明する。 図32は、一般的連結GeneChipTM及び誘導差異分析を用いてHIV PCR標的(B)中に見出される突然変異を説明する。 図33は、参照標的と試料標的との間の比較を用いる突然変異検出を説明する 。詳細な説明 I.発現モニタリング及び一般的差異スクリーニング 本発明は、発現モニタリング及び一般的差異スクリーニングの方法を提供する 。発現モニタリングという用語は、特定の、典型的には予め選択された遺伝子の 発現のレベルの確定を示すために用いられる。好ましい実施態様では、本発明の 発現モニタリング法は、発現レベルが検出される単数又は複数の遺伝子の予定サ ブ配列と相補的であるよう選択されるオリゴヌクレオチドの高密度アレイを用い る。核酸試料は、そのアレイとハイブリダイズされ、その結果生じるハイブリダ イゼーションシグナルは当該する各遺伝子の発現のレベルの指標を提供する。高 度のプローブ重複性(典型的には遺伝子当たり多数のプローブが存在する)のた めに、発現モニタリング法は本質的に正確な絶対測定値を提供し、参照核酸との 比較を必要としない。 別の実施態様では、本発明は2つ又はそれ以上の核酸試料中の特定の核酸の存 在量(濃度)の差を確認する一般的差異スクリーニング法を提供する。一般的差 異スクリーニング法は、2つ又はそれ以上の核酸試料を同一アレイ高密度オリゴ ヌクレオチドアレイと、又は同一オリゴヌクレオチドプローブ組成を、そして任 意に同一オリゴヌクレオチド空間分布を有する異なる高密度オリゴヌクレオチド アレイとハイブリダイズすることを包含する。その結果生じるハイブリダイゼー ションを次に比較して、核酸が2つ又はそれ以上の試料間で存在量(濃度)が異 なることを確定させる。 試料を包含する核酸の濃度が核酸が得られる試料中の遺伝子の転写レベルを反 映する場合、一般的差異スクリーニング法は、2つ又はそれ以上の試料を包含す る核酸の転写における(そして含蓄的に発現における)差異の確認を可能にする 。このように確認された示差的に(例えば過剰又は過小)発現核酸は、発現レベ ルが2つ又はそれ以上の試料間で異なる遺伝子を確定および/または単離するた めに用い得る。 一般的差異スクリーニング法は、発現モニタリング法に対比して、アレイのプ ローブオリゴヌクレオチド組成についての先験的仮定を必要としない点で有益で ある。それとは反対に、プローブオリゴヌクレオチドの配列は、オリゴヌクレオ チドプローブの無作為、偶発的又はあらゆる恣意的部分集合である。オリゴヌク レオチドプローブが十分短い(例えば12mer以下)場合、アレイはその長さ の考え得るすべての核酸を含有する。一般的差異スクリーニングアレイが恣意的 又は無作為的であるという事実にも拘わらず、アレイ中の各プローブの配列が公 知であるため、一般的差異スクリーニング法は依然として試料中の示差的発現核 酸に関する直接配列情報を提供する。 本発明の発現モニタリング及び一般的差異スクリーニング法は、多数の(例え ば1,000以上)恣意的に選択された異なるオリゴヌクレオチドプローブ(プ ローブオリゴヌクレオチド)を含有するアレイを提供することを包含するが、こ の場合、各々の異なるプローブのアレイ中の配列及び位置は公知である。核酸試 料(例えばmRNA)はプローブアレイとハイブリダイズされ、ハイブリダイゼ ーションのパターンが検出される。 高密度オリゴヌクレオチドプローブアレイを用いるハイブリダイゼーションは 、複合核酸集団中の特定の核酸の発現を検出および/または定量する有効な手段 を提供することが、本明細書中及び同時係属出願米国特許第08/529,11 5号(1995年9月15日提出)及びPCT/US96/14839に示され ている。本発明の発現モニタリング及び差異スクリーニング法は、疾病の検出、 2つの試料(例えば病理学的試料と健常試料の比較)間の示差的遺伝子発現の確 認、特定遺伝子の発現をアップレギュレート又はダウ ンレギュレートする組成物に関するスクリーニング等を含めた広範囲の環境に用 い得る。 好ましい一実施態様では、本発明の方法を用いて、発現が疾病状態で変わる核 酸の発現(転写)レベルをモニタリングし得る。例えば、癌は、特定マーカー、 例えば乳癌の場合にはHER2(c−erbB−2/neu)プロト癌遺伝子の 過剰発現を特徴とする。同様に、受容体チロシンキナーゼ(RTK)の過剰発現 は、乳房、肝臓、膀胱、膵臓の癌、並びに神経膠芽細胞腫、肉腫及び扁平上皮癌 を含めた多数の腫瘍の病因に関連する(Carpenter,Ann.Rev.Biochem.,56:88 1-914(1987)参照)。逆に、癌(例えば結腸直腸、肺及び乳房)は、腫瘍抑制 遺伝子、例えばP53の突然変異又は過小発現を特徴とする(例えば、Tominaga et al.,Critical Rev.in Oncogenesis,3:257-282(1992)参照)。 当該特定遺伝子が公知である場合、高密度アレイは好ましくは当該遺伝子の配 列又はサブ配列と相補的であるように選択されるプローブオリゴヌクレオチドを 含有する。各当該遺伝子の高プローブ重複性が達成され、各遺伝子の絶対発現レ ベルが確定される。 逆に、遺伝子が健常状態と疾病状態との間の発現で異なることが公知でない場 合、本発明の一般的差異スクリーニング法が特に適している。健常及び病態核酸 の本明細書中に開示した一般的差異スクリーニングアレイとのハイブリダイゼー ション並びにハイブリダイゼーションパターンの比較は、病理学的状態で調節が 変わる遺伝子を同定する。 同様に、本発明の発現モニタリング及び一般的差異スクリーニング法を用いて 、限定的刺激、例えば薬剤、細胞活性化等に対する種々の遺伝子の発現をモニタ リングし得る。本方法は、多数の遺伝子の発現の同時モニタリングを可能にする ために、特に有益である。 これは、終点転写が複雑なもので、ある特定遺伝子が過剰発現されるか又は過小 発現されるかを簡単に求められない場合に、薬剤検査に特に有用である。したが って、疾病状態又は薬剤の作用様式が十分に特性化されていない場合、本発明の 方法は特に関連のある遺伝子を迅速に確定させる。さらに、当該遺伝子が公知で あるか又は推測される場合、好ましくは発現モニタリング法が用いられるが、一 方、当該特定遺伝子が公知でない場合には、一般的スクリーニング法が用いられ る。 本明細書中に開示した一般的差異スクリーニング法を用いる場合、特定遺伝子 に関する知識の欠如は有用な治療を確認する妨げとはならない。例えば、健常細 胞に関する特定の高密度アレイ上のハイブリダイゼーションパターンが公知で、 罹患細胞に関するパターンと有意に異なっている場合には、罹患細胞に関するパ ターンを健常細胞に関するもののようにさせるものに関して、化合物のライブラ リーをスクリーニングし得る。これは、薬剤に対する細胞反応の非常に詳細な測 定を提供する。 したがって、一般的差異スクリーニング法は、遺伝子発見のための、そして種 々の刺激に対する複雑な細胞反応の基礎を成すメカニズムを解明するための強力 な道具を提供する。例えば、一実施態様では、一般的差異スクリーニングは、「 発現フィンガープリント法」に用い得る。ある種の細胞型からのmRNAが異な る条件下(例えば、疾病状態で、特定遺伝子の突然変異を有する場合)では異な る別々の全体的ハイブリダイゼーションパターンを示すことが判明したとしてみ よう。その場合、発現のこのパターン(発現フィンガープリント)は、再現可能 で、且つ異なる場合に明らかに鑑別可能であるならば、非常に詳細な診断として 用い得る。パターンが十分に解釈可能であり、しかしまさに特定の細胞状態に特 異的である( そして好ましくは診断的および/または予後的関連を有する)必要さえない。 発現モニタリング法も一般的差異スクリーニングもともに、薬剤安全試験に用 いられる。例えば、新規の抗生物質を作る場合には、哺乳類細胞に関する発現プ ロフィールに有意の影響を及ぼすべきでない。ハイブリダイゼーションパターン は、細胞に及ぼす薬剤の影響の詳細な測定として用い得る。言い換えれば、毒物 学的スクリーンとして用い得る。 本発明の発現モニタリング及び一般的差異スクリーニング法は、遺伝子発見に 適している。例えば、上で説明したように、一般的差異スクリーニング法は、2 つ又はそれ以上の試料中の核酸の存在量の差異を確認する。これらの差異は、従 来公知でない遺伝子の発現レベルの変化を示す。差異スクリーニングアレイによ り提供される配列情報は、本明細書中に記載されているように、公知でない遺伝 子を同定するために用い得る。 発現モニタリング法は、今日までに発見された多数の遺伝子が配列の属性共有 を基礎にして族に分類されたという事実を利用することにより、遺伝子発見に用 い得る。プローブが非常に多数であるために、高密度アレイ中に入れることがで きるし、すべての種類の遺伝子からの公知の成員又は公知の成員の一部を表すオ リゴヌクレオチドプローブを包含し得る。すでに公知のこのような「チップ」( 高密度アレイ)遺伝子を利用する場合、可変領域及び共通領域の両方を含有する 遺伝子座に正のシグナルを生じる。未知の遺伝子に関しては、遺伝子族の共通領 域のみが正のシグナルを生じる。結果は、新規に発見された遺伝子の可能性を示 す。 したがって、本発明の発現モニタリング及び一般的差異スクリーニング法はさ らに、「動的」遺伝子データベースの開発を可能にす る。ヒトゲノムプロジェクト及び商業的シーケンシングプロジェクトは、機能的 又は遺伝的相互作用とは関係なく、数千の配列を列挙する大型静的データベース を生成した。本発明の方法を用いる分析は、遺伝子の機能及びその他の遺伝子と のその相互作用を定義する「動的」データベースを生成する。多数の遺伝子の発 現を同時にモニタリングする能力を有さず、あるいは多数の「未知の」核酸の存 在量の差異を検出する能力を持たねば、このようなデータベースを作成するのは 法外に大きい仕事である。 発現パターンを確定するためにDNA配列分析を用いる冗長な特質は、当該細 胞から単離したRNAからcDNAライブラリーを調製し、次にライブラリーを シーケンシングすることを包含する。DNAがシーケンシングされると、オペレ ーターは得られた配列を列挙し、それらを計数する。数千の配列が確定されねば ならず、次にそれらの遺伝子配列の頻度が試験中の細胞に関する遺伝子の発現パ ターンを限定する。 発現モニタリング又は一般的差異スクリーニングを用いて対照してみると、本 発明の方法によりデータを得るためのアレイは相対的に速く且つ容易である。例 えば一実施態様では、細胞は、発現を誘導するために刺激される。RNAが細胞 から得られ、次に直接標識差あれるか又はcDNAコピーが作られる。DNA重 合中に蛍光分子が組み込まれる。標識RNA又は標識cDNAは次に、一夜実験 で高密度アレイとハイブリダイズされる。ハイブリダイゼーションは、さらなる シーケンシングを伴わないハイブリダイズ化核酸のすべての単一鎖のレベルの定 量的査定を提供する。さらに、本発明の方法は非常に高感受性で、1細胞当たり 2〜3個の発現遺伝子のコピーを検出させる。この手順は、本明細書中に提示し た実施例に示されている。本発明の方法のこれらの使用は、説明のためのもので あって、いかなる意味においても限定されるものではない。 II.一般的差異スクリーニング及び発現モニタリングのための高密度アレイ 上記のように、本発明は、多数の核酸の発現レベルをモニタリング(検出およ び/または定量化)し、および/または2つ又はそれ以上の試料間の核酸濃度( 存在量)の差異を確定する方法を提供する。本方法は、1つ又はそれ以上の核酸 試料(標的核酸)の、核酸プローブの1つ又はそれ以上の高密度アレイとのハイ ブリダイゼーション、そしてその後のアレイ中の各プローブとハイブリダイズさ れた標的核酸の量を定量することを包含する。 核酸ハイブリダイゼーションは種々の遺伝子の発現レベルを確定するために時 々用いられる(例えば、ノーザンブロット)が、異質性核酸の大集団の存在下で の核酸(例えば遺伝子)の存在量(例えば転写及び、含蓄的に、発現)の小変動 の定量に高密度アレイが適しているということは、本発明の驚くべき発見であっ た。シグナル(例えば特定遺伝子又は遺伝子産物、あるいは示差的に豊富な核酸 )は、約1,000中約1未満、しばしば10,000中1未満、さらに好まし くは50,000中約1未満、最も好ましくは100,000中約1未満、さら には300,000中1又は1,000,000中1の濃度で存在する。 オリゴヌクレオチドアレイは、10分子という短いオリゴヌクレオチドを有し 、さらに好ましくは15オリゴヌクレオチド、最も好ましくは20又は25オリ ゴヌクレオチドを用いて核酸発現レベルを特異的に検出する。連結識別法を用い る場合、オリゴヌクレオチドアレイはより短いオリゴヌクレオチドを含有する。 この場合、6〜15ヌクレオチド、さらに好ましくは約8〜約12ヌクレオチド の範囲の長さのオリゴヌクレオチドを包含するオリゴヌクレオチド アレイが好ましい。もちろん、本明細書中に記載したように、より長いオリゴヌ クレオチドを含有するアレイも適している。 特定の予選択遺伝子を検出するよう設計される発現モニタリングアレイは、少 なくとも約10,好ましくは少なくとも約100,さらに好ましくは少なくとも 約1000,さらに好ましくは少なくとも約10,000,最も好ましくは少な くとも約100,000の異なる遺伝子の同時モニタリングを提供する。 A)オリゴヌクレオチドアレイの利点 好ましい一実施態様では、本発明の方法に用いられる高密度アレイは化学合成 オリゴヌクレオチドを包含する。化学合成オリゴヌクレオチドアレイの使用は、 例えばゲノムクローンのブロット化アレイ、制限断片、オリゴヌクレオチド等と 対照して、多数の利点を提供する。これらの利点は一般に、4つにわけられる: 1)製造効率; 2)アレイ間及びアレイ内差異の低減; 3)情報含量の増大; 4)シグナル対ノイズ比の改良 1)製造効率 好ましい実施態様では、アレイは空間処理平行合成の方法を用いて合成される (例えば、下記の第V節参照)。オリゴヌクレオチドは、化学的に合成され、高 度平行様式で、共有的にアレイ表面に付着される。これは非常に効率のよいアレ イ生成を可能にする。例えば、数千の特異的に選択された20merオリゴヌク レオチドのうちの数十(あるいは数百の場合さえある)の任意の集合体を含有す るアレイが、80以下の合成周期で合成される。アレイは、配列情報だけに基づ いて設計され、合成される。したがって、ブロッティング法とは異なり、アレイ 調製は生物学的材料の取り扱いを必要と しない。クローニング工程、核酸精製又は増幅、クローン又は増幅産物の目録作 り等の必要もない。したがって本発明における高密度オリゴヌクレオチドアレイ の好ましい化学合成はブロッティング法より効率がよく、高度再現可能高密度ア レイの製造を可能にする。 2)アレイ間及びアレイ内差異の低減; 本発明の方法における化学合成高密度オリゴヌクレオチドアレイの使用は、ア レイ間及びアレイ内変異を改良する。本発明に好ましいオリゴヌクレオチドアレ イは、高度制御再現可能的方法で、大型バッチ(目下、49アレイ/ウエハで、 多数のウエハが平行して合成される)で作られる。これは、異なる時間及び場所 で実行される検定の直接比較を可能にする一般的診断及び検査用具としてそれら を適したものにする。 化学合成中に得られる正確な対照のために、本発明のアレイは、同一プローブ 組成を有する高密度アレイ間(製造バッチ内又はバッチ間)で、約25%未満、 好ましくは約20%未満、さらに好ましくは約15%未満、より好ましくは約1 0%未満、さらには約5%未満、最も好ましくは約2%未満の変異を示す。アレ イ変異は、2つ又はそれ以上のアレイ間の1つ又はそれ以上のオリゴヌクレオチ ドプローブにおけるハイブリダイゼーション強度(標識対照標的核酸混合物に対 する)の変異として検定される。さらに好ましくは、アレイ変異は、2つ又はそ れ以上のアレイ間の1つ又はそれ以上の標的遺伝子に関して測定されるハイブリ ダイゼーション強度(標識対照標的核酸混合物に対する)の変異として検定され る。 アレイ間及びアレイ内変異の他に、化学合成アレイはさらに、スポッティング 法、特に細胞由来核酸(例えばcDNA)を用いるスポッティング法に固有の相 対的プローブ頻度の変異を低減する。多数の遺伝子は数千のコピー/細胞のレベ ルで発現されるが、一方そ の他は単一コピー/細胞のみで発現される。cDNAライブラリーは、この物質 から作られるので、この非常に大きな偏りを反映する。ライブラリーの正規化( 参照cDNAとの比較による各々の異なるプローブの量の調整)は、過剰発現配 列の表現をある程度低減する一方、正規化は2又は3つのうちのおよそ一因子の みにより高度発現cDNAを選択する確率を低下させることが示されている。こ れに対比して、化学合成法は、すべてのオリゴヌクレオチドプローブがほぼ等濃 度で表現されるのを保証し得る。これは遺伝子内(アレイ間)変異を低減し、異 なるオリゴヌクレオチドプローブに関するハイブリダイゼーションシグナル間の 直接比較を可能にする。 3)情報含量の増大; i)発現モニタリングに関する利点 発現モニタリングのための高密度オリゴヌクレオチドアレイの使用は、他の方 法では認められない多数の利点を提供する。例えば、特定標的遺伝子の転写産物 と特異的に結合する多数の異なるプローブの使用は、特定標的遺伝子の有効な検 出のためのプローブ組の最適化を可能にし、他の核酸種との交差反応による誤差 の可能性を最小限にする高度の重複性及び内部対照を提供する。 明らかに適切なプローブがしばしば、ハイブリダイゼーションによる発現モニ タリングに有効でないことを立証する。例えば、特定標的遺伝子のあるサブ配列 がゲノムの他の領域に見出され、これらのサブ配列に向けられるプローブが他の 領域と交差ハイブリダイズして、標的遺伝子の発現レベルの有意の測定値である シグナルを提供しない。交差反応性をほとんど示さないプローブでさえ、それら は一般に有効なハイブリダイゼーションを妨げる構造の形成のために不十分なハ イブリダイゼーションを示すために、適切でないことがある。最後に、多数のプ ローブを有する組では、組の中のすべて のプローブに関して最適であるハイブリダイゼーション条件を確認するのは難し い。各標的遺伝子に対する多数のプローブにより提供される高度の重複性のため に、既定組のハイブリダイゼーション条件下で不十分に機能するプローブを排除 し、その遺伝子の発現レベル(転写レベル)の非常に高感度の且つ信頼できる測 定を提供するのに十分な特定標的遺伝子に対するプローブを依然として保持する ことができる。 さらに、各標的遺伝子に対する多数の異なるプローブの使用は、密に関連した 核酸の族の発現のモニタリングを可能にする。族全体に保存されるサブ配列と、 そして族中の異なる核酸においては異なるサブ配列とハイブリダイズするよう、 プローブを選択し得る。したがって、このようなアレイとのハイブリダイゼーシ ョンは、種々の遺伝子がほぼ同一サイズで、高レベルの相同性を有する場合でさ え、遺伝子族の種々の成員の同時モニタリングを可能にする。このような測定は 、伝統的ハイブリダイゼーション法では困難であるか又は不可能である。 ii)一般的利点 高密度アレイはこのような多数のプローブを含有するために、例えば、特定遺 伝子中の変異又は突然変異に対する対照、全体的ハイブリダイゼーション条件に 対する対照、試料調製条件に対する対照、核酸が得られる細胞の代謝活性に対す る対照、及び非特異的結合又は交差ハイブリダイゼーションに対するミスマッチ 対照を含めた多数の対照を提供することができる。 複合哺乳類細胞メッセージ集団中の遺伝子転写の有効な検出及び定量は、相対 的に短いオリゴヌクレオチドを用いて、そして相対的に少ない(例えば40以下 、好ましくは30以下、さらに好ましくは25以下、最も好ましくは20,15 さらには10以下)オリゴ ヌクレオチドプローブ/遺伝子を用いて確定され得る。各遺伝子に対して強力に 且つ特異的にハイブリダイズする多数のプローブがある。これは、多数のプロー ブが検出に必要であることを意味しないどころか、逆に選択するために多数があ り、選択は例えばアレイ独自性(遺伝子族)、スプライス変数の点検、又は遺伝 子型ホットスポット(cDNAスポッティング法では容易に実行できないこと) といったその他の考慮点を基礎にし得る。 使用に際しては、各々約400,000プローブを含有する、発現モニタリン グのための4つのアレイの組が作られる。公的データベース中にESTが存在す る約40,000の遺伝子の各々と相補的である約40のプローブの組(20プ ローブ対)が選択される。この組のESTは、全ヒト遺伝子のおよそ1/3〜1 /2を網羅し、これらのアレイは一夜ハイブリダイゼーションの平行組において それらのすべてのレベルをさせる。 4)シグナル対ノイズ比の改良 ブロット処理核酸は、時々、イオン性、静電気性及び疎水性相互作用に依って 、ブロット化核酸を基質に付加する。結合は核酸に沿って多数の点で形成され、 自由度を制限し、その相補的標的とハイブリダイズする核酸の能力を妨げる。こ れに対比して、本発明の好ましいアレイは、化学的に合成される。オリゴヌクレ オチドプローブは単一末端共有結合により基質に付加される。プローブは自由度 をより多く有し、それらの相捕的標的との複雑な相互作用に加わる。その結果と して、本発明のプローブアレイはブロット化アレイよりも有意に高いハイブリダ イゼーション効率を示す(10倍、100倍、そして1000倍も効率がが高い ことさえある)。少ない標的オリゴヌクレオチドを用いて既定のシグナルを生成 し、それによりシグナル対ノイズ比を劇的に改良する。その結果として、本発明 の方法は、非常に複雑な核酸混合物中の核酸の2〜3コピーのみの検出を可能に する。 B)好ましい高密度アレイ 本発明の好ましい高密度アレイは、約100以上、好ましくは約1000以上 、さらに好ましくは約16,000以上、最も好ましくは約65,000又は2 50,000以上、あるいはさらに約1,000,000以上の異なるオリゴヌ クレオチドプローブを包含する。オリゴヌクレオチドプローブは、約5〜約50 ,又は約5〜約45のヌクレオチド、さらに好ましくは約10〜約40ヌクレオ チド、最も好ましくは約15〜約40ヌクレオチド長の範囲である。特に好まし い実施態様では、オリゴヌクレオチドプローブは20又は25ヌクレオチドの長 さであるが、一方他の好ましい実施態様(特に、連結識別反応を用いる場合)で は、オリゴヌクレオチドプローブは好ましくはより短い(例えば6〜20,さら に好ましくは8〜15ヌクレオチドの長さ)。相対的に短いオリゴヌクレオチド プローブは標的配列と特異的にハイブリダイズし、識別するのに十分であること が本発明の発見であった。したがって、好ましい一実施態様では、オリゴヌクレ オチドプローブは長さが50ヌクレオチド未満、一般的に46ヌクレオチド未満 、さらに一般的には41ヌクレオチド未満、最も一般的には36ヌクレオチド未 満、好ましくは31ヌクレオチド未満、さらに好ましくは26ヌクレオチド未満 、そして最も好ましくは21ヌクレオチド未満である。プローブはさらに16ヌ クレオチド未満、13ヌクレオチド未満、9ヌクレオチド未満そして7ヌクレオ チド未満の長さであってもよい。さらに、オリゴヌクレオチドプローブは相対的 に長く、約1000ヌクレオチド、さらに典型的には約500ヌクレオチドまで の長さの範囲であることもあると認識される。 アレイ中の各々の異なるオリゴヌクレオチドプローブの場所、そしていくつか の実施態様では配列が公知である。さらに、多数の異なるプローブが相対的に小 さな領域を占めて、一般的に約60以上、さらに一般的には約100以上、最も 一般的には約600以上、しばしば約1000以上、さらにしばしば約5000 以上、最もしばしば約10,000以上、好ましくは約40,000以上、さら に好ましくは約100,000以上、そして最も好ましくは約400,000以 上の異なるオリゴヌクレオチドプローブ/cm2のプローブ密度を有する高密度 アレイを提供する。アレイの小表面積(しばしば約10cm2未満、好ましくは 約5cm2未満、さらに好ましくは約2cm2未満、そして最も好ましくは約1. 6cm2未満)は、小試料容量及び非常に均一なハイブリダイゼーション条件( 温度調節、塩含量等)の使用を可能にする一方、非常に多数のプローブはハイブ リダイゼーションの大量平行処理を可能にする。 最後に、高密度アレイが占める小面積のために、非常に少量の液体容量(例え ば250μl以下、さらに好ましくは100μl以下、最も好ましくは10μl 以下)で実行し得る。さらに、ハイブリダイゼーション条件は試料全体を通して 非常に均一で、ハイブリダイゼーションフォーマットは自動処理を施すことがで きる。 III.遺伝子発現モニタリング及び一般的差異スクリーニング 上記で説明したように、本発明は遺伝子発現をモニタリングする(発現モニタ リング)ための、そして2又はそれ以上の核酸試料中の核酸の存在量の差異を確 認する(一般的差異スクリーニング)ための方法を提供する。一般的に、本発明 の遺伝子発現をモニタリングする方法は、(1)1つ又はそれ以上の標的遺伝子 (単数又は複数)のRNA転写物(単数又は複数)を包含する標的核酸の、ある いはRNA転写物(単数又は複数)由来の核酸のプールを提供し; (2)核酸試料をプローブ(対照プローブを含めた)の高密度アレイとハイブリ ダイズし;そして(3)ハイブリダイズ化核酸を検出して、相対的発現(転写) レベルを算出する工程を包含する。これらの方法は、好ましくは特異的予選択遺 伝子に対するプローブを含有する高密度オリゴヌクレオチドアレイの使用を包含 する。 これに対比して、本発明の一般的差異スクリーニング法に用いられるアレイは 、特異的標的遺伝子が同定される必要がない。それとは反対に、本方法は、同定 される特定遺伝子が差異スクリーニングの実施前に公知でない場合には、種々の 遺伝子の発現の変化又は差異を検出するよう設計される。 一般的差異スクリーニングの方法は、典型的には1)1つ又はそれ以上の高密 度オリゴヌクレオチドアレイ(好ましくは、1つ又はそれ以上のヌクレオチドが 異なるプローブ対を含めた)を提供し;2)2又はそれ以上の核酸試料を提供し ;3)核酸試料を1つ又はそれ以上のアレイとハイブリダイズして核酸試料中の 核酸とアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重鎖を形 成し;そして4)核酸試料間のハイブリダイゼーションの差異を確定する工程を 包含する。 核酸試料の提供、試料のアレイとのハイブリダイゼーション、及びハイブリダ イズ化核酸(単数又は複数)の検出は、発現モニタリング及び一般的差異スクリ ーニング法においては本質的に同一のやり方で実行される。本明細書中に開示す るように、好ましい実施態様では、本方法はオリゴヌクレオチドプローブ選択に より部分的に、一般的差異スクリーニングにおける少なくとも2つの核酸試料の 使用の点で、そしてその後の分析で区別される。 A)核酸試料の提供 試料中の核酸濃度を測定するために、このような分析用の核酸試 料を提供するのが望ましい。核酸濃度、又は異なる試料間の核酸濃度の差が遺伝 子(単数又は複数)の転写レベル又は転写レベルの差を反映する場合、遺伝子( 単数又は複数)のmRNA転写物(単数又は複数)を包含する核酸試料、あるい はmRNA転写物(単数又は複数)由来の格差案を提供するのが望ましい。本明 細書中で用いる場合、mRNA転写物由来の核酸とは、その合成のためにmRN A転写物又はそのサブ配列が最後に鋳型として役立った核酸を示す。したがって 、mRNAから逆転写されるcDNA、cDNAから転写されるRNA、cDN Aから増幅されるDNA、増幅DNAから転写されるRNA等はすべて、mRN A由来であって、このようにして得られる生成物の検出は試料中の元の転写物の 存在および/または存在量を示す。したがって、適切な試料としては、遺伝子( 単数又は複数)のmRNA転写物、mRNAから逆転写されるcDNA、cDN Aから転写されるcRNA、遺伝子から増幅されるDNA、増幅DNAから転写 されるRNA等が挙げられるが、これらに限定されない。 試料中の1つ又はそれ以上の遺伝子の転写レベル(及びそれにより発現を)を 定量するのが望ましい、特に好ましい実施態様では、核酸試料は、単数又は複数 の遺伝子のmRNA転写物(単数又は複数)の濃度、あるいはmRNA転写物( 単数又は複数)由来の核酸の濃度がその遺伝子の転写レベル(したがって発現レ ベル)に比例するものの一つである。同様に、ハイブリダイゼーションシグナル 強度がハイブリダイズ化核酸の量に比例するのが好ましい。比例性が相対的に厳 密である(例えば、転写率の倍加が試料核酸プール中のmRNA転写物の倍加及 びハイブリダイゼーションシグナルの倍加を引き起こす)ことが好ましい一方、 比例性はより寛大で、非線形でさえあると当業者は理解する。したがって、例え ば標的mRN Aの濃度における5倍の差異がハイブリダイゼーション強度における3〜6倍の 差異を生じる検定は、ほとんどの目的に対して十分である。より正確な定量が必 要な場合には、適切な対照を用いて実行し、本明細書中に記載したような試料調 製及びハイブリダイゼーションにおいて誘導される変異を修正し得る。さらに、 「標準」標的mRNAの連続希釈を用いて、当業者に公知の方法にしたがって校 正曲線を調製し得る。もちろん、転写物の存在又は非存在の簡単な検出、あるい は核酸濃度の変化の大きな差異が所望される場合には、精巧な制御又は校正は必 要ない。 最も簡単な実施態様では、このような核酸試料は生物学的試料から単離された および/またはそうでなければそれに由来する総mRNA又は総cDNAである 。「生物学的試料」という用語は、本明細書中で用いる場合、生物から又は生物 の成分(例えば細胞)から得られる試料を指す。試料は、あらゆる生物学的組織 または液体を有する。しばしば試料は、「臨床的試料」であって、これは患者か ら得られる試料である。このような試料としては、痰、血液、血液細胞(例えば 白血球)、組織または微細針生検試料、尿、腹膜液又はそれからの細胞が挙げら れるが、これらに限定されない。生物学的試料としてはさらに、組織の切片、例 えば組織学的目的のために採取された凍結切片が挙げられる。 核酸(ゲノムDNA又はmRNA)は、当業者に十分公知の多数のあらゆる方 法により試料から単離され得る。遺伝子のコピー数の変化が検出される場合、ゲ ノムDNAは好ましくは単離される、と当業者は理解する。逆に、1又は複数の 遺伝子の発現レベルを検出しようとする場合、好ましくは、RNA(mRNA) が単離される。 全mRNAを単離する方法は、当業者には十分公知である。例え ば、核酸の単離及び精製の方法は、Chapter 3 of Laboratory Techniques in Bi ochemistry and Molecular Biology:Hybridization With Nucleic Acid Probes ,Part 1.Theory and Nucleic Acid Preparation,P.Tijssen,ed.Elsevier ,N.Y.(1993)及びChapter 3 of Laboratory Techniques in Biochemistry an d Molecular Biology:Hybridization With Nucleic Acid Probes,Part 1.Theo ry and Nucleic Acid Preparation,P.Tijssen,ed.Elsevier,N.Y.(1993) に詳細に記載されている。 好ましい実施態様では、例えば、酸性グアニジニウム−フェノール−クロロホ ルム抽出法を用いて与えられた試料から全核酸を単離し、そしてオリゴdTカラ ムクロマトグラフィーにより、又は(dT)n磁気ビーズを用いてポリA+mR NAを単離する(例えば、Sambrook et al.,Molecular Cloning:A Laboratory Manual(2nd ed.),Vol.1-3,Cold Spring Harbor Laboratory,(1989)又は Current Protocols in Molecular Biology,F.Ausubel et al.,ed.Greene Pub lishing and Wiley-Interscience,New York(1987)参照)。 しばしば、ハイブリダイゼーション前に核酸試料を増幅するのが望ましい。い かなる増幅法を用いても、定量結果を所望する場合には、増幅核酸の相対的頻度 を維持し又は制御する方法の使用には注意しなければならない、と当業者は理解 する。 「定量的」増幅の方法は、当業者には十分公知である。例えば、定量的PCR は、同一プライマーを用いる公知量の対照配列の同時増幅を包含する。これは、 PCR反応を校正するために用いられる内部標準を提供する。その場合、高密度 アレイは、増幅核酸の定量のための内部標準に特異的なプローブを含む。 好ましい内部標準の一つは、合成AW106cRNAである。A W106cRNAは、当業者に公知の標準技法に従って試料から単離されたRN Aと組合される。次に、逆転写酵素を用いてRNAを逆転写して、コピーDNA を提供する。次にcDNA配列を標識プライマーを用いて増幅する(例えばPC Rにより)。典型的には電気泳動により、増幅産物を分離し、放射能の量(増幅 産物の量に比例する)を確定する。次に、公知のAW106RNA標準により生 成されるシグナルとの比較により、試料中のmRNAの量を算出する。定量的P CRのための詳細なプロトコールは、PCR Protocols,A Guide to Methods and Applications,Innes et al.,Academic Press,Inc.N.Y.,(1990)に提示され ている。 その他の適切な増幅方法としては、ポリメラーゼ連鎖反応(PCR)(Innes et al.,PCR Protocols,A Guide to Methods and Application.Academic Pres s,Inc.San Diego,(1990))、リガーゼ連鎖反応(LCR)(Wu and Wallace ,Genomics,4:560(1989)、Landegren,et al.,Science,241:1077(1988) 及びBarringer,et al.,Gene,89:117(1990)参照)、転写増幅(Kwoh,et al .,Proc.Natl.Acad.Sci.USA,86:1173(1989))及び自己支持配列複製(Gau telli,et al.,Proc.Nat.Acad.Sci.USA,87:1874(1990))が挙げられる が、これらに限定されない。 特に好ましい実施態様では、逆転写酵素並びにオリゴdT及びファージT7プ ロモーターをコードする配列から成るプライマーで試料mRNAが逆転写されて 、一本鎖DNA鋳型を提供する。DNAポリメラーゼを用いて二次DNA鎖を重 合する。二本鎖cDNAの合成後、T7RNAポリメラーゼを付加し、RNAを cDNA鋳型から転写する。各一本鎖cDNA鋳型から連続回転写すると、増幅 RNAが得られる。in vitro重合の方法は当業者には十分公知であり(例えば、 Sambrook上記、参照)、この特定の方法は、本方法 によるin vitro増幅が種々のRNA転写物の相対頻度を保存することを立証した Van Gelder,et al.,(Proc.Natl.Acad.Sci.USA,87:1663-1667(1990)) により、詳細に記載されている。さらに、Eberwine et al.,Proc.Natl.Acad .Sci.USA,89:3010-3014は、in vitro転写による2回の増幅を用いて元の出発 物質の106倍以上のの増幅を達成し、それにより生物学的試料が限定される場 合でも発現モニタリングを可能にするプロトコールを提供する。 上記の直接転写法はアンチセンス(aRNA)プールを提供する、と当業者に は理解される。アンチセンスRNAを標的核酸として用いる場合、アレイ中に提 供されるオリゴヌクレオチドプローブはアンチセンス核酸のサブ配列と相補的で あるように選択される。逆に、標的核酸プールがセンス核酸のプールである場合 、オリゴヌクレオチドプローブはセンス核酸のサブ配列と相補的であるように選 択される。最後に、核酸プールが二本鎖化される場合、標的核酸はセンス鎖とア ンチセンス鎖の両方を含むので、プローブはどちらかのセンスを有するものであ る。 上記で引用したプロトコールはセンス又はアンチセンス核酸のプールを生成す る方法を含む。実際、あるアプローチを用いて、所望のセンス又はアンチセンス 核酸を生成し得る。例えば、cDNAは、T3及びT7プロモーターが側面に位 置するようにベクター(例えば、StratageneのpBluscript II K S(+)ファージミド)中で指向的にクローン化され得る。T3ポリメラーゼに よるin vitro転写は一方のセンスのRNAを生成し(挿入物の配向によるセンス )、一方T7ポリメラーゼによるin vitro転写は反対のセンスを有するRNAを 生成する。その他の適切なクローニング系は、Cre−loxPプラスミドサブ クローニングのために設計されたファージラムダベクターを含む(例えば、Pala zzolo et al. ,Gene,88:25-36(1990))。 特に好ましい実施態様では、高活性RNAポリメラーゼ(例えば、T7に関し ては約2500単位/μl、Epicentre Technologiesから販売)が用いられる。 B)核酸の標識 i)標識方法/戦略 好ましい実施態様では、試料核酸に付着された1つ又はそれ以上の標識を検出 することにより、ハイブリダイズ化核酸を検出する。標識は、当業者に十分公知 の多数の手段のいずれかにより組み入れられる。しかしながら、好ましい実施態 様では、試料核酸の調製における増幅工程中に、標識は同時に組み入れられる。 例えば、標識化プライマー又は標識化ヌクレオチドを用いたポリメラーゼ連鎖反 応(PCR)は、標識化増幅産物を提供する。核酸(例えばDNA)は、標識化 デオキシヌクレオチドトリホスフェート(dNTP)の存在下で増幅されるべき ものである。増幅核酸は断片化され、オリゴヌクレオチドアレイに曝露され、ハ イブリダイゼーションの程度は、アレイにここで伴う標識の量により確定される 。好ましい実施態様では、上記のように標識化ヌクレオチド(例えば、フルオレ セイン標識化UTPおよび/またはCTP)を用いる転写増幅は、標識を転写化 核酸中に組み入れる。 あるいは、標識は元の核酸試料(例えば、mRNA、ポリAmRNA、cDN A等)に、又は増幅完了後に増幅産物に直接付加される。このような標識化は増 幅産物の収量増大を引き起好ましい、増幅反応に必要な時間を低減する。標識を 核酸に付加する手段としては、例えばニックトランスレーション、又は核酸のキ ナーゼ処理とその後の試料核酸を標識(例えばフルオロフォア)に連結させる核 酸リンカーの付加(連結)による末端ラベリング(例えば標識化R NAを用いる)が挙げられる。末端ラベリングは、下記の第III(B)(ii i)項でさらに詳細に説明する。 本発明での使用に適した検出可能な標識としては、分光学的、光化学的、生化 学的、免疫化学的、電気的、光学的又は化学的手段により検出可能なあらゆる組 成物が挙げられる。本発明における有用な標識としては、標識化ストレプトアビ ジン複合体による染色のためのビオチン、磁気ビーズ(例えばDynabeadsTM)、 蛍光染料(例えばフルオレセイン、テキサスレッド、ローダミン、緑色蛍光タン パク質等。例えばMolecular Probes,Eugene,Oregon,USA参照)、放射性標識 (例えば3H、125I、35S、14C又は32P)、酵素(例えばホースラディッシュ ペルオキシダーゼ、アルカリ性ホスファターゼ及びELISAで一般的に用いら れるその他のもの)及び発色性標識、例えば金コロイド(例えば直径40〜80 nmのサイズ範囲の金粒子は高効率で緑色光を発する)、あるいは着色ガラス又 はプラスチック(例えばポリスチレン、ポリプロピレン、ラテックス等)ビーズ が挙げられる。このような標識の使用を教示する特許としては、米国特許第3, 817,837号、第3,850,752号、第3,939,350号、第3, 996,345号、第4,277,437号、第4,275,149号及び第4 ,366,241号が挙げられる。 蛍光標識は、それが低バックグラウンドで非常に強力なシグナルを提供するた めに、好ましい。それはさらに、迅速走査手法により高解像度及び感度で光学的 に検出可能である。核酸試料は、単一標識で、例えば蛍光標識ですべて標識され 得る。あるいは、別の実施態様では、異なる核酸試料は、各核酸試料が異なる標 識を有する場合には、同時にハイブリダイズされ得る。例えば、ある標的は緑色 蛍光標識を有し、第二の標的は赤色蛍光標識を有し得る。走査工程 は、赤色標識の結合のサイトと緑色蛍光標識のサイトを区別する。各核酸試料( 標的核酸)は、互いに別々に分析される。 用い得る適切な色原体としては、色が観察されるように波長の弁別的範囲で光 を吸収する、あるいは特定の波長又は波長範囲の放射で照射された場合に光を発 する分子及び化合物、例えば蛍光体が挙げられる。 広範囲の適切な染料が利用可能であり、強度の色を提供し、それらの周囲に最 小量吸収される。例示的染料としては、キノリン染料、トリアリールメタン染料 、アクリジン染料、アリザリン染料、蓋レイン、昆虫染料、アゾ染料、アントラ キノイド染料、シアニン染料、フェナザチオニウム染料及びフェナゾキソニウム 染料が挙げられる。 広範囲の蛍光体は、単独であるいは消光体分子と一緒に用い得る。当該蛍光体 は、ある種の一次官能体を有する種々の部類に分けられる。これらの一次官能体 としては以下のものが挙げられる:1−及び2−アミノナフタレン、p,p’− ジアミノスチルベン、ピレン、第四級フェナントリジン塩、9−アミノアクリジ ン、p,p’−ジアミノベンゾフェノンイミン、アントラセン、オキサカルボシ アニン、マロシアニン、3−アミノエキレニン、ペリレン、ビスベンズオキサゾ ール、ビス−p−オキサゾリルベンゼン、1,2−ベンゾフェナジン、レチノー ル、ビス−3−アミノピリジニウム塩、ヘレブリゲニン、テトラサイクリン、ス テロフェノール、ベンズイミダゾリルフェニルアミン、2−オキソ−3−クロメ ン、インドール、キサンテン、7−ヒドロキシクマリン、フェノキサジン、サリ チラート、ストロファンチジン、ポルフィリン、トリアリールメタン及びフラビ ン。リンキングのための官能体を有する、又はこのような官能体を組み入れるた めに修飾され得る個々の蛍光化合物とし ては、例えば以下のものが挙げられる:塩化ダンシル;フルオレセイン、例えば 3,6−ジヒドロキシ−9−フェニルキサントヒドロール;ローダミンイソチオ シアネート;N−フェニル 1−アミノ−8−スルホナトナフタレン;N−フェ ニル 2−アミノ−6−スルホナトリウムナフタレン:4−アセトアミド−4− イソチオシアナトースチルベン−2,2’−ジスルホン酸;ピレン−3−スルホ ン酸;2−トルイジノナフタレン−6−スルホネート;N−フェニル、N−メチ ル 2−アミノナフタレン−6−スルホネート;臭化エチジウム;ステブリン; アウロミン−0,2−(9’−アントロイル)パルミテート;ダンシルホスファ チジルエタノールアミン;N,N’−ジオクタデシルオキサカルボシアニン;N ,N’−ジヘキシルオキサカルボシアニン;メロシアニン、4(3’ピレニル) ブチレート;d−3−アミノデソキシ−エキレニン;12−(9’アントロイル )ステアレート;2−メチルアントラセン;9−ビニルアントラセン;2,2’ (ビニレン−p−フェニレン)ビスベンズオキサゾール;p−ビス[2−(4− メチル−5−フェニル−オキサゾイル)]ベンゼン;6−ジメチルアミノ−1, 2−ベンゾフェナジン;レチノール;ビス(3’−アミノピリジニウム)1,1 0−デカンジル ジイオダイド;ヘリブリエニンのスルホナフチルヒドラゾン; クロロテトラサイクリン;N(7−ジメチルアミノ−4−メチル−2−オキソ− 3−クロメニル)マレイミド;N−[p−(2−ベンズイミダゾリル)−フェニ ル]マレイミド;N−(4−フルオランチル)マレイミド;ビス(ホモバニリン 酸);レサザリン;4−クロロ−7−ニトロ−2,1,3−ベンゾオキサジアゾ ール;メロシアニン540;レゾルフィン;ローズベンガル;及び2,4−ジフ ェニル−3(2H)−フラノン。 望ましくは、蛍光体は約300nm以上、好ましくは約350n m、さらに好ましくは約400nm以上で光を吸収し、通常は吸収された光の波 長より約10nm以上高い波長で発光すべきである。結合染料の吸光及び発光特 性は非結合染料とは異なる、ということに留意する必要がある。したがって、種 々の波長範囲及び染料の特性を示す場合は、用いた染料を示すものであって、任 意の溶媒中で非結合及び特性化される染料ではないものとする。 蛍光体は一般的に、光を蛍光体に照射することにより、複数の放出物を得るこ とができるために、選ばれる。したがって、単一標識が複数の測定可能事象を提 供し得る。 検出可能なシグナルは、化学発光及び生物発光源によっても提供される。化学 発光源としては、化学反応により電子的に励起されて、その後検出可能なシグナ ルとして役立つ光を発するか、又はエネルギーを蛍光受容体に供与する化合物が 挙げられる。多数の族の化合物が種々の条件下で化学発光を提供することが判明 している。一族の化合物は、2,3−ジヒドロ−1,4−フタラジンジオンであ る。最も一般的な化合物はルミノールで、これは5−アミノ化合物である。その 族の他の成員としては、5−アミノ−6,7,8−トリメトキシ−及びジメチル アミノ[ca]ベンズ類似体が挙げられる。これらの化合物は、アルカリ性過酸 化水素又は次亜塩素酸カルシウム及び塩基を用いて冷光を発するよう作られる。 別の族の化合物は、2,4,5−トリフェニルイミダゾールで、これは親物質と してロフィンという一般名を有する。化学発光体類似体としては、パラ−ジメチ ルアミノ及び−メトキシ置換体が挙げられる。化学発光はさらに、シュウ酸塩、 通常はオキサリル活性エステル、例えばp−ニトロフェニル、並びに過酸化物、 例えば過酸化水素を用いて塩基性条件下で得られる。あるいは、ルシフェリンを ルシフェラーゼ又はルシゲニンと一緒に用いて、生物発光を提供し得る。 スピン標識は、電子スピン共鳴(ESR)分光学により検出される不対電子ス ピンを有する環境指示分子により提供される。例示的スピン標識としては、有機 フリーラジカル、遷移金属錯体、特にバナジウム、銅、鉄及びマンガン等が挙げ られる。例示的スピン標識には、ニトロキシドフリーラジカルも含まれる。 標識は、ハイブリダイゼーション前又は後に標的(試料)核酸(単数又は複数 )に付加される。いわゆる「直接標識」は、ハイブリダイゼーション前に標的( 試料)核酸に直接付加されるか又は取り込まれる検出可能な標識である。これに 対比して、いわゆる「間接標識」は、ハイブリダイゼーション後にハイブリッド 二重鎖に連結される。しばしば、間接標識は、ハイブリダイゼーション前に標的 核酸に付加された結合部分に付加される。したがって、例えば標的核酸はハイブ リダイゼーション前にビオチニル化され得る。ハイブリダイゼーション後、アビ ジン共役フルオロフォアはハイブリッド二重鎖を保有するビオチンを結合して、 容易に検出される標識を提供する。核酸を標識し、標識化ハイブリダイズ化核酸 を検出する方法の詳細な検討のためには、Laboratory Techniques in Biochemis try and Molecular Biology,Vol.24:Hybridization With Nucleic Acid Probes ,P.Tijssen,ed.Elsevier,N.Y.,(1993)を参照されたい。 蛍光標識は、in vitro転写反応中に選択され、容易に付加される。好ましい実 施態様では、フルオレセイン標識UTP及びCTPを、上記のようにin vitro転 写反応で生成されたRNA中に取り込ませる。 標識は、直接、又はリンカー部分を介して付加される。概して、標識又はリン カー−標識付着の部位は、いかなる特定の部位にも限定されない。例えば、標識 は、所望の検出又はハイブリダイゼーシ ョンを妨げないあらゆる位置に、ヌクレオシド、ヌクレオチド又はその類似体に 付着される。例えば、ある種のラベルオン試薬(Label-ON Reagents)(Clontec h,Palo Alto,CA)は、オリゴヌクレオチドのホフフェート主鎖全体に散在した 標識を、そして3’及び5’末端に末端標識を提供する。例えば本明細書中に示 したように、標識は、リボース環上の位置に付加されるか、あるいはリボースは 修飾され、所望により除去されることさえある。有用な標識試薬の塩基部分は天 然のものであるか、あるいはそれらが配置される目的を妨げないような方法で修 飾されるものである。修飾塩基としては7−デアザA及びG、7−デアザ−8ア ザA及びG、並びにその他の複素環式部分が挙げられるが、これらに限定されな い。 ii)末端標識核酸 多数の適用において、増幅、転写又はその他の核酸変換工程を経ることなく核 酸試料を直接標識することは有用である。このことは、細胞から全細胞質RNA 又はポリA+RNA(mRNA)を抽出し、mRNA濃度の元の分布をゆがめる あらゆる中間工程を用いずにこの物質をハイブリダイズしたい場合のmRNAレ ベルのモニタリングについて特にいえることである。 概して、末端標識法は、標識される核酸のサイズを最適化させる。末端標識法 はさらに、ポリメラーゼ促進標識法に時として伴う配列の偏りを低減する。末端 標識は、ターミナルトランスフェラーゼ(TdT)を用いて実施し得る。 末端標識はさらに、標識化オリゴヌクレオチド又はその類似体を標的核酸又は プローブの末端に連結することにより成し遂げ得る。その他の末端標識法として は、例えばリガーゼ又はターミナルトランスフェラーゼを用いた核酸に対する標 識化又は非標識化「尾部」の作成が挙げられる。次に尾部処理核酸を、選択的に 尾部と会合す る標識化部分に曝露する。尾部及び尾部と選択的に会合する部分は、例えば核酸 、ペプチド又は炭化水素のようなポリマーである。尾部及びその認識部分は2つ の間の認識を可能にするものであり、その例としては配位子−基質関係を有する 分子、例えばハプテン、エピトープ、抗体、酵素及びそれらの基質、並びに相補 的核酸及びその類似体が挙げられる。 尾部又は尾部認識部分に関連した標識は、検出可能部分を包含する。尾部及び その認識部分がともに標識される場合、各々に伴うそれぞれの標識は、それ自体 、配位子−基質関係を有する。それぞれの標識はさらに、エネルギー移動試薬、 例えば異なる分光学的特性を有する染料を包含する。エネルギー移動対は、所望 の組合せスペクトル特性を得るために選択される。例えば、第二染料により吸収 されるよりも短い波長で吸収する第一染料は、より短い波長で吸収する場合に、 エネルギーを第二染料に移動させる。次に、第二染料は第一染料単独で発せられ た波長より長い波長で電磁波を出す。エネルギー移動試薬は、同時係属中の米国 特許出願(1996年12月23日提出、代理審理第2013.2号。これはU SSN08/529,115(1995年9月15日提出)の一部継続である) 、並びにUSSN 07/624,114(1990年12月6日提出。これは USSN 07/362,901(1990年6月7日提出)のCIPである) の継続であるUSSN 08/168,904(1993年12月15日提出) の一部であるUSSN 08/670,118(1996年6月25日提出)の 一部継続である国際特許出願WO96/14839(1996年9月13日提出 )(これらの記載内容は、参照により本明細書中に含まれる)に記載されている ような二色標識法において特に有用である。 したがって、本発明は核酸の標識方法及びそのための有用な試薬 を提供する。本明細書中に開示された多数の方法は、末端標識を包含する。当業 者は、本発明は、開示されたように、一般的に化学的及び分子生物的技術に適用 可能である。 一実施態様では、本方法は核酸を提供し、標識オリゴヌクレオチドを提供し、 そしてオリゴヌクレオチドを酵素的に核酸に連結する工程を包含する。したがっ て、例えば核酸がRNAである場合、標識リボオリゴヌクレオチドはRNAリガ ーゼを用いて連結される。RNAリガーゼは5’リン酸基を有する一本鎖RNA (又はDNA。しかしRNAとの反応の方が効率がよい)とRNA(又はDNA )の別の小片の3’−OH末端との共有結合を触媒する。この酵素の使用のため の特別な要件が、The Enzymes,Volume XV,Part B,T4 RNA Ligase,Uhlenbeck and Greensport,pages 31-58及び5.66-5.69 in Sambrook et al.,Molecular C loning,A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbo r,New York(1982)に提示されている。 したがって、本発明は、核酸重合中に標識ヌクレオチドを取り込ませると言う よりむしろ直接核酸(例えば抽出RNA)に標識を付加する方法を提供する。こ れは、短い標識化オリゴヌクレオチドを一本鎖核酸の末端に付加することにより 成し遂げられる。本方法は、より完全に試料を標識する;即ち、慣用的技法の場 合よりも高いパーセンテージの利用可能な分子が標識される。 Mg2+の存在下で加熱してRNAを無作為に断片化する。これは一般的に、5 ’OH基及びホスホリル化3’末端を有するRNA断片を生じる。T4ポリヌク レオチドキナーゼ又は同様の酵素を用い、標準プロトコールを用いて、リン酸基 を断片の5’末端に付加する。5’−ホスホリル化RNA断片のプールに、RN Aリガーゼ+3’OH基+標識を5’末端に有する(例えば、フルオレセイン又 はその他の染料、あるいはストレプトアビジン複合体を用いて後に標識するため のビオチン、あるいは標識化抗体で後に標識するためのジオキシゲニン)かある いは1つ又はそれ以上の標識化塩基を有する短RNAオリゴヌクレオチドを付加 する。5’末端でフルオレセイン又はビオチンを用いて標識したリボA6(デオ キシリボ核酸6merポリA)は、特に好ましい標識を提供する。別の実施態様 では、連結RNAオリゴヌクレオチドは連結端近くにリボヌクレオチドを有する が、デオキシリボヌクレオチドはさらに離れている。もちろん、RNAオリゴヌ クレオチドはそれより長い場合も短い場合もあり、だいたいあらゆる配列を有し 得る。しかしながら、連結反応は、受容体の3’末端にAを有すると最も効率が よく、Uを有する場合は効率が最も低い。反応は標準条件下で進行させる。取込 まれなかったRNA6−merは、簡単なサイズ選択工程(例えば、電気泳動、 NAPカラム等)により除去し得る。 この手法の利点は、抽出mRNAを直接用い得ること、そして各断片は1回標 識されるべきで、標識化塩基が重合反応中に取り込まれる場合のように配列によ って何度も標識されるべきでない。 別の実施態様では、断片化DNAは、異なる酵素で異なる手法を用いて末端標 識され得る。ターミナルトランスフェラーゼは、標識され得るデオキシヌクレオ シドトリホスフェート(dNTP)を一本鎖DNAの3’OH端に付加する。一 本鎖dNTPは、修飾核酸が用いられる場合(例えばジデオキシヌクレオチドト リホスフェート)に付加されるか、又は所望により種々の塩基が付加される。D NAは、物理的(剪断)に又は酵素的(ヌクレアーゼ)に、あるいは化学的(例 えば、酸加水分解)に断片化される。断片化後、方法によっては、3’OH端は 生成する必要はない。次に、ターミナルトランスフェラーゼの存在下で標識化d NTP又はddNTPを用 いて、DNA断片を標識する。 本明細書中に提示した実施例及びそれらに関連した図面により、種々のその他 の実施態様を説明する。 C)シグナル−ノイズ比を改良するための試料の修飾 試料の複雑性を低減し、それによりバックグラウンドシグナルを減少させて、 測定感度を改良するために、高密度プローブアレイとのハイブリダイゼーション 前に、核酸試料を修飾する。一実施態様では、発現モニタリング法のための複雑 性低減は、バックグラウンドmRNAの選択的分解により達成される。これは、 試料mRNA(例えば、ポリA+RNA)を、発現モニタリングアレイ中のプロ ーブがハイブリダイズする領域を用いて特異的にハイブリダイズするDNAオリ ゴヌクレオチドのプールを用いてハイブリダイズすることにより成し遂げられる 。好ましい実施態様では、オリゴヌクレオチドのプールは、高密度アレイで見出 されるのと同じプローブオリゴヌクレオチドから成る。 オリゴヌクレオチドのプールは、多数の二本鎖化(ハイブリッド二重鎖)核酸 を形成する試料mRNAとハイブリダイズする。ハイブリダイズ化試料を次に、 一本鎖RNAを特異的に消化するヌクレアーゼであるRNアーゼAで処理する。 その後、プロテアーゼおよび/または市販のRNアーゼ阻害剤を用いて、RNア ーゼAを抑制し、次に二本鎖核酸を消化一本鎖RNAから分離する。この分離は 、当業者に十分公知の多数の方法で成し遂げられ、その例としては電気泳動及び 勾配遠心分離が挙げられるが、これらに限定されない。しかしながら、好ましい 実施態様では、ビーズに付着し、それにより核酸親和性カラムを形成するDNA オリゴヌクレオチドのプールが提供される。RNアーゼAで消化後、ハイブリッ ド二重鎖を変性し(例えば加熱により又は塩を増量することにより)、予めハイ ブリダイズされたmRNAを溶離緩衝液中で洗い落とすことにより、ハイブリダ イズ化DNAは簡単に除去される。 高密度アレイ又はその他の固体支持体中のプローブとハイブリダイズする未消 化mRNA断片は、次に、好ましくはRNAリガーゼを用いてRNAリンカーに 付着されたフルオロフォアで末端標識される。この手法は、アレイ中のプローブ に対応しない核酸が排除され、したがってバックグラウンドシグナルに関与する のに利用できない標識化試料RNAプールを生じる。 試料複雑性を低減する別の方法は、高密度アレイプローブが向けられる領域に いずれかの側で隣接する領域とハイブリダイズするデオキシオリゴヌクレオチド を用いてmRNAをハイブリダイズすることを包含する。RNアーゼHによる処 理は、二本鎖(ハイブリッド二重鎖)を選択的に消化して、デオキシオリゴヌク レオチドプローブにより以前に結合され、高電子密度アレイプローブの標的に対 応する短い領域(例えば20mer)に対応する一本鎖mRNAのプールを、及 び高密度アレイのプローブの標的間の領域に対応するより長いmRNA配列を残 す。次に、短いRNA断片を長い断片から分離し(例えば電気泳動により)、必 要な場合には上記のように標識して、次に高密度プローブアレイを用いてハイブ リダイゼーションのため用意する。 第三のアプローチでは、試料の複雑性低減は、特定の(予選択)mRNAメッ セージの選択的除去を包含する。特に、高電子密度アレイ中のプローブにより特 異的にプローブされない高度に発現されるmRNAメッセージは、好ましくは除 去される。このアプローチは、3’(ポリA)末端に近接する予選択メッセージ と特異的にハイブリダイズするオリゴヌクレオチドプローブを用いて、ポリA+ mRNAをハイブリダイズする工程を包含する。プローブは、高度 特異性及び低交差反応性を提供するように選択される。RNアーゼHによるハイ ブリダイズ化メッセージ/プローブ複合体の処理は、二本鎖領域を消化して、残 りのメッセージからポリA+を有効に除去する。次に、ポリA+RNAを特異的に 保持するか又は増幅する方法(例えば、オリゴdTカラム又は(dT)n磁気ビ ーズ)で、試料を処理する。このような方法は、それらがもはやポリA+尾部と 関連がないので、選択されたメッセージ(単数又は複数)を保持又は増幅しない 。これらの高度発現メッセージは試料から有効に除去されて、バックグラウンド mRNAの低減を示す試料を提供する。 IV.ハイブリダイゼーションアレイ設計 A)プローブ組成物 莫大な数のアレイ設計が本発明の実行に適している、と当業者は理解する。一 般的差異スクリーニングアレイは、例えば無作為、偶発的選択、又は恣意的プロ ーブ組を含む。あるいは、一般的差異スクリーニングアレイは、特定予選択長の 考え得るすべてのオリゴヌクレオチドを含む。逆に、その他の発現モニタリング アレイは、典型的には、その発現を検出すべき核酸(単数又は複数)と特異的に ハイブリダイズする多数のプローブを含む。好ましい実施態様では、アレイは1 つ又はそれ以上の対照プローブを含む。 1)被験プローブ その最も簡単な実施態様では、高密度アレイは、長さ5塩基以上、好ましくは 10塩基以上、そしていくつかは40塩基以上の「被験プローブ」(プローブオ リゴヌクレオチドとも呼ばれる)を包含する。いくつかの実施態様では、プロー ブは長さ50塩基未満である。いくつかの場合、これらのオリゴヌクレオチドは 長さ約5〜約45又は5〜約50ヌクレオチド、さらに好ましくは約10〜約4 0ヌクレオチド長、最も好ましくは約15〜約40ヌクレオチドの範囲である。 その他の特に好ましい実施態様では、プローブは長さ20又は25ヌクレオチド である。予選択発現モニタリングアレイでは、これらのプローブオリゴヌクレオ チドは、検出するためにそれらが設計される遺伝子の発現の特定のサブ配列と相 補的な配列を有する。したがって、被験プローブは、検出されるべき標的核酸と 特異的にハイブリダイズすることができる。 一般的差異スクリーニングのために設計された高密度オリゴヌクレオチドアレ イでは、プローブオリゴヌクレオチドは遺伝子の特定の予選択サブ配列とハイブ リダイズするために選択される必要がない。それと反対に、好ましい一般的差異 スクリーニングアレイは、配列が無作為、恣意的又は偶発的であるプローブオリ ゴヌクレオチドを包含する。あるいは、プローブオリゴヌクレオチドは、既定の 長さ(例えば、考え得るすべての4mer、考え得るすべての5mer、考え得 るすべての6mers、考え得るすべての7mers、考え得るすべての8me rs、考え得るすべての9mers、考え得るすべての10mers、考え得る すべての11mers及び考え得るすべての12mers等)のすべての考え得 るヌクレオチドを含む。 無作為オリゴヌクレオチドアレイは、特定の長さのヌクレオチド配列のプール が、その長さの考え得るすべての配列の集合から無作為(即ちブラインド、不偏 選択)に選択されるヌクレオチド配列のプールから有意に逸脱しないアレイであ る。 プローブオリゴヌクレオチドの恣意的又は偶発的ヌクレオチドアレイは、プロ ーブオリゴヌクレオチドが標的核酸を確認および/または予選択なしに選択され るアレイである。恣意的又は偶発的ヌクレオチドアレイは、近似するか又は無作 為でさえあるが、しかしな がら、それらが無作為の統計学的定義を満たすという保証はない。 アレイは、本明細書に記載したようなプローブ組成、および/またはプローブ の非重複性、および/またはコード配列偏向を基礎にしたいくつかのヌクレオチ ド選択を反映する。しかしながら、好ましい実施態様では、このような「偏向」 プローブ組は依然として、あらゆる特定の遺伝子に特異的であるよう選択されな い。 特定の長さの考え得るすべてのオリゴヌクレオチドを包含するアレイは、配列 の実質的にすべての順列に対応する配列を有するオリゴヌクレオチドを含有する アレイを示す。したがって、本発明のプローブオリゴヌクレオチドは、好ましく は4塩基まで(A、G、C、T)又は(A、G、C、U)あるいはこれらの塩基 の誘導体を含むため、長さXの考え得るすべてのヌクレオチドを有するアレイは 、実質的に4Xの異なる核酸(例えば2merに関しては16の異なる核酸、3 merに関しては64の異なる核酸、8merに関しては65536の異なる核 酸)を含有する。いくつかの少数の配列は、合成の問題、不注意な切断等のため に、特定の長さの考え得るすべてのヌクレオチドのプールからうかつに存在しな くなる、と考えられる。したがって、長さXの考え得るすべてのヌクレオチドを 包含するアレイは、長さXの考え得るヌクレオチドを実質的に有するアレイを示 す、と理解される。実質的に、長さXの考え得るすべてのヌクレオチドは、異な るヌクレオチドの考え得る数の90%以上、典型的には95%以上、好ましくは 98%以上、さらに好ましくは99%以上、そして最も好ましくは99.9%以 上を含む。 上記のプローブオリゴヌクレオチドは、定常ドメインをさらに含む。定常ドメ インは、実質的にすべてのプローブオリゴヌクレオチドに共通のヌクレオチドサ ブ配列である。特に好ましい定常ドメインは、基質に最も近いオリゴヌクレオチ ドプローブの末端に位置す る(即ち、リンカー/アンカー分子に付着する)。定常領域は、事実上あらゆる 配列を包含し得る。しかしながら、一実施態様では、定常領域は制限部位のセン ス又はアンチセンス鎖と相補的な配列又はサブ配列を包含する(制限エンドヌク レアーゼにより認識される核酸配列)。 定常ドメインは、アレイ上に新規に合成される。あるいは、定常領域が別個の 手法で調製されて、無傷でアレイに結合される。定常ドメインは別々に合成され て、次に無傷定常サブ配列が高密度アレイに結合されるため、無傷ドメインは事 実上あらゆる長さを取りうる。いくつかの定常ドメインは、長さが3ヌクレオチ ド〜約500ヌクレオチド、さらに典型的には約3ヌクレオチド〜約100ヌク レオチド、最も典型的には3ヌクレオチド〜約50ヌクレオチドの範囲である。 特定の実施態様では、定常ドメインは長さ3ヌクレオチド〜約45ヌクレオチド 、さらに好ましくは3ヌクレオチド〜約25ヌクレオチド、最も好ましくは3〜 約15、又は10ヌクレオチドの範囲でさえある。その他の実施態様では、好ま しい定常領域は、長さが約5ヌクレオチド〜約15ヌクレオチドの範囲である。 当該標的核酸(単数又は複数)を結合する被験プローブの他に、高密度アレイ は多数の対照プローブを含有し得る。対照プローブは、本明細書中に示した3つ の部類に分けられる:1)正規化対照;2)発現レベル対照;及び3)ミスマッ チ対照。 2)正規化対照 正規化対照は、核酸試料に付加される標識化参照オリゴヌクレオチドと完全に 相補的であるオリゴヌクレオチドプローブである。ハイブリダイゼーション後に 正規化対照から得られるシグナルは、ハイブリダイゼーション条件、標識強度、 「読み取り」効率、及び完全ハイブリダイゼーションのシグナルにアレイ間を変 えさせるその 他の因子の変異に関する対照を提供する。好ましい実施態様では、アレイ中のそ の他のすべてのプローブから読みとられるシグナル(例えば、蛍光強度)は対照 プローブからのシグナル(例えば、蛍光強度)により分けられて、それにより測 定を正規化する。 事実上、あらゆるプローブが正規化対照として役立つ。しかしながら、ハイブ リダイゼーション効率は塩基組成及びプローブ長に伴って変化する、と認識され る。好ましい正規化プローブは、アレイ中に存在するその他のプローブの平均長 を反映するよう選択されるが、しかしながらそれらは広範囲の長さを網羅するよ う選択され得る。正規化対照(単数又は複数)はさらに、アレイ中のその他のプ ローブの(平均)塩基組成を反映するよう選択されるが、しかしながら好ましい 実施態様では、1つだけ又は2〜3の正規化プローブが用いられ、それらは十分 にハイブリダイズし(即ち二次構造を示さず)、いかなる標的特異的プローブに もマッチしないよう選択される。 正規化プローブはアレイ中のあらゆる位置に、又はアレイ全体の多数の位置に 存在して、ハイブリダイゼーション効率の空間的変異を制御し得る。好ましい実 施態様では、正規化対照はアレイの隅又は縁、並びにその中間に位置する。 3)発現レベル対照 発現レベル対照は、生物学的試料中で構成的発現遺伝子と特異的にハイブリダ イズするプローブである。発現レベル対照は、細胞の全体的健康及び代謝活性を 制御するよう設計される。発現レベル対照と標的核酸の発現レベルとの共分散の 実験は、遺伝子の発現レベルの測定された変化又は変異がその遺伝子の転写率の 変化によるものか又は細胞の健康の一般的変異によるものかを示す。したがって 、例えば、細胞の健康状態が不十分であったりあるいは決定的な代 謝物質を欠く場合、活性標的遺伝子及び構成的発現遺伝子の両方の発現レベルが 低減すると予測される。この逆も言える。したがって、発現レベル対照と標的遺 伝子の両方の発現レベルがともに減少するかあるいはともに増大すると思われる 場合、その変化は全体としての細胞の代謝活性の変化に関与し、問題の標的遺伝 子の示差的発現には関与しない。逆に、標的遺伝子及び発現レベル対照の発現レ ベルが同時変化しない場合、標的遺伝子の発現レベルの変異はその遺伝子の調節 の差異に関与し、細胞の代謝活性の全体的変異には関与しない。 事実上すべての構成的発現遺伝子が発現レベル対照に適した標的を提供する。 典型的には、発現レベル対照プローブは構成的に発現される「ハウスキーピング 遺伝子」のサブ配列と相補的な配列を有し、その例としてはβ−アクチン遺伝子 、トランスフェリン受容体遺伝子、GAPDH遺伝子等が挙げられるが、これら に限定されない。 4)ミスマッチ対照 ミスマッチ対照は、標的遺伝子に対するプローブに対して、発現レベル対照に 対して又は正規化対照に対して提供される。ミスマッチ対照は、1つ又はそれ以 上のミスマッチ化塩基の存在を除いては、その対応する被験又は対照プローブと 同一のオリゴヌクレオチドプローブである。ミスマッチ塩基は、そうでなければ プローブが特異的にハイブリダイズする標的配列中の対応する塩基と相補的でな いように選択される塩基である。1つ又はそれ以上のミスマッチは、適切なハイ ブリダイゼーション条件(例えば、緊縮条件)下で被験又は対照プローブがその 標的配列とハイブリダイズすると予測されるが、しかしミスマッチプローブはハ イブリダイズしない(又は有意に少ない程度にハイブリダイズする)よう選択さ れる。好まし いミスマッチプローブは、中央ミスマッチを含有する。したがって、例えばプロ ーブが20merである場合、対応するミスマッチプローブは、位置6〜14の いずれか(中央ミスマッチ)の単一塩基ミスマッチ(例えば、1つのG、C又は Tを1つのAに置換する)を除いては、同一配列を有する。 「一般的」(例えば無作為、恣意的、偶発的等)アレイでは、標的核酸(単数 又は複数)は未知であるため、完全マッチ及びミスマッチプローブは先験的に確 定、設計又は選択され得ない。この場合、プローブは好ましくは対として提供さ れるが、ここで各対のプローブは1つ又はそれ以上の予選択ヌクレオチドが異な る。したがって、対のどちらのプローブが完全マッチであるかが先験的に分から ない一方、1つのプローブが特定の標的配列と特異的にハイブリダイズする場合 には、対の他方のプローブはその標的配列に対するミスマッチ対照として作用す ることが分かる。完全マッチ及びミスマッチプローブは対として提供される必要 はないが、しかし特定の予選択ヌクレオチドが互いに異なるプローブの大型集団 (例えば3、4、5又はそれ以上)として提供され得る、と理解される。 発現モニタリング及び一般的差異スクリーニングアレイの両方において、ミス マッチプローブは、プローブが相補的である標的以外の試料中の核酸との非特異 的結合又は交差ハイブリダイゼーションに対する対照を提供する。したがって、 ミスマッチプローブは、ハイブリダイゼーションが特異的か否かを示す。例えば 、相補的標的が存在する場合、完全マッチプローブは一貫してミスマッチプロー ブより明るいはずである。さらに、全中央ミスマッチが存在する場合には、ミス マッチプローブを用いて突然変異を検出し得る。最後に、完全マッチ及びミスマ ッチプローブ間の強度の差(I(PM)−I(MM))は、ハイブリダイズ化物 質の濃度の良好な測定値を 提供するということも、本発明の発見である。 5)試料調製/増幅/定量対照 高密度アレイはさらに、試料調製/増幅対照プローブを包含し得る。これらは 、通常は検定中の特定の生物学的試料の核酸中に生じないために、選択された対 照遺伝子のサブ配列と相補的であるプローブである。適切な試料調製/増幅対照 プローブとしては、例えば当該試料が真核生物からの生物である場合、最近遺伝 子に対するプローブ(例えばBio B)が挙げられる。 RNAを、プロセッシング前に試料調製/増幅対照プローブが向けられる公知 量の核酸でスパイクする。次に試料調製/増幅対照プローブのハイブリダイゼー ションの定量は、プロセッシング工程(例えばPCR、逆転写、in vitro転写等 )により引き起こされる核酸の存在量の変化の測定値を提供する。 定量対照は同様である。典型的には、それらはハイブリダイゼーション前に公 知量で試料核酸(単数又は複数)と組合される。それらは、定量参照を提供し、 ハイブリダイゼーション量(濃度)を定量するための標準曲線を確定させるのに 結うようである。 B)プローブ選択及び最適化 i)一般的差異スクリーニングアレイ a)無想定プローブ選択 上記で説明したように、一般的差異スクリーニングアレイのためのプローブオ リゴヌクレオチド選択は、無作為、恣意的、偶発的組成偏向であり、あるいは特 定長の考え得るすべてのオリゴヌクレオチドを含む。したがって、プローブ選択 は、本質的には想定できない。しかしながら、いくつかの実施態様では、特定の オリゴヌクレオチドはアレイから、又は分析から除外される。例えば、回文構造 配列を含有するプローブ又は全てA、C、G、Tなどである長い一 続きを含有するプローブは除外される。除外するプローブは、単一アレイを同一 試料と何回もハイブリダイズすることにより、および/またはアレイの異なるコ ピーを同一試料とハイブリダイズすることにより、同定し得る。同一試料に対す るハイブリダイゼーション強度が許容不可能な変異(特定閾値以上の変異)を示 すプローブは除外される(アレイ構築において又は単一分析において)。プロー ブが除外される変異レベルは、検定の所望の感度の一関数である。より高感度の 検定を所望するほど、設定される除外閾値は低くなる。好ましい実施態様では、 ハイブリダイゼーション強度の変異がバックグラウンドの2倍を超え、相対変異 が50%以上を示す場合に、プローブは除外される。 あるいは、このような除外は、被験核酸試料と参照核酸試料との間の差異が参 照核酸試料とそれ自体との間の差異と比較される場合、示差的にハイブリダイズ する配列の選択的同定に固有のものである。これは、以下のIX(B)節でさら に詳細に記載する。 b)コドン縮重の利用 別の実施態様では、種特異的コドン使用を利用して、考え得るすべての配列と ハイブリダイズするのに必要なプローブオリゴヌクレオチドの数を増大すること なく、より長い(故により特異的且つ安定な)プローブを利用し得る。アミノ酸 コドンはそれらのコドンの第一及び第二位置に保存されるが、一方第三位置は高 度に冗長である。さらに、各々の種又は生物はいかなる特定のアミノ酸をコード するにも特定のコドンを好む。特定の種における特定のアミノ酸に対する好まし いコドンは、その種に関して最高頻度で用いられるコドンである。コドンの好み は、当業者には十分公知である。それらは、特定生物又は種のヌクレオチド配列 の簡単な頻度分析により容易に確定される。 同様に、特定の生物又は種のジ−、トリ−、テトラヌクレオチド頻度偏向を用 いて、「組成偏向」一般的差異スクリーニングアレイに用いられるオリゴヌクレ オチドプローブの選択を計量し得る。 好ましい一実施態様では、各コドンの最初の2つのヌクレオチドは固定されて いるが三番目のヌクレオチドは変えられる(4方向ゆらぎを用いて、あるいはイ ノシン又はその他の非特異的ハイブリダイズ塩基を用いて)プローブオリゴヌク レオチドが調製される。好ましい実施態様では、プローブの各コドンは以下の一 般式を有する 3’−X1−X2−I−5’ (式中、Iはイノシン又は4方向ゆらぎであり、X1及びX2は、特定種に対する 好ましいコドン使用にしたがって選択されるA、G、C、T/Uである)。した がって、例えば特定の種のすべての核酸と実質的にハイブリダイズする16me rのアレイが調製され得るが、この場合、プローブは次式: 支持体−I1−X234−X567−X8910−X111213−X141 516−3’ を有し、410個の異なるプローブオリゴヌクレオチドのみを有する。個のプロー ブに関する適切なコドンを表1に示す。 表1.一般的コード配列16merプローブオリゴヌクレオチドに対する好ま しい配列(アミノ酸コドン(遺伝子コード)の標準表より) プローブの親和性は、付加的イノシン(又は4方向、3方向又は2方向ゆらぎ 、あるいはその他の一般的塩基)をオリゴヌクレオチドプローブの3’及び5’ 末端に含入することにより、さらに増強される。これらのコドン使用偏向プロー ブをリガーゼ識別といっしょに用いて、獲得可能な配列情報をさらに増強し得る 。したがって、例えば上記の16merを包含するアレイとのハイブリダイゼー ションがさらに、その配列が公知の、1つ又はそれ以上の連結可能な固定長Nの オリゴヌクレオチドとの連結を含む場合には、各々の 連結が首尾よく行けば、16+Nヌクレオチドの配列情報が提供される。 ii)発現モニタリングアレイ 好ましい実施態様では、発現モニタリング高密度アレイ中のオリゴヌクレオチ ドプローブは、用いられる特定のハイブリダイゼーション条件下で最小非特異的 結合又は交差ハイブリダイゼーションを用いて、それらが向けられる核酸標的と 特異的に結合するよう選択される。本発明の高密度アレイは1,000,000 の異なるプローブを余分に含有するため、特定の核酸配列と結合する特徴的長さ を有するすべてのプローブを提供することができる。したがって、例えば高密度 アレイは、IL−2mRNAと相補的な考え得るすべての20mer配列を含有 し得る。 しかしながら、IL−2mRNAに独特ではない20merサブ配列が存在す る。これらのサブ配列に向けられるプローブは、試料ゲノムの他の領域における それらの相補的配列の生成物と交差ハイブリダイズすると予測される。同様に、 その他のプローブは簡単に、ハイブリダイゼーション条件下で(例えば、二次構 造、あるいは基質又は他のプローブとの相互作用により)、効率よくハイブリダ イズするわけではない。したがって、好ましい実施態様では、このような不十分 な特異性又はハイブリダイゼーション効率を示すプローブが確認され、そして高 密度アレイそれ自体の中で(例えば、アレイの作製中に)あるいはハイブリダイ ゼーション後データ分析では含まれない。 さらに、好ましい実施態様では、発現モニタリングアレイを用いて、数百塩基 対長又はそれ以上長い遺伝子の存在及び発現(転写)レベルを確認し得る。ほと んどの適用のために、数千〜十万個の遺伝子の存在、非存在又は発現レベルを確 認するのは有用である。ア レイ当たりのオリゴヌクレオチド数は限定されているため、好ましい実施態様で は、発現が検出さるべき各遺伝子に特異的な限定組の遺伝子のみを含有するのが 望ましい。 a)ハイブリダイゼーション及び交差ハイブリダイゼーションデータ したがって、一実施態様において、本発明は、特定遺伝子の検出のためのプロ ーブ組を最適化する方法を提供する。一般に、本方法は、標的遺伝子により転写 されるmRNAのサブ配列と相補的である1つ又はそれ以上の特定の長さの多数 のプローブを含有する高密度アレイを提供することを含む。一実施態様では、高 密度アレイは、特定のmRNAと相補的である特定長のすべてのプローブを含有 し得る。高密度アレイのプローブを次にそれらの標的核酸単独とハイブリダイゼ ーションし、次にプローブと相補的な標的を含有しない高複雑性、高濃度核酸試 料とハイブリダイズする。したがって、例えば標的核酸がRNAである場合、プ ローブを先ずそれらの標的核酸単独とハイブリダイズし、次にcDNAライブラ リーから作られるRNA(例えば、逆転写ポリA+mRNA)を用いてハイブリ ダイズするが、この場合、ハイブリダイズ化RNAのセンスは標的核酸とは反対 である(高い複雑性のサンプルがプローブのための標的を含有しないことを確実 にするため)。それらの標的との強力なハイブリダイゼーションシグナルを示し 、高複雑性試料とは低交差ハイブリダイゼーションを示すか又は全く示さないプ ローブは、本発明の高密度アレイに用いるのに好ましいプローブである。 高密度アレイはさらに、試験される各プローブに対するミスマッチ対照を含有 する。好ましい実施態様では、ミスマッチ対照は中央ミスマッチを含有する。ミ スマッチ対照と標的プローブの両方が高レベルのハイブリダイゼーション(例え ば、ミスマッチとのハイブ リダイゼーションが対応する被験プローブとのハイブリダイゼーションとほぼ等 しいかそれ以上である)を示す場合、被験プローブは、好ましくは高密度アレイ には用いられない。 特に好ましい実施態様では、最適プローブは以下の方法にしたがって選択され る:先ず、上記のように、標的核酸のサブ配列と相補的な多数のオリゴヌクレオ チドプローブを含有するアレイが提供される。オリゴヌクレオチドプローブは、 単一長であるか又は種々の長さの一続きである。高密度アレイは、特定のmRN Aと相補的な特定長のすべてのプローブを含有し得るか、又は特定のmRNAの 種々の領域から選択されるプローブを含有し得る。各々の標的特異的プローブに 関しては、アレイはさらにミスマッチ対照プローブ、好ましくは中央ミスマッチ 対照プローブを含有する。 オリゴヌクレオチドアレイは、オリゴヌクレオチドプローブと相補的なサブ配 列を有する標的核酸を含有する試料とハイブリダイズされ、そして各プローブと そのミスマッチ対照との間のハイブリダイゼーション強度の差が確定される。プ ローブとそのミスマッチ対照との間の差が閾値ハイブリダイゼーション強度(例 えば、好ましくはバックグラウンドシグナル強度の10%以上、さらに好ましく は20%以上、最も好ましくは50%以上)を越えるプローブだけが選択される 。したがって、それらのミスマッチ対照に比して強いシグナルを示すプローブだ けが選択される。 プローブ最適化手順は、第二回目の選択を任意に包含し得る。個の選択におい ては、オリゴヌクレオチドプローブはプローブと相補的な配列を含有すると予測 されない核酸試料を用いてハイブリダイズされる。したがって、例えばプローブ がRNAセンス鎖と相補的である場合、アンチセンスRNAの試料が提供される 。もちろん、特定の遺伝子を欠くことが公知の、あるいは特定遺伝子を発現しな いことが公知の生物又は細胞株からの試料のような、その他の試料も提供され得 る。 プローブ及びそのミスマッチ対照の両方が閾値以下(例えば、バックグラウン ドシグナル強度の約5倍未満、好ましくは約2倍以下、さらに好ましくは約1倍 以下、最も好ましくは約半分以下)のハイブリダイゼーション強度を示すプロー ブだけが、選択される。この方法では、最小非特異的結合を示すプローブが選択 される。最後に、好ましい実施態様では、両方の選択基準に合格し、各標的遺伝 子に対して最高のハイブリダイゼーション強度を有するn個のプローブ(nは各 標的遺伝子に望ましいプローブの数である)がアレイに組み込まれるために選択 されるか、あるいはアレイ中にすでに存在する場合には、サブ配列データ分析の ために選択される。もちろん、当業者は、両選択基準がプローブの選択のために 単独で用いられる、と理解する。 b)発見的規則 上記のようにして得られたハイブリダイゼーション及び交差ハイブリダイゼー ションデータを用いて、ハイブリダイゼーション及び交差ハイブリダイゼーショ ン強度対種々のプローブ特性、例えば8塩基のウインドウ中のAの数、Cの数、 回文構造的強度等についてのグラフを作成し得る。次に、それらの特性とハイブ リダイゼーション又は交差ハイブリダイゼーション強度との間の相関に関して、 グラフを検査する。それを超えるとハイブリダイゼーションが常に不十分である か、又は交差ハイブリダイゼーションが常に非常に強力である閾値を設定する。 あらゆるプローブが判定基準の一つを満たせば、それはプローブ組から除外され 、したがって、チップ上に置かれない。これは、発見的規則法と呼ばれる。 この方法で20merプローブに関して展開される一組の規則q を以下に示す: ハイブリダイゼーション規則: 1)Aの数が9未満である。 2)Tの数が10未満且つ0より大きい。 3)A、G又はTの最大ランが1行中4塩基未満である。 4)任意の2つの塩基の最大ランが11塩基未満である。 5)回文構造スコアが6未満である。 6)群生スコアが6未満である。 7)Aの数+Tの数が14未満である。 8)Aの数+Gの数が15未満である。 規則第4に関しては、任意の2つの塩基の最大ランに必要なのが11塩基未満 であることが、少なくとも3つの異なる塩基が任意の12連続ヌクレオチド内に 生じることを保証する。回文構造スコアは、オリゴヌクレオチドが自己相補性を 最大にする点で折り畳み終わる場合には、相補的塩基の最大数である。したがっ て、例えば完全に自己相補的である20merは回文構造スコアが10である。 群生スコアは既定の配列中の3merの同一塩基の最大数である。したがって、 例えば5つの同一塩基のランは群生スコア3となる(塩基1〜3,塩基2〜4及 び塩基3〜5)。 任意のプローブがこれらの判定基準(1〜8)を満たす場合、そのプローブは チップ上に置かれるプローブの小集団の成員ではなかった。例えば、仮定上のプ ローブが5’−AGCTTTTTTCATGCATCTAT−3’であるとする と、それは4又はそれ以上の塩基のラン(即ち6のラン)を有するため、チップ 上で合成されない。 20merに関して展開される交差ハイブリダイゼーション規則を以下に示す : 1)Cの数が8未満である。 2)8塩基の任意のウインドウ内のCの数が4未満である。 したがって、任意のプローブがハイブリダイゼーション規則(1〜8)又は交 差ハイブリダイゼーション規則(1〜2)を満たす場合、そのプローブはチップ 上に置かれるプローブの小集団の成員ではなかった。これらの規則は、協力に交 差ハイブリダイズする、又は低ハイブリダイゼーションを示す多数のプローブを 除外し、弱度にハイブリダイズ中のプローブを除外するという中等度の仕事を実 行した。 これらの発見的規則は、手動計算により実行されるか、あるいはそれらは下記 のXII節に記載したようなソフトウエアで実行される。 c)ニューラルネット 別の実施態様では、ニューラルネットを訓練して、プローブの配列又はその他 のプローブ特性を基礎にしてハイブリダイゼーション及び交差ハイブリダイゼー ションを予測し得る。その場合、ニューラルネットを用いて、任意数の「最良」 プローブを選び取る。このようなニューラルネットの一つは、20merプロー ブを選択するために開発された。このニューラルネットは、予測強度と測定強度 との間に中等度(0.7)の相関を生じ、ハイブリダイゼーションよりも交差ハ イブリダイゼーションに関してより良好なモデルを示す。このニューラルネット の詳細は、実施例6に提示される。 d)ANOVAモデル 変異の分析(ANOVA)モデルを構築して、構成的塩基対の一を基礎にして 強度を模する。これは、融解エネルギーが連続した塩基のスタッキングエネルギ ーを基礎にしているという理論に基づく。ANOVAモデルを用いて、プローブ 配列とハイブリダイゼーシ ョン及び交差ハイブリダイゼーション強度との間の相関が見出された。入力は、 連続塩基対に分解されるプローブ配列であった。一モデルを作成して、ハイブリ ダイゼーションを、別のモデルで交差ハイブリダイゼーションを予測した。出力 はハイブリダイゼーション又は交差ハイブリダイゼーション強度であった。 考え得る2塩基の組合せが14、そして組合せが見出される位置が19で、そ れらで構成される304(19*16)の考え得る入力が存在した。例えば、配 列aggctga…は、最初の位置に「ag」を、第二の位置に「gg」を、第 三の位置に「gc」を、第四の位置に「ct」を、…と、有する。 その結果生じるモデルは、出力強度の成分を考え得る入力の各々に割り当て、 そのようにして既定配列に関する強度を概算するために、その19の成分の各々 に関する強度を単純に加える。 e)同様のプローブの削除(除去) 発現チップ中のプールシグナルの原因の一つは、モニタリング中の遺伝子以外 の遺伝子がモニタリング中の配列の一部と非常によく似た配列を有することであ る。これを解決する最も簡単な方法は、一遺伝子より以上よく似たプローブを除 去することである。したがって、好ましい実施態様では、一遺伝子異常の転写生 成物とハイブリダイゼーションするプローブを除去(削減)するのが望ましい。 最も簡単な削減方法は、モニタリング中の生物に関するすべての公知の遺伝子 を有する提議されたプローブを一列に並べることである。例えば、ある生物の遺 伝子1に対するプローブ及びある生物の遺伝子2を以下に示すと: は、この列中に8つのマッチング塩基を有するが、以下の列中では マッチング塩基は20である: 挿入又は欠失ミスマッチの検出を可能にするさらに複雑な算法もある。このよ うな配列整列算法は、当業者には十分公知であり、その例としてはBLAST又 はFASTA、あるいは定義の項に上記したようなその他の遺伝子マッチングプ ログラムが挙げられるが、これらに限定されない。 生物が非常によく似た多数の異なる遺伝子を有する場合には、非常によく似た 遺伝子の一つだけの濃度を測定するようプローブ設定させるのは難しい。その場 合、似ていない任意のプローブを切り取り、その族の遺伝子に対するプローブ組 をプローブに設定させ得る。 f)合成周期削減 チップ用マスクを削減するためのコストは、合成周期の数にほぼ線状に関連す る。正常組の遺伝子においては、あらゆるプローブが構築に専心する周期の数の 分布は、ガウス分布に近似する。このため、マスクコストは一般に、プローブの 約3%を投げ捨てることにより、15%低減される。好ましい実施態様では、合 成周期削減は、特定対象高密度オリゴヌクレオチドアレイの調製のために選択さ れる合成周期の最大数より多い合成周期数を要するプローブを排除する(含まな い)ことを、単に包含する。プローブの典型的合成は、記入された塩基の規則的 パターン(acgtacgtacgt…)に従うため、プローブの構築に必要な 合成工程数の計数は容易である。表1に示した一覧は、プローブが必要な合成周 期数を計数するための典型的コードを提供する。 表1.プローブの化学合成に必要な合成周期を計数するための典型的コードg)選択法の組合せ 発見的規則、ニューラルネット及びannovaモデルは、遺伝子の発 現をモニタリングするためのプローブの数を削減又は低減する方法を提供する。 これらの方法は必ずしも同一結果を生じないか、あるいは完全に独立した結果を 生じるので、方法を組合せるのに有益である。例えば、1つ以上(例えば3つの うち2つ)の方法がプローブが良好な結果を生じるとは思えないと示す場合には 、プローブは削減又は低減される。次に、合成サイクル削減が実行されて、コス トが低減される。 図11は、プローブの数が低減又は削減された後に遺伝子の発現をモニタリン グするためにプローブの数を増大する工程のフローを示す。一実施態様では、ユ ーザーは、各遺伝子の発現をモニタリングするためにチップ上に置くべき核酸プ ローブの数を特定できる。上記のように、良好な結果を生じるとは思えないプロ ーブを低減するのは有益である。しかしながら、プローブの数は、実質的にプロ ーブの所望の数より少なく低減し得る。 工程402では、多数遺伝子をモニタリングするためのプローブの数が、発見 的規則法、ニューラルネット、annovaモデル、合成周期削減、又は任意のその他 の方法、あるいはそれらの組合せにより低減される。遺伝子は、工程404で選 択される。 選択遺伝子をモニタリングするための残りのプローブがプローブの所望数の8 0%以上(変わることもあるし、ユーザーが限定することもある)であるか否か の確定がなされる。イエスの場合には、コンピューターシステムは、工程408 で次の遺伝子に進むが、これは一般的に工程404に戻る。 選択遺伝子をモニタリングするための残りのプローブがプローブの所望数の8 0%以上の数値とならない場合には、選択遺伝子をモニタリングするための残り のプローブがプローブの所望数の40%以上(変わることもあるし、ユーザーが 限定することもある)であ るか否かの確定がなされる。イエスの場合には、工程412で、削減後に、プロ ーブが不完全であったことを示すために、遺伝子名の後ろに「i」が添付される 。 工程414では、プローブを除去した束縛を弛めることにより、プローブの数 が増大される。。例えば、発見的規則の閾値は、1だけ増大される。したがって 、プローブが予め除去された場合、それらは1行に4個のAを有したならば、規 則は弛められて、1行に5個のAとなる。 次に、工程416で、選択遺伝子をモニタリングするための残りのプローブが プローブの所望数の80%以上であるか否かの確定がなされる。イエスの場合に は、工程412で、遺伝子名の後ろに「r」が添付されて、規則が弛められてそ の遺伝子のための合成プローブの数を生じたことを示す。 工程420では、選択遺伝子をモニタリングするためのプローブが1つ又は2 つの他の遺伝子と相反するだけであるか否かを見るためのチェックがなされる。 イエスの場合、工程422で、遺伝子(又は標的配列)と相補的な全組のプロー ブが選び取られ、専らプローブの残りが選択遺伝子と正確に相補的であるように 、削減される。 次に、工程424で、選択遺伝子をモニタリングするための残りのプローブが プローブの所望数の80%以上であるか否かの確定がなされる。イエスの場合に は、工程426で、遺伝子名の後ろに「s」が添付されて、2〜3の遺伝子だけ が選択遺伝子と同様であったことを示す。 工程428では、選択遺伝子をモニタリングするためのプローブは不一致によ り全く低減されない。次に、工程430で、選択遺伝子をモニタリングするため の残りのプローブがプローブの所望数の 80%以上であるか否かの確定がなされる。イエスの場合には、工程432で、 遺伝子名の後ろに「f」が添付されて、プローブが遺伝子と完全に相補的な全族 のプローブを包含することを示す。 プローブの所望数の80%が依然として存在しない場合には、工程434でエ ラーが報告される。任意数のエラー処理手続きが着手される。例えば、ユーザー に対してエラーメッセージが出され、遺伝子に対するプローブが保存されない。 あるいは、ユーザーは新規の所望数のプローブを入れるよう促される。 V.高密度アレイの合成 最小数の合成工程を用いて、オリゴヌクレオチド、ペプチド及びその他のポリ マー配列の高密度アレイを形成する方法は公知である。オリゴヌクレオチド類似 体アレイは、光指示化学カップリング、及び機械的指示カップリングを含めた、 しかしこれらに限定されない種々の方法により、固体基質上に合成される(Pirr ung et al.,米国特許第5,143,854号(さらにPCT公開WO 90/ 15070参照)及びFodor et al.,PCT公開WO92/10092及びWO 93/09668参照)(これらは、例えば光指示合成技術を用いるペプチド 、オリゴヌクレオチド及びその他の分子の巨大アレイを生成する方法を開示する )(Fodor et al.,Science,251,767-77(1991)も参照)。ポリマーアレイの 合成のためのこれらの手法は、VLSIPSTM法と現在呼ばれている。VLSI PSTMアプローチを用いて、ポリマーのヘテロアレイを、多数の反応部位での同 時カップリングを介して、異なるヘテロアレイに変換する(米国特許第07/7 96,243号及び第07/980,523号参照)。 上記の米国特許第5,143,854号及びPCT公開WO 90/1507 0及び92/10092に記載されたようなVLSI PSTM法の開発は、組合せ合成及び組合せライブラリーのスクリーニングの分野 における草分け的技術であると考えられる。さらに近年、特許出願第08/08 2,937号(1993年6月25日提出)は、標的核酸の部分的又は完全配列 をチェックし又は確定するために、そして特異的オリゴヌクレオチド配列を含有 する核酸の存在を検出するために用い得るオリゴヌクレオチドプローブのアレイ の製造方法を記載する。 要するに、ガラス表面でのオリゴヌクレオチドアレイの光指示組合せ合成は、 自動アミドリン酸塩化学及びチップ製造技術を用いて進行する。特異的一実行で は、ガラス表面は、光不安定性保護基により遮断される官能基、例えばヒドロキ シル又はアミン基を含有するシラン試薬で誘導される。写真平板マスクを介した 光分解を用いて、官能基を選択的に曝露すると、これは次に流入する5’−光保 護化ヌクレオシドアミドリン酸塩との反応が容易になる。アミドリン酸塩は照ら される(したがって、光不安定性遮断基の除去により曝露される)部位だけと反 応する。したがって、アミドリン酸塩は、先行工程から選択的に曝露される領域 に付加するだけである。これらの工程は、配列の所望のアレイが固体表面で合成 されるまで、反復される。アレイ上の異なる位置での異なるオリゴヌクレオチド 類似体の組合せ合成は、合成中の照明のパターン及びカップリング試薬の付加順 序により確定される。 ポリアミド主鎖を有するオリゴヌクレオチド類似体がVLSIPSTM法に用い られる場合には、モノマーがリン酸結合を介して互いに付着しないため、アミド リン酸塩化学を用いて合成工程を実行するのは一般的に不適切である。その代わ りに、ペプチド合成法が用いられる(例えば、Pirrung et al.,米国特許第5, 143,854号参照)。 ペプチド核酸は、例えばBiosearch,Inc.(Bedford,MA)から市販されてお り、これはポリアミド主鎖と、天然ヌクレオシド中に見出される塩基を包含する 。ペプチド核酸は高特異性を有する核酸と結合可能で、本開示のための「オリゴ ヌクレオチド類似体」と考えられる。 前記の他に、単一基質上でオリゴヌクレオチドのアレイを生成するために用い られる別の方法は、同時係属中の出願第07/980,523号(1992年1 1月20日提出)及び07/796,243(1991年11月22日提出)、 並びにPCT公開WO 93/09668に記載されている。これらの出願に開 示された方法では、試薬は、(1)予定領域上に限定されたチャネル内をフロー イングするか、又は(2)予定領域に「スポッティング」することにより基質に 供給される。しかしながら、その他のアプローチ、並びにスポッティングとフロ ーイングの組合せが用いられる。各々の場合、基質のある活性化領域は、モノマ ー溶液が種々の反応部位に供給されると、他の領域から機械的に分離される。 本発明の化合物及びライブラリーに適用される典型的「フローチャネル」法は 一般的に、下記のように説明される。異なるポリマー配列は、適切な試薬が流れ るか又は適切な試薬が置かれる基質の表面のフローチャネルを形成することによ り、基質又は固体支持体の選択領域で合成される。例えば、モノマー「A」が選 択領域の最初の基で基質に結合されると仮定する。必要な場合には、選択領域の 全部又は一部の基質の表面の全部又は一部は、例えば適切な試薬をチャネルの全 部又はいくつかを通してフローイングすることにより、又は適切な試薬で全基質 を洗浄することにより、結合のために活性化される。基質の表面にチャネルブロ ックを配置後、モノマーAを有する試薬をチャネル全部又はチャネルのいくつか を通して流す か、又はそこに置く。チャネルは、第一選択領域に液体を接触させ、それにより 第一選択領域中で直接的に又は間接的(空間を介して)に基質上のモノマーAを 結合する。 その後、モノマーBが、そのいくつかが第一選択領域に含まれる第二選択領域 にカップリングされる。第二選択領域は、液体中で、基質表面のチャネルブロッ クの翻訳、回転又は置換中、あるいは化学物質又は光硬化性樹脂の層の沈着中、 第二フローチャネルと接触する。必要な場合は、少なくとも第二領域を活性化す るために工程を実行する。その後、モノマーBを第二フローチャネルに通すかそ の中に置き、第二選択一でモノマーBを結合させる。この特定の例では、その結 果生じるプロセッシングのこの段階で基質に結合される配列は、例えばA、B及 びABである。工程を反復して、基質上の公知の位置で所望の長さの配列の巨大 なアレイを形成する。 基質が活性化された後、モノマーAはいくつかのチャネルを通って流され、モ ノマーBは他のチャネルを通って流され、モノマーCはさらに別のチャネルを通 って流される。この方法で、チャネルブロックが動かされねばならないか、又は 基質が洗浄および/または再活性化されねばならない前に、多数の又はすべての 反応領域がモノマーと反応する。多数の又はすべての利用可能な反応領域を同時 に使用させることにより、洗浄及び活性化工程の数が最小限にされ得る。 チャネルを形成するか、そうでなければ基質の表面の一部を保護する代替的方 法がある、と当業者は認識する。例えば、いくつかの実施態様によれば、保護コ ーティング、例えば親水性又は疎水性コーティング(溶媒の性質によって)を、 時には他の領域の反応体溶液により湿潤を促進する物質と組合せて、保護すべき 基質の部分に用いる。このように、流動溶液はさらに、それらの設計された流動 経路の外側を通るのを防止される。 その他の実施態様によれば、半導体産業に広範に用いられるような電子又は光 硬化性樹脂を沈着させることにより、チャネルが形成される。このような物質と しては、ポリメチルメタクリレート(PMMA)及びその誘導体、並びに電子ビ ームレジスト、例えばポリ(オレフィン スルホン)等が挙げられる(Chapter 10 of Ghandi,VLSI Fabrication Principles,Wiley(1983)にさらに詳細に説 明されている)。これらの実施態様によれば、レジストが沈着され、選択的に曝 露され、そして食刻されて、カップリングのために曝露された基質の一部を残す 。レジストを沈着し、選択的にレジストを除去し、そしてモノマーカップリング するこれらの工程を反復して、所望の場所に所望の配列のポリマーを生成する。 本発明の化合物及びライブラリーを調製する「スポッティング」法は、フロー チャネル法と同様の方法で実行し得る。例えば、モノマーA、又は結合物質、あ るいは二量体又は三量体又は四量体等、あるいは完全合成物質は、適切に活性化 された反応領域の最初の基に供給され、そしてそれと結合し得る。モノマーBは 、活性化反応領域の第二の基に供給されて、それと反応する。上記のフローチャ ネル実施態様とは異なり、反応体は相対的に少量が選択領域中に直接沈着される (流すのではなく)ことにより供給される。いくつかの工程では、もちろん、全 基質表面が噴霧されるか、そうでなければ溶液で被覆される。好ましい実施態様 では、ディスペンサーが領域から領域に動いて、各停止時に必要な量だけモノマ ーを沈着する。典型的ディスペンサーとしては、モノマー溶液を基質及びロボッ トシステムに供給して基質に関してマイクロピペットの位置を制御するためのマ イクロピペットが挙げられる。その他の実施態様では、ディスペンサーとしては 、種々の試薬が反応領域に同時に供給さ れるような、一連の試験管、多岐管、ピペットのアレイ等が挙げられる。 VI.ハイブリダイゼーション 核酸ハイブリダイゼーションは、単に、プローブ及びその相補的標的が相補的 塩基対合により安定ハイブリッド二重鎖を形成し得る条件下で、変性プローブ及 び標的核酸を提供することから成る。ハイブリッド二重鎖を形成しない核酸をそ の後洗い流して、典型的には付着した検出可能な標識の検出により検出されるハ イブリダイズ化核酸を残す。核酸は、温度を上げることにより、又は核酸を含有 する緩衝液の塩濃度を低下させることにより、あるいは化学物質の付加時に、あ るいはpHを上げることにより変性される、と一般的に認識される。低緊縮条件 (例えば、低温および/または高塩濃度および/または高標的濃度)下では、ハ イブリッド二重鎖(例えばDNA:DNA、RNA:RNA又はRNA:DNA )は、アニール化配列が完全には相補的でない場合でさえ、生成する。したがっ て、ハイブリダイゼーションの特異性は、低緊縮性で低減される。逆に、高緊縮 性(例えば、高温又は低塩濃度)であるほど、低ミスマッチでハイブリダイゼー ションがうまく行く。 あらゆる程度の緊縮性を提供するよう、ハイブリダイゼーション条件は選択さ れる、と当業者は理解する。好ましい実施態様では、ハイブリダイゼーションは 低温で実行され、この場合、6xSSPE−T中で約40℃〜約50℃(0.0 05%TritonX−100)で、ハイブリダイゼーションが保証され、次に 、高緊縮性(例えば、37℃で1xSSPE−T)で洗浄を実行して、ミスマッ チハイブリッド二重鎖を除去する。所望のレベルのハイブリダイゼーション特異 性が得られるまで、漸増的高緊縮性(例えば、37℃〜50℃で0.25xSS PE−Tという低濃度に下げて)で連続 洗浄を実行する。緊縮性は、例えばホルムアミドのような薬剤を付加することに より、増大し得る。ハイブリダイゼーション特異性は、被験プローブのハイブリ ダイゼーションと存在し得る種々の対照(例えば発現レベル対照、正規化対照、 ミスマッチ対照等)のハイブリダイゼーションとを比較することにより、評価し 得る。 概して、ハイブリダイゼーション特異性(緊縮性)とシグナル強度との間には トレードオフが存在する。したがって、好ましい実施態様では、洗浄は、一貫し た結果を生じ、バックグラウンド強度の約10%以上のシグナル強度を提供する 最高緊縮性で実行される。したがって、好ましい実施態様では、ハイブリダイズ 化アレイは連続的に高緊縮性溶液で洗浄され、各洗浄間で読みとられる。このよ うにして生じたデータ組の分析により、それを超えるとハイブリダイゼーション パターンが評価できるほど変化し、当該する特定のオリゴヌクレオチドプローブ に適切なシグナルを提供する洗浄緊縮性が明示される。 好ましい実施態様では、非特異的結合を低減するためのハイブリダイゼーショ ン中に洗剤(例えば、C−TAB)又は遮断試薬(例えば、精子DNA、cot −1 DNA等)を使用することにより、バックグラウンドシグナルは低減され る。特に好ましい実施態様では、ハイブリダイゼーションは、約0.1〜約0. 5mg/mlDNA(例えば、ニシン精子DNA)の存在下で実行される。ハイ ブリダイゼーションに遮断剤を使用することは、当業者には十分公知である(例 えば、Chapter 8 in P.Tijssen上記、参照)。 RNA又はDNA間に形成される二重鎖の安定性は、一般的に、溶液中で、R NA:RNA>RNA:DNA>DNA:DNAの順である。長いプローブは標 的との良好な二重鎖安定性を有するが、短いプローブよりミスマッチ識別が不十 分である(ミスマッチ識別 とは、完全マッチプローブと単一塩基ミスマッチプローブとの間の測定ハイブリ ダイゼーションシグナル比を示す)。短いプローブ(例えば8mer)ほどミス マッチを非常によく識別するが、全体的二重鎖安定性は低い。 例えば、公知のオリゴヌクレオチド類似体を用いて標的とプローブとの間に形 成される二重鎖の熱安定性(Tm)を変えると、二重鎖安定性及びミスマッチ識 別が最適化される。Tm変更の有用な一局面は、アデニン−チミン(A−T)二 重鎖がグアニン−シトシン(G−C)二重鎖より低Tmを有するという事実から 生じるが、これは一部はA−T二重鎖が塩基対当たり2つの水素結合を有するが 、一方G−C二重鎖は塩基対当たり3つの水素結合を有するためである。塩基の 不均一分布が認められるヘテロオリゴヌクレオチドアレイでは、各々のオリゴヌ クレオチドプローブに対するハイブリダイゼーションを同時に最適化することは 、一般的にできない。したがって、いくつかの実施態様では、G−C二重鎖を選 択的に脱安定化し、および/またはA−T二重鎖の安定性を増大するのが望まし い。これは、例えばG−C二重鎖を形成するアレイのプローブ中のグアニン残基 をヒポキサンチンと置換することにより、又はA−T二重鎖を形成するプローブ 中のアデニン残基を2,6−ジアミノプリンと置換することにより、又はNaC Iの代わりに塩化アンモニウムテトラメチル塩(TMAC1又はその他のアルキ ル化アンモニウム塩)を用いることにより、成し遂げ得る。 オリゴヌクレオチド類似体プローブを用いることにより付与される二重鎖安定 性変更は、例えば時間中に標的オリゴヌクレオチドを用いてハイブリダイズされ るオリゴヌクレオチド類似体アレイの蛍光シグナル強度を追跡調査することによ り確認される。データは、特異的ハイブリダイゼーション条件、例えば室温の最 適化を可能に する(将来、診断簡素化に適用するため)。 二重鎖安定性の変更を立証する別の方法は、時間に伴ってハイブリダイゼーシ ョン時に生じたシグナル強度を追跡調査することによる。DNA標的及びDNA チップを用いる従来の実験は、シグナル強度が時間とともに増大し、安定性が高 い二重鎖ほど、低安定性二重鎖より速く、より高いシグナル強度を生じる。すべ ての結合部位がいっぱいになるため、一定時間後にはシグナルはプラトー又は「 飽和」に達する。これらのデータは、ハイブリダイズの最適化、及び特定温度で の最高条件の確定を可能にする。 ハイブリダイゼーション条件の最適化方法は、当業者には十分公知である(例 えば、Laboratory Techniques in Biochemistry and Molecular Biology,Vol.2 4:Hybridization With Nucleic Acid Probes,P.Tijssen,ed.Elsevier,N.Y. ,(1993)参照)。 VII.検出方法 検出方法は選択される標識に依り、そして当業者には公知である。したがって 、例えば比色定量的標識を用いる場合、標識の簡単な可視化で十分である。放射 能標識プローブを用いる場合、放射能の検出(例えば、写真フィルム又は固体状 態検出器を用いて)で十分である。 上記で説明したように、感度が非常に高く且つ簡便であるために、蛍光標識が 好ましい。標準手法を用いて、標的配列と試薬との間の相互作用が起こる位置を 確定する。例えば、標的配列が標識され、異なるオリゴヌクレオチドプローブの アレイに曝露されると、オリゴヌクレオチドが標的(試料核酸)と相互作用する 位置だけが有意のシグナルを示す。標識を用いる他に、その他の方法を用いてマ トリックスを走査し、相互作用が起きる位置を確定し得る。相互作用のスペクト ルは、もちろん、多数の条件の各々で起きる相互作用 の反復走査により、一時的方法で確定し得る。しかしながら、個々の相互作用の 各々を別々に調べる代わりに、多数の配列相互作用をマトリックス上で同時に確 定し得る。 B.走査システム 好ましい実施態様では、ハイブリダイズ化アレイは特定の蛍光標識の励起波長 での光源により励起され、その結果生じる発光波長での蛍光が検出される。特に 好ましい実施態様では、励起光源は、蛍光標識の励起に適したレーザーである。 蛍光シグナルの検出は、好ましくは同焦点顕微鏡を、さらに好ましくは完全高 密度アレイを自動的に走査するためにコンピューター制御段階で自動化される同 焦点顕微鏡を用いる。顕微鏡は、アレイ上の各オリゴヌクレオチドプローブとの ハイブリダイゼーションにより生じた蛍光シグナルを自動的に記録するために自 動データ獲得システムに取り付けられる光変換器(例えばフォトマルチプライヤ ー、固体状態アレイ、ccdカメラ等)を装備する。このような自動システムは 、米国特許第5,143,854号、PCT出願20 92/10092及び同 時係属中のU.S.S.N.08/195,889(1994年2月10日提出 )に詳細に記載されている。シグナル検出のために同焦点顕微鏡とともにレーザ ー照明を用いると、約100μmより良好な、さらに好ましくは約50μmより 良好な、最も好ましくは約25μmより良好な解像度で検出できる。 自動検出装置を用いると、特定位置標識の相関が、オリゴヌクレオチドが相互 作用の特異性を有する配列の標的上の存在に変換される。したがって、位置情報 がデータベースに直接変換されて、どのような配列相互作用が起きたかを示す。 例えば、核酸ハイブリダイゼーション適用では、基質マトリックスと標的分子と の間で相互作 用した配列は、位置情報から直接列挙され得る。好ましい検出システムは、PC T公開WO90/15070及びU.S.S.N.07/624,120に記載 されている。そこに記載された検出は蛍光検出器であるが、しかしその検出器は 分光学的又はその他の検出器に取り換え得る。走査システムは、固定基質に対し て移動する検出器、可動性基質を有する固定検出器又はその組合せを用い得る。 あるいは、鏡又はその他の装置を用いて、シグナルを直接検出器に伝え得る(例 えば、U.S.S.N.07/624,120参照)。 検出方法は、典型的にはいくつかのシグナルプロセッシングを組み入れて、特 定マトリックス位置でのシグナルが真正シグナルであるか、又は擬似シグナルで あるかを確定する。例えば、実際に陽性シグナルを有する領域からのシグナルは 、実際には陽性シグナルを有さない隣接領域に陽性シグナルを広げて、提供する 傾向がある。これは、例えば、走査システムが、2つの領域を分けるのに十分高 いピクセル密度の解像度で適正に識別していないところで起きる。したがって、 空間領域でのシグナルは、陽性シグナルの位置及び実際の程度を確定するために ピクセル毎に評価される。真正シグナルは、理論的には、各ピクセル位置で均一 シグナルを示す。したがって、実シグナル強度を有するピクセル数をプロッティ ングすることによる処理は、明瞭な均一シグナル強度を有するべきである。シグ ナル強度がわずかに広い分散を示す領域が特定的に推測され、走査システムがプ ログラムされて、その位置をより注意深く走査する。 さらに高性能のシグナル処理技術が、陽性シグナルが存在するか否かの初期確 定に適用され得る(例えば、U.S.S.N.07/624,120及び下記の XII節の考察参照)。 VIII.連結増強性シグナル検出 A)一般的連結反応 連結反応を用いて、完全相補性ハイブリッドと、特にミスマッチがプローブオ リゴヌクレオチドの5’末端近クローニングある場合の、1つ又はそれ以上の塩 基対が異なるものとを識別し得る。シグナル検出に連結反応を用いると、ハイブ リッド二重鎖の安定性が増大され、ハイブリダイゼーション特異性(特に、短い プローブオリゴヌクレオチド、例えば5〜12merに関して)が改良され、そ して任意に付加的配列情報が提供される。 連結反応を一般的差異アレイと組合せて用いるための種々の構成成分を、図1 3aに示す。その最も簡単な実施態様では、プローブオリゴヌクレオチド/連結 反応系は、オリゴヌクレオチドプローブのアレイを包含する。上記のように、オ リゴヌクレオチドプローブは無作為に選択され、偶発的に選択され、組成偏向性 で、特定長の考え得るすべてのオリゴヌクレオチドを包括し得る。オリゴヌクレ オチドプローブは、アレイ上の実質的にすべてのプローブオリゴヌクレオチドに 対して実質的に同一配列を有する予定「定常」領域(図13a参照)を任意に包 含し得る。 プローブが定常領域を有する場合、それはさらに、好ましくは、無作為に選択 され、偶発的に選択され、組成偏向性で、特定長の考え得るすべてのオリゴヌク レオチドを包括し得る「可変領域」(図13a参照)を包含する。定常及び可変 領域が存在する場合、オリゴヌクレオチドプローブとハイブリダイズする試料核 酸は、典型的には少なくとも可変領域と、そして任意に定常領域と同様にハイブ リダイズする。 プローブオリゴヌクレオチド/連結反応系はさらに、定常領域と相補的である 核酸を任意に含む。この補体は、試料核酸のサブ配列であるか、又は別個のオリ ゴヌクレオチドである。定常領域に対す る補体が別個のオリゴヌクレオチドである場合、定常領域とのハイブリダイゼー ションは連結部位を提供する(図13a、連結部位A参照)。定常領域とハイブ リダイズした補体は、任意に、架橋試薬(例えばソラレン)の使用により定常領 域と恒久的に架橋される。試料核酸および/または連結可能オリゴヌクレオチド は、任意に標識される。両方が標識される場合、標識は同一であっても異なって もよい。 プローブオリゴヌクレオチド/連結反応系は、任意に、可変領域の遊離端に連 結され得る連結可能オリゴヌクレオチドを包含する(図13a、連結部位B参照 )。連結可能オリゴヌクレオチドは、公知のヌクレオチド配列の単一オリゴヌク レオチド、公知の配列のヌクレオチドの集合、又は特定長の考え得るすべてのオ リゴヌクレオチドのプールである。 プローブオリゴヌクレオチド/連結反応系のこれらの種々の成分を種々の方法 で組合せて、ハイブリッド二重鎖の安定性を増大し、および/またはハイブリダ イゼーション特異性(特に、短いプローブオリゴヌクレオチド、例えば5〜12 merに対する)を改良し、および/または配列情報を提供し得る。プローブオ リゴヌクレオチド/連結反応系の種々の使用を、以下に詳細に説明する。 図13aは固相における連結成分を説明しているが、同様のアプローチ及び成 分は溶液相で用い得る。定常領域と可変領域の順序は変え得ると理解される。さ らに、プローブオリゴヌクレオチドは多数の定常領域および/または多数の可変 領域を包含し得る。さらに、図13aは、3’末端により固体支持体に付着され るプローブオリゴヌクレオチドを示すが、プローブは逆にされて、そして5’末 端を介して付着され得る。 可変領域が存在するか又は存在しないプローブオリゴヌクレオチ ドの配列又はサブ配列は、重合鋳型として残りのプローブオリゴヌクレオチドお よび/または連結オリゴヌクレオチドおよび/または試料核酸を用いた重合の開 始のためのプライマー部位として作用し得る、と理解される。 B)プローブ末端、標的末端又は両末端でのミスマッチを識別するための連結 反応 一実施態様では、簡単な連結反応がプローブオリゴヌクレオチドの末端又は末 端付近のミスマッチを識別した(図13b参照)。典型的には、試料核酸を包含 する核酸断片はアレイ中のプローブオリゴヌクレオチドより長い。したがって、 ハイブリダイズすると、標的核酸は典型的にはオーバーハングを有する。アレイ がその3’末端を介して付着したプローブオリゴヌクレオチドを包含する場合、 ハイブリダイズ化標的(試料)核酸は3’オーバーハングを提供する。この実施 態様では、標的核酸は必ずしも標識されない(例えば、図13b参照)。 オリゴヌクレオチドのアレイを標的核酸と組合せて標的−オリゴヌクレオチド ハイブリッド複合体を形成すると、標的−オリゴヌクレオチドハイブリッド複合 体はリガーゼ及び標識化連結可能オリゴヌクレオチドと、あるいは標識化連結可 能プローブのプールと接触される。試料核酸及び連結可能プローブのハイブリダ イゼーションは連続して実施され得るが、好ましい実施態様では、ハイブリダイ ゼーション及び連結は同時に実行される(即ち、標的、連結可能オリゴヌクレオ チド及び連結体はすべて一緒に付加される)。プールは特定の予選択プローブを 包含するか、又は特定長(例えば、3mer〜12merまで)の考え得るすべ てのプローブの集合である(例えば、図13b参照)。 標識化連結可能プローブの基質上でのオリゴヌクレオチドプロー ブのリン酸化5’末端への連結反応は、主に、標的:オリゴヌクレオチドハイブ リッドがオリゴヌクレオチドプローブの5’末端地下核で正しい塩基対合で生じ た場合、並びに標的核酸の適切な3’オーバーハングが存在してハイブリダイゼ ーション及び連結のための鋳型として役立つ場合、リガーゼの存在下で起きる( 図12参照)。連結反応後、標的核酸及び標識化非連結化プローブを除去するの に適した条件下(例えば、40℃〜50℃以上、又はそうでなければ高緊縮条件 下)で、基質は洗浄される(必要な場合には複数回)。 その後、ハイブリダイゼーションパターンの蛍光画像(例えば、定量的蛍光画 像)が、上記のVII(B)項に記載したように得られる。標識化オリゴヌクレ オチドプローブ、即ち標的核酸と相補的なオリゴヌクレオチドプローブが同定さ れる。ハイブリダイゼーションシグナルの存在、非存在および/または強度は、 上記のように核酸試料中の核酸配列又はサブ配列の存在及びレベルに関する情報 を提供する。 二重鎖DNAの一本鎖切断の部位でのホスホジエステル結合の形成を触媒する あらゆる酵素を用いて、完全相補的ハイブリッドと1つ又はそれ以上の塩基対が 異なるものとの間の識別を増強し得る。このようなリガーゼとしては、T4DN Aリガーゼ、大腸菌から単離されたリガーゼ、並びにその他の細菌及びバクテリ オファージから単離されたリガーゼが挙げられるが、これらに限定されない。リ ガーゼの濃度は、用いられる特定のリガーゼ、標的の濃度及び緩衝液条件によっ て変わるが、典型的には約50単位/ml〜約5,000単位/mlの範囲であ る。さらに、標的:オリゴヌクレオチドハイブリダイゼーション複合体のアレイ がリガーゼと接触する時間は変化する。典型的には、リガーゼ処理は数分から数 時間の範囲の 時間、実施する。リガーゼ識別の実施方法は、USSN08/533,582( 1995年10月18日提出)に、そしてJackson et al.,(1996)Nature Bio technology,14:1685-1619に記載されている。 上記の方法は主に、表面結合プローブオリゴヌクレオチドの5’末端又はその 付近のミスマッチを識別し、標識(試料)核酸の5’末端又はその付近のミスマ ッチはほとんど識別しない、と理解される(図13b参照)。 別の実施態様では、連結を用いて試料核酸の末端又はその付近のミスマッチを 識別し得る(図13c)。この場合、プローブオリゴヌクレオチドは定常領域及 び可変領域を包含する(例えば、可変領域は図13cに示したように、考え得る すべての8merを含み得る)。定常オリゴヌクレオチド(定常領域又はそのサ ブ配列と相補的)は定常領域とハイブリダイズされ、その位置で架橋(例えば、 共有結合)される。残りのプローブオリゴヌクレオチド(例えば可変領域又はそ のサブ配列、及ひ任意に定常領域のサブ配列)は、核酸試料がハイブリダイズし 得る5’オーバーハングを形成する。試料オリゴヌクレオチドの末端又はその付 近にミスマッチが存在しない場合には、連結により試料オリゴヌクレオチドが定 常オリゴヌクレオチドと連結する。遊離核酸を洗い落として、その後検出される 結合ハイブリダイズ化試料オリゴヌクレオチドを残す。 さらに別の実施態様では、二重連結(図13dに示す)を用いてプローブオリ ゴヌクレオチドと標的核酸の両方の末端又はその付近のミスマッチを識別し得る 。このアプローチでは、プローブオリゴヌクレオチドは各々、VIII(A)に 記載したような定常領域及び可変領域を包含する。表面結合オリゴヌクレオチド プローブは、オリゴヌクレオチドプローブの定常領域と相補的な配列を有する定 常オリゴヌクレオチドにハイブリダイズされる。試料(標的)核酸は、リガーゼ の存在下でハイブリッド二重鎖と接触する。試料核酸と可変領域との間に末端ミ スマッチが存在しない場合には、連結はうまくゆき、その結果、定常オリゴヌク レオチドと試料核酸との連結を引き起こす(図13dの「一次連結」参照)。し たがって、この連結は試料核酸の末端のミスマッチを識別する。 ハイブリダイズ化二重鎖を、標識化連結可能オリゴヌクレオチドのプールと接 触させる。連結可能プローブがハイブリダイズ化試料核酸により生じたオーバー ハングと相補的であり、プローブオリゴヌクレオチドの可変領域の遊離末端又は その付近にミスマッチが存在しない場合、二次連結は標識化連結可能プローブを 付加する(図13d参照)。したがって、二次連結は、プローブオリゴヌクレオ チドの遊離末端付近のミスマッチに対して識別する。種々のハイブリダイゼーシ ョン及び連結反応は連続して又は同時に実施され、好ましい実施態様では同時に 実施される、と理解される。 前記の方法と同様に、二重鎖DNAの一本鎖切断の部位でのホスホジエステル 結合の形成を触媒するあらゆる酵素を用いて、完全相補的ハイブリッドと1つ又 はそれ以上の塩基対が異なるものとの間の識別を増強し得る。このようなリガー ゼとしては、T4DNAリガーゼ、大腸菌から単離されたリガーゼ、並びにその 他の細菌及びバクテリオファージから単離されたリガーゼが挙げられるが、これ らに限定されない。リガーゼの濃度は、用いられる特定のリガーゼ、標的の濃度 及び緩衝液条件によって変わるが、典型的には約50単位/ml〜約5,000 単位/mlの範囲である。さらに、標的オリゴヌクレオチド:オリゴヌクレオチ ドプローブハイブリッド複合体のアレイがリガーゼと接触する時間は変化する。 典型的には、リガーゼ処理は数分から数時間の範囲の時間、実施する。さらに、 2つの連結反応が連続して実施されるか、あるいは標的オリゴヌクレオチド、定 常オリゴヌクレオチド、標識化連結可能プローブのプール及びリガーゼを含有す る単一反応ミックス中で同時にじっしされるということは、当業者には容易に明 らかになる。 この二元的連結方法では、一次連結反応は一般に、標的オリゴヌクレオチドの 5’末端(即ち最後の3〜4塩基)がオリゴヌクレオチドプローブの可変領域と マッチする場合にのみ起こる。同様に、標識をプローブに付加する二次連結反応 は、一般に、一次連結反応がうまく行き、連結化標的がプローブの5’末端と相 補的である場合にのみ効率よく起こる。したがって、この方法は、可変領域の両 端に特異性を提供する。さらに、この方法は、用いられる可変プローブ領域短く し、プローブ:標的特異性を増大し、標的を標識する必要をなくすという点で有 益である。この種の二元的連結方法は、同時係属中のUSSN08/533,5 82(1995年10月18日提出)に詳細に記載されている。 別の実施態様では、プローブオリゴヌクレオチドの定常領域と相補的なヌクレ オチドとのハイブリダイゼーション後、それにより形成されたハイブリッド二重 鎖は、その後変性しないように恒久的に架橋される。試料核酸がこのように形成 されたオーバーハングと連結されると、それはさらに固体支持体に恒久的に付着 される。この実施態様では、連結可能オリゴヌクレオチドの使用が最適である。 試料核酸は、それ自体標識されて、それにより連結化試料核酸の検出を可能にす る。 核酸の架橋方法は、当業者には十分公知である。このような方法としては、紫 外線曝露、電離放射線曝露、及び化学的架橋試薬との接触が挙げられるが、これ らに限定されない。特に好ましい実施態様では、架橋は化学的架橋試薬を用いた 共有結合の形成によりなし とげられる。好ましい架橋試薬としては二官能架橋試薬があげられ、架橋は、核 酸を用いた架橋試薬の化学的又は光活性化により成し遂げられる。試薬はハイブ リッド二重鎖形成後に適用されるが、好ましい実施態様では、架橋剤は、ハイブ リダイゼーション前に、最初にプローブ又は(定常領域と)相補的核酸に付加さ れる。 架橋試薬は、テスター核酸をハイブリダイズ化ドライバー核酸と共有的に架橋 する任意の二官能分子である。一般的に、架橋試薬は、テスター又はドライバー 核酸に一付加されて光励起時に対応するハイブリダイズ化核酸と共有的に結合す る二次光化学的反応性残基を残す二官能光試薬である。架橋分子はさらに、化学 反応、例えばアルキル化、縮合又は付加によりプローブ又はテスター核酸に非光 化学的に結合され、その後対応するハイブリダイズ化核酸と光化学的に結合する 混合化学的及び光化学的二官能試薬である。ハイブリダイゼーション後に触媒的 に又は高温により活性化される二官能化学的架橋分子も用い得る。 二官能光試薬の例としては、フルオロクマリン、ベンゾジピロン及びビスアジ ド、例えばビスアジドエチジウムブロミドが挙げられる。化学的及び光化学的結 合部分の両方を有する混合二官能試薬の例としては、ハロアルキルフルオロクマ リン、ハロアルキルベンゾジピロン、ハロアルキルクマリン及び種々のアジドヌ クレオシドトリホスフェートが挙げられる。 特に好ましい架橋剤としては、線状フルオロクマリン(ソラレン)、例えば8 −メトキシソラリン、5−メトキシソラリン及び4,5’,8−トリメチルソラ リン等が挙げられる。その他の適切な架橋剤としては、シス−ベンゾジプロン及 びトランス−ベンゾジピロンが挙げられる。ソロンSorlonとして商業的に公知の 架橋剤も適切である。ハイブリダイズ化核酸の架橋の詳細な説明は、WO85/ 02628を参照していただきたい。 連結反応の使用を包含する前記の増強識別法は、完全相補的ハイブリッドと1 つ又はそれ以上の塩基対が異なるものとの間の識別の改良が役立つすべての場合 に用い得る。さらに、このような方法は、配列のより正確な確定(例えば新生シ ーケンシング)、発現のモニタリング、突然変異のモニタリング又は標的核酸の 再シーケンシングに用い得る(即ち、このような方法を第二のシーケンシング手 法と一緒に用いて、別個の立証を提供し得る)。前記は、標的:オリゴヌクレオ チドハイブリッド複合体のアレイがリガーゼ及び標識化連結可能プローブで処理 されて高密度オリゴヌクレオチドアレイ上のハイブリダイゼーションシグナルを 改良する方法を説明するためのものであって、本発明はそれらに限定されない。 B)配列情報を付加するための連結反応 i)単一連結からの配列情報の延長 上記の連結反応を用いて、ハイブリダイズ化核酸に関して得られた配列情報を 増大し得る。高密度オリゴヌクレオチドアレイ上の各プローブオリゴヌクレオチ ドのヌクレオチド配列は公知である、と理解される。試料核酸との特異的ハイブ リダイゼーションは、ハイブリダイズ化試料核酸がハイブリダイズ化プローブオ リゴヌクレオチドと相補的な配列又はサブ配列を有することを示す。したがって 、ハイブリダイゼーションは、ハイブリダイズ化試料中に存在する核酸(例えば 遺伝子転写産物)を同定するために用い得る配列情報を提供する。概して、得ら れる配列情報は、プローブオリゴヌクレオチドの長さにより支配される。したが って、プローブオリゴヌクレオチドが8merである場合、8ヌクレオチドの配 列情報が得られる。 しかしながら、上記の連結識別反応を用いて別の配列情報を提供 し得る。この実施態様では、既定の長さの考え得るすべての連結可能オリゴヌク レオチドというよりむしろ、アレイ及び試料核酸が、1つ又はそれ以上の位置の ヌクレオチドが公知である予定連結可能オリゴヌクレオチドとハイブリダイズさ れる。したがって、標識オリゴヌクレオチドのハイブリダイゼーション及び連結 が首尾よく行くと、ハイブリダイズ化試料核酸はプローブオリゴヌクレオチドの 他に連結可能オリゴヌクレオチドと相補的なヌクレオチドを有するようになる。 したがって、例えばプローブオリゴヌクレオチドが8merであって、特異的 6mer連結可能プローブが用いられる場合、その結果生じるハイブリダイゼー ションは14ヌクレオチドの価値の配列情報を提供する。 この情況で異なる連結可能オリゴヌクレオチドを用いる場合は、種々の連結化 オリゴヌクレオチド間を区別するのが望ましい。これは、各々の異なる種の連結 可能プローブを用いて連続連結し、その後アレイを読みとることにより成し遂げ 得る。あるいは、各種の連結可能オリゴヌクレオチドを異なる検出標識で標識し て、種々の異なる標識の同時連結とその後の検出を可能にする。 ii)複合(標的)試料核酸中の制限部位に隣接する配列を問い合わせるため の一般的連結遺伝子チップの使用 一般的差異アレイを用いて、複合DNAクローンの指紋を採り、又は既定供給 源からの遺伝子発現の複合パターンをモニタリングし得る。指紋採取の場合、既 定制限酵素部位に隣接する核酸配列(例えば、8bp配列)をシーケンシングす る。 指紋採取に際しては、認識配列の長さによってある頻度で標的を切断する制限 酵素が用いられる。したがって、制限消化は、ゲノムDNAに沿ってほぼ均一に 分布する核酸断片を生じる。例えば、H sp92 IIのような4−カッターは約数百塩基対毎に1回標的を切断し、一 方6−カッター、例えばSacIはおよそ数千(4,000)塩基対毎に1回標 的を切断する。制限酵素断片を用いる場合、個々の断片は、典型的には非オーバ ーラップ性で、平均数千塩基対の長さである。指紋採取のためには、6−カッタ ー制限酵素を用いると、2000〜3000断片x4000塩基/断片=800 万〜1200万塩基対/標的を検査できる。これは、香典し密度アレイ中の80 0万〜1200万塩基対標的をルーチンに分類して発現差を測定し、又は遺伝子 発現をモニタリングし(例えは、図14c参照)、それにより試料核酸の各制限 消化物に関する特徴的発現「指紋」又は存在量差指紋を提供し得る。したがって 、指紋採取法は、ほぼ均一且つ再現可能な方法で核酸集団を準試料採取し、この ように試料採取した標的核酸に関する発現プロフィールおよび/または存在量差 を確定する手段を提供する。 概して、本方法は、プローブオリゴヌクレオチドが上記のように定常領域及び 可変領域を包含する高密度一般的差異スクリーニングアレイを提供することを含 む。しかしながら、この場合、定常領域(アンカー配列)の最後の少数個の塩基 は制限認識部位の5’末端と相補的であるよう選択され(例えば、図14a及び 14b参照)、相補的アンカー配列は適切な数の塩基により短縮される。可変領 域は、上記のように無作為に選択され、偶発的に選択され、組成偏向性である。 しかしながら、好ましい実施態様では、可変領域は特定長(例えば、考え得るす べての3mer、考え得るすべての4mer、…・考え得るすべての12mer )の、さらに好ましくは考え得るすべての8merの考え得るすべての核酸を含 有する。 試料核酸は、制限酵素を用いて断片化することにより調製される。5’末端に 0、1又は2個の塩基のみを有する好ましい制限酵素 は、連結のより大きい特異性を提供する(即ち、SacIはちょうど5’Cを残 し、Hsp92 IIは5’末端に認識部位塩基を何も残さない)。しかしなが ら、5’末端により多くの塩基を残す制限酵素が用いられる。いくつかの制限酵 素は、それらがすべて、5’末端に同一認識塩基を残す場合には、同時に用い得 る。例えば、Aat II、SacI、SphI、HhaI、Bsp1286I 、ApaI、Kpn I、Ban II、はすべて、5’末端でちょうどCを残 して、これらの適合性酵素を成す。制限酵素及びそれらの特徴的認識/切断部位 は、と業者には十分公知である(例えば、Clone Tech catalogue,Clonetech La boratories Inc.,Palo Alto,Ca参照)。 次に、消化標的を、好ましくは定常領域との補体の存在下で、標準条件(例え ば、30℃、o/n、800U T4リガーゼ、T4リガーゼ緩衝液)を用いて、 高密度アレイとハイブリダイズし、連結する。ハイブリダイゼーションは、事実 上、試料核酸を分類する(定めるおよび/または局在させる)。試料核酸の位置 は、5’末端の制限部位に隣接する塩基の配列により確定される。ハイブリダイ ゼーションデータは、上記のように発現モニタリング法に直接用い得るし、ある いは同手法は一般的差異スクリーニングのために1つ又はそれ以上の試料核酸で 実行し得る。 好ましい実施態様では、2つのフォーマットのうちの1つが用いられる。フォ ーマットIでは、連結断片(例えば試料核酸、任意に定常領域に対する補体)は 補体との(ソラレンの使用による)その付着(例えば、架橋による)により、高 密度アレイ中の場所に固定される。断片に対する相補的鎖は変性され、希釈塩基 (例えば1N NaOH)によりアレイから洗い落とされる。次に、これらの架 橋断片は1つ又はそれ以上の核酸試料との第回目のハイブリダイゼ ーションでプローブとして用いられる。次に、同一アレイ又は別個のアレイと同 時に又は連続してハイブリダイズされた異なる核酸間のハイブリダイゼーション パターンを比較することにより、示差的核酸存在量(例えば示差的遺伝子発現) をモニタリングし得る。 第二のフォーマット(フォーマットII)では、特に試料核酸がデオキシ核酸 試料である場合、DNAは上記のように制限消化され、次に一般的差異アレイと 直接的にハイブリダイゼーション/連結される。強度差が生じる部位は、核酸存 在量の差を示す。アレイ中のプローブ及び認識部位の配列の位置から得られる配 列情報を基礎にしてその核酸に特異的なプライマーを設計することにより,示差 的に豊富な(例えば、示差的に発現された)核酸をクローン化する。8mer( 可変領域)及び6塩基制限酵素に関しては、これは14merプライマー配列を 生じる。短ゲノムに関しては、14merプライマーを用いてクローンを単離し 得る。長いゲノムは、プライマープローブ(可変領域)の長さが8mer以上に 増大するので、より扱いやすくなる。 制限酵素消化試料核酸は、好ましくは、指紋採取法で、そしてフォーマットI Iで、標識され、高密度アレイと連結される(上記及び図14d参照)。フォー マットI検定の場合は、連結標的配列は、好ましくは標識されず、その代わりに 標識化試料核酸の高密度アレイとの第2回目のハイブリダイゼーションでハイブ リダイゼーションプローブとして役立つ。 既定の制限酵素により切断されなかった部位は高密度アレイに連結しないこと を保証するために、アルカリ性ホスファターゼを用いて制限酵素消化前に試料核 酸を処理する。 iii)一般的差異アレイ上の示差的表示断片の分析 示差的表示を支持する原則は、次式のアンカープライマーを用い てRNAから転写される一次鎖cDNA集団からの一組の無作為プライマー処理 増幅(例えばPCR)断片を生成することである: (T)nVA、(T)nVG、(T)nVC及び(T)nVT (式中、VはA、G又はCであり、nは約6〜約30の範囲、好ましくは約8〜 約20、さらに好ましくは約10〜約16の範囲であって、n=14が最も好ま しい)。どの無作為プライマー及びアンカープライマーが選択されるかによって 、異なる組のcDNA転写体が特定核酸断片組中に表される。これらの増幅断片 は、断片の5’末端の配列を基礎にしてそれらがハイブリダイズする一般的スク リーニングオリゴヌクレオチドアレイ上の断片を分類することにより、分析され る。 本方法は、図16a〜16eに示されている。標準法にしたがって、アンカー 化ポリ(t)プライマーを用いてポリ(A)mRNAの逆転写により、一次鎖c DNAを合成する(図16a)。一次鎖DNAは、工学処理制限部位及び3’末 端の1つ又はそれ以上の縮重塩基(N=A、C、G、T)を包含する上流プライ マーを用いて、増幅(例えば、PCRによる)のための鋳型として作用する。次 に、上流プライマー、アンカープライマー及び無作為プライマー(例えば、アン カープライマー(T)14VA、(T)14VG、(T)14VC、(T)14VT、及 び無作為プライマー、例えばSacI部位:5’−CATGAGCTCNN)を 用いて、無作為プライマー処理PCRを実行する。その結果生じた増幅断片を次 に工学処理制限部位に対応する制限エンドヌクレアーゼで消化する。その結果生 じた試料核酸を次に、上記のように一般的差異スクリーニングアレイとハイブリ ダイズする。 本方法は、好ましくは2又はそれ以上の核酸試料に対して実行し、それにより 本発明の一般的差異スクリーニング法の使用が可能に なる。一実施態様では、プローブオリゴヌクレオチドは、存在する場合には試料 核酸上の残りの制限部位と相補的な定常部位を包含する。残りの分析は、上記と 同様に進行する。 本方法は、数千の又はそれ以上の「バンド」(核酸)でさえ同時に分析し得る 。さらに、示差的に豊富な核酸に関して、配列情報が提供される。例えば、切断 がSacIによる場合には、9塩基尾部(CATGAGCTC)が提供されて、 アレイは相補的9塩基定常領域及び考え得るすべての9merを包含する可変領 域を有するプローブオリゴヌクレオチドを包含する。これは、各ハイブリダイゼ ーションに関して17ヌクレオチドの配列情報を提供する(9mer定常+8m er可変)。 iv)制限選択核酸ハイブリダイゼーションからの付加配列情報を抽出するた めの連結の使用 連結反応を制限消化と組合せて用いて、ほぼ均一間隔で試料核酸を準試料採取 し、同時に連結反応を用いて付加配列情報を提供し得る。この実施態様では、プ ローブオリゴヌクレオチドが制限部位のセンス又はアンチセンス鎖と相補的な核 酸配列を包含する高密度アレイが提供される(例えば、図14参照)。試料核酸 はDNアーゼで無作為に、又は制限エンドヌクレアーゼで特異的に消化される( 例えばSau3A)。次に消化オリゴヌクレオチド高密度アレイとハイブリダイ ズする。定常領域と相補的な末端を有する核酸だけがプルオリゴヌクレオチドと 結合する。したがって、制限断片は優先的に選択される。 アレイはさらに、リガーゼの存在下で特定長(例えば6mer)の考え得るす べてのオリゴヌクレオチドを包含する連結可能オリゴヌクレオチドのプールを用 いてハイブリタイズされ、それにより相補的連結可能オリゴヌクレオチドをプロ ーブオリゴヌクレオチドの 末端に連結する。これは、連結可能オリゴヌクレオチドの長さだけ長さが増大し 、核酸試料中に存在することが公知の核酸と相補的なプローブオリゴヌクレオチ ドを生じる。 次に、DNAをアレイから取り除き、延長プローブを用いて上記のような核酸 試料の一般的差異スクリーニングを実行する。種々の試料中で示差的に発現され る核酸に対応するプローブが同定された場合、公知のプローブ配列を用いて試料 中で示差的に発現される核酸を同定し得る。 一実施態様では、これは、定常領域+公知の可変領域及び付加的ヌクレオチド (A、G、C又はT)を一端に包含する4プライマーオリゴヌクレオチドを生成 することにより、成し遂げられる。次に、ゲノムクローンを二次制限酵素で消化 し、アダプター配列と連結する。4プライマーオリゴヌクレオチド及びアダプタ ー配列をプラィマーとして用いて、当該ゲノム配列をゲノムクローンから増幅( 例えば、PCRを用いて)し得る。次にPCR増幅配列を用いて、cDNAライ ブラリをプローブ(例えば、サザーンブロットで)して、当該する全cDNAを 得る。 例えば、一実施態様では、10mer高密度アレイは、それが10merオリ ゴヌクレオチド(即ち、410=1048576核酸)の考え得るすべての組合せ 、及び各オリゴヌクレオチドの開始時に、その最初の4塩基が制限酵素の認識配 列(例えば、Sau3A+1塩基T)と相補的である定常配列(例えば3’−T AGT−5’)を包含するように消化される。 大型ゲノムクローン又は簡素化cDNAライブラリー(例えば、全mRNAの 5’末端又は3’末端を含有するだけのcDNAライブラリー)の、例えば4カ ッター酵素(本明細書中ではSau3Aにより示される)を用いた完全消化は、 5’オーバーハング配列( Sau3Aに関しては、オーバーハングはGATCである)を有するDNA断片 を生じる。認識部位は、約500bp毎に存在する。 DNA断片が特定長(例えば6mer)の連結可能オリゴヌクレオチドの考え 得るすべての組合せ及びT4DNAリガーゼの存在下で、10merチップを用 いてハイブリダイズされる場合、連結可能オリゴヌクレオチドはプローブオリゴ ヌクレオチド上で連結される。 次に、DNAをチップから取り除き、上記のように核酸試料の一般的差異スク リーニングを実行する。これは、被験試料中に異なるレベルで存在する核酸とハ イブリダイズするプローブオリゴヌクレオチドの同定を可能にする。 アレイ中の当該プローブからのこの例(5mer定常領域塩基+10mer) の14bp配列を基礎にして、末端に塩基1つ(A、G、C又はT)を付加する ことにより、4つの16塩基プライマーを生成する。これらのプライマー及びア ダプター配列をプライマーとして用いて、当該ゲノム配列を増幅し得る。次に増 幅配列を用いて、cDNAライブラリをプローブして、上記のように当該する全 cDNAを得る。 IX.シグナル評価 A)発現モニタリングのためのシグナル評価 ハイブリダイゼーション結果の評価方法は、使用する特異的プローブ核酸及び 提供される対照の性質に伴って変わる、と当業者は理解する。最も簡単な実施態 様では、各プローブの蛍光強度の簡単な定量が確定される。これは、高密度アレ イ上の各位置(異なるプローブを表す)でのプローブシグナル強度を測定するこ とにより簡単に成し遂げられる(例えばこの場合、標識は蛍光標識であり、アレ イ上の各位置での固定励起照明により生じる蛍光の量(強度)を検出)。「被験 」試料からの核酸とハイブリダイズするアレイの絶対強度と「対照」試料により 生じる強度との比較は、各々のプローブとハイブリダイスする核酸の相対的存在 量の測定を提供する。 しかしながら、ハイブリダイゼーションシグナルは、ハイブリダイゼーション の効率、試料核酸上の標識の量及び試料中の特定の核酸の量に伴って強度が変わ る、と当業者は理解する。典型的には、非常に低レベル(例えば、<1pM)で 存在する核酸は、非常に弱いシグナルを示す。いくつかの低レベル濃度では、シ グナルは事実上バックグラウンドと区別できなくなる。ハイブリダイゼーション データを評価する場合、閾値強度値は、バックグラウンドと本質的には区別でき ないので、シグナルが計数されない値より低く選択される。 より低レベルで発現される核酸を検出したい場合、より低い閾値が選択される 。逆に、高い発現レベルだけが評価される場合には、より高い閾値レベルが選択 される。好ましい実施態様では、適切な閾値は平均バックグラウンドシグナルよ り約10%高い値である。 さらに、適切な対照を用意すれば、ハイブリダイゼーション条件、細胞の健康 、非特異的結合等の変異を制御するより詳細な分析が得られる。したがって、例 えば好ましい実施態様では、IV(A)(2)に上記したような正規化対照を用 いてハイブリダイゼーショ ンアレイが提供される。これらの正規化対照は、公知濃度で試料に付加される対 照配列と相補的なプローブである。全体的ハイブリダイゼーション条件が不十分 な場合、正規化対照はハイブリダイゼーション低減を反映してより小さなシグナ ルを示す。逆に、ハイブリダイゼーション条件が良好な場合には、正規化対照は ハイブリダイゼーション改良を反映するより高いシグナルを提供する。したがっ て、正規化対照に対するアレイ中のその他のプローブから得られるシグナルの正 規化は、アレイ合成における又はハイブリダイゼーション条件における変動に対 する制御を提供する。典型的には、アレイ中のその他のプローブからの測定シグ ナルを正規化対照により生じた平均シグナルで割ることにより、正規化は成し遂 げられる。正規化はさらに、試料調製及び増幅による変動に対する修正を含む。 このような正規化は、シグナル測定値を試料調製/増幅対照プローブ(例えば、 BioBプローブ)からの平均シグナルで割ることにより成し遂げ得る。その結 果生じる値に定値を掛けて、結果を出す。 上記のように、高密度アレイはミスマッチ対照を、あるいは総称的差異スクリ ーニングアレイの場合には、1つ又はそれ以上の予選択ヌクレオチドが異なる関 連オリゴヌクレオチドプローブの対を包含し得る。好ましい発現モニタリングア レイでは、アレイ中のすべてのプローブ(正規化対照は除く)に関して中央ミス マッチが存在する。緊縮条件で洗浄後、プローブとハイブリダイズするのに完全 マッチが予測されるがミスマッチは予測されない場合、ミスマッチ対照からのシ グナルは主に、ミスマッチとハイブリダイズする核酸の試料中の非特異的結合又 は存在を反映する、と予測される。発現モニタリング分析では、問題のプローブ とその対応するミスマッチ対照がともに高シグナルを示すか、又はミスマッチが その対応する 被験プローブより高いシグナルを示す場合には、それらのプローブからのシグナ ルは好ましくは無視される。標的特異的プローブとその対応するミスマッチ対照 との間のハイブリダイゼーションシグナル強度の差は、標的特異的プローブの識 別の測定値である。したがって、好ましい実施態様では、ミスマッチプローブの シグナルをその対応する被験プローブからのシグナルから引くと、被験プローブ の特異的結合によるシグナルの測定値が得られる。同様に、下記のように、総称 的差異スクリーニングでは、プローブ対間の差が算出される。 次に、その核酸と特異的に結合するプローブの各々のシグナル強度を測定し、 正規化対照に対して正規化することにより、特定の配列野濃度を確定し得る。プ ローブからのシグナルがミスマッチより大きい場合、ミスマッチが差し引かれる 。ミスマッチ強度がその対応する被験プローブ以上である場合、シグナルは無視 される。次に、正のシグナルの数(絶対又はそれ以上の閾値)、正のシグナルの 強度(絶対又はそれ以上の選択閾値)又は両方の測定基準のの組合せ(例えば、 計量平均)により、特定遺伝子の発現レベルを採点し得る。 正規化対照はしばしばハイブリダイゼーションシグナルの有用な定量を必要と しないということは、本発明の意外な発見である。したがって、IV(B)(i i)(a)の項に上記したように、最適プローブが2つの工程選択方法で同定さ れた場合、選択最適プローブにより生じる平均ハイブリダイゼーションシグナル はハイブリダイズ化核酸の濃度の良好な定量値を提供する。 B)総称的差異スクリーニングに関するシグナル評価 上記の発現モニタリングと本質的には同じ方法で、総称的差異スクリーニング に関するシグナル評価を実施する。しかしながら、デ ータは遺伝子毎にというよりむしろプローブ毎に評価される。 好ましい実施態様では、各プローブオリゴヌクレオチドに関して、各プローブ 対(K)の成員間のシグナル強度差は、以下のように計算される: Xijk1−Xijk2 (式中、Xはプローブのハイブリダイゼーション強度であり、iはいずれかの試 料(この場合は試料1又は2)を示し、jは各試料に対する複製を示し(各核酸 試料に対して2つの複製がある実施例7の場合は、jは1又は2である)、Kは プローブ対ID数(実施例7の場合は、1…・34,320)であり、1はプロ ーブ対の一成員を示し、一方2はプローブ対の他方の成員を示す)。 各資料に対する複製間の各プローブ対に関するシグナル強度の間の差を次に算 出する。したがって、各プローブに関して例えば、試料1(例えば正常細胞株) の複製1及び2間と、試料2(例えば腫瘍細胞株)の複製1及び複製2間との差 は、k−1〜総数のプローブに関して、以下のように算出される: (X11k1−X11k2)−(X12k1−X12k2) 複製は、全プローブ対に関して、以下のように互いに正規化される(即ち、正 規化後、平均比は約1である): 試料1に関して(X11k1−X11k2)/(X12k1−X12k2) 試料2に関して(X21k1−X21k2)−(X22k1−X22k2) 最後に、2つの複製で平均を取った試料1と試料2の間の差を算出する。この 値は、2つの試料間の正規化後、以下の: ((X21k1+X22k2)/2)−((X11k1+X12k2)/2) のように計算するが、これは次式の平均比を基礎にしている: [(X21k1+X22k2)/2]/[(X11k1+X12k2)/2] このデータは、プローブ数(ID)の一関数としてプロットされ、 示差的ハイブリダイズ化核酸を有するプローブは容易に識別できる(例えば、図 16c参照)。 しかしながら、データは濾過されて、バックグラウンドシグナルを低減する。 この場合、複製間で正規化(上記)後、以下のように比を計算する: (X11k1−X11k2)/(X12k1−X12k2)の絶対値>1の場合には、 比=(X11k1−X11k2)/(X12k1−X12k2)さもなくば、 比=(X12k1−X12k2)/(X11k1−X11k2)(逆) 各オリゴヌクレオチド対の差に関する試料2の複製1及び2の比は、同様の方 法で算出されるが、しかし以下の絶対値を基礎にする: (X21k1−X21k2)/(X22k1−X22k2)及び (X22k1−X22k2)/(X21k1−X21k2)。 最後に、上記のように、各オリゴヌクレオチド対の差に関して2つの複製で平 均を取った試料1と試料2の比は、上記と同様に正規化後に、図17aの場合と 同様に、しかし以下の絶対値を基礎にして算出した: [(X21k1+X22k2)/2]/[(X11k1+X12k2)/2]及び [(X11k1+X12k2)/2]/[(X21k1+X22k2)/2]。 2つの試料間で最大示差的ハイブリダイゼーションを示すオリゴヌクレオチド 対は、観察されたハイブリダイゼーション比及び差異値を分類することにより確 認し得る。最大変化(増加又は低減)を示すオリゴヌクレオチドは、比のプロッ トから容易に分かる(例えば、図17c参照)。 X.発現が変わる遺伝子の確認 上記のように、高密度アレイを包含するプローブオリゴヌクレオ チドの核酸配列は公知である。最大ハイブリダイゼーション差を示すプローブの 配列(及びこのような差異の族)を用いて、多数の手段のいずれかにより比較試 料における示差的発現遺伝子を同定し得る。 したがって、例えば示差的ハイブリダイズプローブの配列を用いて、核酸デー タベースを精査できる(例えば、公知のすべての配列に対する断片のBLAST 又は関連精査により)。あるいは、同様の量だけ変えるプローブ族を用いたいく つかの配列の再構築も成し得る。ほとんどを変えるプローブと相補的(又はほぼ 相補的)な配列を含有する公知の遺伝子に対するデータベース精査は難しくはな く、それが一般的に配列再構築より容易であるため、示差的発現配列を確認する には好ましい方法である。 別の実施態様では、示差的ハイブリダイゼーションパターンは、被験試料間の 全体的発現プロフィール(単数又は複数)に有意差が認められることを示し、そ して差異に特異的なプローブを同定する。これらのプローブは、試料から異なる 部分を抽出するための特異的親和性試薬として用い得る。これは、いくつかの方 法でなしとげられる: 一アプローチでは、試料間の最大差を示すプローブとハイブリダイズされる物 質が、高密度アレイからミクロ抽出される。例えば、ハイブリダイズ化核酸は、 小毛管を用いて取り出される。あるいは、光不安定性リンカーを用いてチップに 固定されるプローブは、高密度アレイの所望の部分での選択的照射により放出さ れる。 別のアプローチでは、高密度アレイ上のすべてのプローブの配列が公知である ため、そして示差的にハイブリダイズするプローブが確認されているため、後者 プローブを親和性試薬として用いて、被験試料中で示差的にハイブリダイズする 核酸を抽出し得る。一旦示 差的ハイブリダイズプローブがアレイ中に確認されると、プローブ(単数又は複 数)をビーズ(又はその他の支持体)上で合成し、試料とハイブリダイズし得る (この工程に関しては、必ずしも断片化されない―――全長クロンが望ましい) 。当業者に公知の方法にしたがって、抽出される物質をクローニングおよび/ま たはシーケンシングして、示差的発現種についての所望の情報を得る(例えば、 クローンを標識化オリゴヌクレオチドを用いてスクリーニングして、適切な挿入 物でそれを確定し、および/または無作為に選択して、シーケンシングする)。 さらに別のアプローチでは、当該ハイブリダイズ化プローブの配列を用いて増 幅プライマー(例えば、逆転写および/またはPCRプライマー)を生成する。 次に示差的発現配列を増幅し、プローブとして用いて、上記のように逆転写酵素 cDNA工程中に付加される特異的配列(例えば、ポリAを基礎にしたプライマ ー又は付加3‘配列)と組合せてアレイから確定される配列特異的プライマーを 用いてゲノム又はcDNAライブラリーを精査する。適切なクローニング及びシ ーケンシング技術、並びに多数のクローニング練習を通して熟練者を指導するの に十分な使用説明は、以下に記載されている:Berger and Kimmel,Guide to Mo lecular Cloning Techniques,Methods in Enzymology volume 152 Academic Pr ess,Inc.,San Diego,CA;Sambrook et al.,(1989)Molecular Cloning‐A Lab oratory Manual(2nd ed.)Vol.1-3;and Current Protocols in Molecular Biolo gy,F.M.Ausubel et al.,eds.,Current Protocols,a join tventure between Greene Publishing Associates,Inc.and John Wiley & Sons,Inc.,(1994 S upplement)(Ausubel)。生物試薬及び実験装置のメーカーからの製品情報も、公 知の生物学的方法に有用な情報を提供する。このようなメーカーとしては 、以下の各社が挙げられる:SIGMA chemical company(Saint Louis,MO),R&D s ystems(Minneapolis,MN),Pharmacia LKB Biotechnology(Piscataway,NJ),CL ONTECH Laboratories,Inc.,(Palo Alto,CA),Chem Genes Corp.,Aldrich C hemical Company(Milwaukee,WI),Glen Research,Inc.,GIBCO BRL Life Tech nologies,Inc.(Gaithersberg,MD),Fluka Chemica-Biochemika Anslytika(Fl uka Chemie AG,Buchs,Switzerland),Invitrogen,San Diego,CA及びApplied Biosystems(Foster City,CA)、並びに多数のその他の熟練者に公知の供給元。 要するに、上記の方法を用いて、どの遺伝子をモニタリングするかにっいての 事前の想定もなく、そして配列についての事前の知識も持たずに、示差的発現遺 伝子を同定し得る。一旦同定されれば(そして予めシーケンシングされていなけ れば遺伝子をシーケンシングすれば)、同時係属中の出願08/529,115 (1995年9月15日提出)及びPCT/US96/14839に記載されて いるのと同様の方法で、特異的遺伝子を検出し、定量するよう設計された高密度 アレイ中に、新規の配列を包含し得る。したがって、2っのアプローチは相補的 であって、1つはおそらくは未知の遺伝子の発現差に関して広範囲に精査するの に用いられ、他方は重要であるとして選択された遺伝子又は少なくとも部分的に 予めシーケンシングされた遺伝子をより特異的にモニタリングするのに用いられ る。 XI.発現モニタリング及び総称的差異スクリーニングのためのキット 別の実施態様では、本発明は発現モニタリングおよび/または総称的差異スク リーニングのためのキットを提供する。キットとしては、本発明の1つ又はそれ 以上の高密度オリゴヌクレオチドアレイ を含有する単数又は複数の容器が包含されるが、これらに限定されない。総称的 差異スクリーニングのための好ましいキットとしては、少なくとも2つの高密度 アレイが含まれる。キットはさらに1つ又はそれ以上の核酸試料を標識するため の単数又は複数の標識が含まれる。さらに、キットは、1つ又はそれ以上の結紮 可能なオリゴヌクレオチドを包含する。ある実施態様では、キットは異なる結紮 可能オリゴヌクレオチドのプール、好ましくは特定長の考え得るすべてのオリゴ ヌクレオチド(例えば考え得るすべての6mer)のプール、又は特異的結紮可 能オリゴヌクレオチドの組を含有する。キットは、あらゆるその他の種々の遮断 剤、標識、用具(例えば、トレー、顕微鏡フィルター、注射器等)、緩衝剤、そ して本明細書中に記載したハイブリダイゼーション及び結紮反応を実行するのに 有用なものを包含する、と当業者は理解する。さらに、キットは、本明細書中に 記載したプローブの選択および/またはハイブリダイゼーションデータの分析の ため記録媒体(例えば、光又は磁気ディスク)上に提供されるソフトウエアを含 む。さらに、キットは、本発明の種々の方法(例えば、本明細書中に記載した種 々の発現モニタリング法又は総称的差異スクリーニング法の実施)でキットの使 用を教示する指導資料を含有する。 XII.コンピューター実行発現モニタリング 本発明の遺伝子発現のモニタリング方法は、コンピューターを用いて実行する 。コンピューターは、典型的には基板又はチップから測定したハイブリダイゼー ション強度を分析し、したがって1つ又はそれ以上の遺伝子の発現をモニタリン グし、又は核酸存在量の差をスクリーニングするために本発明を組み込んだコン ピューターコードを包含するソフトウエアプログラムを実行する。以下に本発明 の特定の実施態様を説明するが、それらは説明のためであって、本 発明はそれらに限定されない。 図6は、本発明の実施態様のソフトウエアを実行するために用いられるコンピ ューターシステムの一例を示す。図に示したように、コンピューターシステム1 00は、モニター102、スクリーン104、キャビネット106、キーボード 108及びマウス110を含む。マウス110は、1つ又はそれ以上のボタン、 例えばマウスボタン112を有する。キャビネット106は、本発明を実行する コンピューターコードを組み込んでいるソフトウエアプログラム、本発明と一緒 に使用するためのデータ等を保存及び検索するために利用されるCD−ROMド ライブ、114、システムメモリー及びハードドライブ(ともに図7に示す)を 収容する。CD−ROM116は好例のコンピューター読み取り可能記憶媒体と して示されているが、フロッピーディスク、テープ、フラッシュメモリー、シス テムメモリー及びハードドライブを含めた他のコンピューター読み取り可能記憶 媒体も用い得る。キャビネット106はさらに、よく知られたコンピューター構 成部品(図示せず)、例えば中央処理装置、システムメモリー、ハードディスク 等を収容する。 図7は、本発明の実施態様のソフトウエアを実行するために用いられるコンピ ューターシステム100のシステムブロック図を示す。図6と同様に、コンピュ ーターシステム100はモニター102及びキーボード108を包含する。コン ピューターシステム100はさらに、サブシステム、例えば中央処理装置120 、システムメモリー122、I/Oコントローラー124、ディスプレイアダプ ター126、取外し可能ディスク128(例えばCD−ROMドライブ)、固定 ディスク130(例えばハードディスク)、ネットワークインターフェイス13 2及びスピーカー134を含有する。本発明との使用に適したその他のコンピュ ーターシステムは、付加的 又はより少ないサブシステムを含有し得る。例えば、別のコンピューターシステ ムは、1つより多い処理装置120(即ち、多重処理装置システム)又はキャッ シュメモリーを含有し得る。 136のような矢印は、コンピューターシステム100のシステムバスアーキ テクチャーを表す。しかしながら、これらの矢印は、サブシステムを連結するた めに役立つあらゆる相互連絡機構を説明する。例えば、ローカルバスは、中央処 理装置とシステムメモリー及びディスプレイアダプターを接続するために用いら れる。図7に示したコンピューターシステム100は、本発明とともに用いるの に適したコンピューターシステムの単なる一例である。本発明と用いるのに適し たサブシステムのその他の構成は、当業者には容易に明らかになる。 図8は、遺伝子の発現をモニタリングする工程のフローチャートである。本工 程は、好ましくは共有的に基板又はチップの表面に付着される完全マッチ及びミ スマッチプローブの対のハイブリダイゼーション強度を比較する。最も好ましく は、核酸プローブは、基板1cm2当たり約60以上の異なる核酸プローブとい う密度を有する。フローチャートは平明にするために工程を並べたもので、この 特定の順序で工程を実行しなければならないことを示すものではない。本発明か ら逸脱することなく、多数の工程が再注文され、組合せられそして削除される、 と当業者は容易に認識する。 最初に、標的配列(又は遺伝子)と相補的な核酸プローブが選択される。これ らのプローブは完全マッチプローブである。標的配列と完全に相補的ではないよ う意図された別の組のプローブが特定される。これらのプローブはミスマッチプ ローブで、各ミスマッチプローブは、完全マッチプローブと少なくとも1つのヌ クレオチドで異なるミスマッチを含有する。したがって、それが得られたミスマ ッチプローブ及び完全マッチプローブは、一対のプローブを形成する。前記のよ うに、ヌクレオチドミスマッチは、好ましくはミスマッチプローブの中央付近に 存在する。 完全マッチプローブのプローブ長は、典型的には標的配列と高ハイブリダイゼ ーション親和性を示すよう選択される。例えば、核酸プローブは、すべて20m erである。しかしながら、可変長のプローブが、曖昧さの解決を含めたどれほ どかの数の理由のために基板上に合成され得る。 標的配列は、典型的には断片化され、標識化されて前記のように核酸プローブ を包含する基板に曝露される。次に核酸プローブのハイブリダイゼーション強度 を測定し、コンピューターシステムに入力する。コンピューターシステムは、基 板ハイブリダイゼーションを指図する同一システムであるか、又はそれは全く異 なるシステムである。もちろん、本発明と用いるためのあらゆるコンピューター システムはできるだけ遺伝子名、遺伝子配列、プローブ配列、基板上のプローブ 位置等を含めた実験の利用可能なその他の詳細を有するべきである。 図8を参照すると、ハイブリダイゼーション後、コンピューターシステムは工 程202で完全マッチ及びミスマッチプローブの多重対のハイブリダイゼーショ ン強度の入力を受け取る。ハイブリダイゼーション強度は、核酸プローブと標的 核酸(遺伝子に対応する)の間のハイブリダイゼーション親和性を示す。各対は 、標的核酸の一部と完全に相補的な完全マッチプローブ、及び少なくとも1つの ヌクレオチドで完全マッチプローブと異なるミスマッチプローブを包含する。 工程204で、コンピューターシステムは各対の完全マッチ及びミスマッチプ ローブのハイブリダイゼーション強度を比較する。遺 伝子が発現される場合、対の完全マッチプローブのハイブリダイゼーション強度 (又は親和性)は対応するミスマッチプローブより認識できる程度に高い必要が ある。一般に、プローブの対のハイブリダイゼーション強度が実質的に同一であ る場合、それは遺伝子が発現されていないことを示す。しかしながら、確定はプ ローブの単一対を基礎にしておらず、遺伝子が発現されるか否かの確定は多重対 のプローブの分析を基礎にする。プローブの対のハイブリダイゼーション強度を 比較する好例の工程を、図9に関連してより詳細に記載する。 システムが完全マッチ及びミスマッチプローブのハイブリダイゼーション強度 を比較後、システムは工程206で遺伝子の発現を示す。一例として、遺伝子か 存在する(発現される)か、限界的か又は存在しない(発現されない)ことを、 システムはユーザーに示す。 図9は、デシジョンマトリックスを用いて遺伝子が発現されるか否かを確定す る工程のフローチャートを示す。工程252では、コンピューターシステムは、 N対の完全マッチ及びミスマッチプローブの生走査データを受け取る。好ましい 実施態様では、ハイブリダイゼーション強度は基板上のプローブとハイブリダイ ズしたフルオレセイン標識化標的からの光子カウントである。分かり易くするた めに、完全マッチプローブのハイブリダイゼーション強度を「Ipm」とし、ミス マッチプローブのハイブリダイゼーション強度を「Imm」とする。 一対のプローブのハイブリダイゼーション強度を、工程254で検索する。工 程256で、バックグラウンドシグナル強度を対のハイブリダイゼーション強度 の各々から差し引く。バックグラウンド減算はさらに、同時に全生走査データに 関しても実行し得る。 工程258で、プローブ対のハイブリダイゼーション強度を差異閾値(D)及 び比閾値(R)と比較する。対のハイブリダイゼーション強度間の差(Ipm−Imm )が差異閾値以上であるか、そして対のハイブリダイゼーション強度の商(Ipm /Imm)が比閾値以上であるかを確定する。差異閾値は、典型的には、単数又 は複数の遺伝子の正確な発現モニタリングを生じるよう確定されたユーザー定義 値である。一実施態様では、差異閾値は20、比閾値は1.2である。 Ipm−Imm>=D及びIpm/Imm>=Rである場合、NPOS値は工程260 で増大される。概して、NPOSは、遺伝子が発現されそうであることを示すハ イブリダイゼーション強度を有するプローブの対の数を示す値である。NPOS は、遺伝子発現の確定に用いられる。 工程262で、Imm−Ipm>=D及びImm/Ipm>=Rであるか否かを確定す る。この発現が正しい場合は、NNEG値が工程264で増大される。概して、 NNEGは、遺伝子が発現されそうでないことを示すハイブリダイゼーション強 度を有するプローブの対の数を示す値である。NNEGは、NPOSと同様、遺 伝子発現の確定に用いられる。 遺伝子が発現されるか又は発現されないことを示すハイブリダイゼーション強 度を示す各対に関して、対数比(LR)及び強度差値(IDIF)を工程266 で算出する。LRは、対のハイブリダイゼーション強度の商(Ipm/Imm)の対 数により算出される。IDIFは、対のハイブリダイゼーション強度の差(Ipm −Imm)により算出される。工程268でハイブリダイゼーション強度の次の対 が存在する場合、それらは工程254で検索される。 工程272で、デシジョンマトリックスを用いて遺伝子が発現さ れるか否かを示す。デシジョンマトリックスは、N、NPOS、NNEG及びL R(多重LR)値を用いる。以下の4つの代入を実行する: P1=NPOS/NNEG P2=NPOS/N P3=(10*SUM(LR))/(NPOS+NNEG) 次にこれらのP値を用いて、遺伝子が発現されるか否かを確定する。 説明のために、P値は範囲に分類される。P1が2.1以上である場合には、 Aが適正である。P1が2.1未満又は1.8以上である場合には、Bが適正で ある。そうでなければ、Cが適正である。したがって、P1は3つの範囲A、B 及びCに分類される。これは、読者が本発明を理解しやすくするために成される 。 したがって、P値はすべて、以下による範囲に分類される: A=(P1>=2.1) B=(2.1>P1>=1.8) C=(P1<1.8) X=(P2>=0.35) Y=(0.35>P2>=0.20) Z=(P2<0.20) Q=(P3>=1.5) R=(1.5>P3>=1.1) S=(P3<1.1) 一旦P値が上記のブール値による範囲に分類されれば、遺伝子発現が確定される 。 遺伝子発現は、存在(発現)、限界値、又は非存在(非発現)として示される 。以下の遺伝子発現が適正である場合には、遺伝子は 発現したと示される:A及び(X又はY)及び(Q又はR)。言い換えれば、P 1>=2.1、P2>=0.20及びP3>=1.1である場合、遺伝子は発現 したと示される。さらに、以下の発現が適正である場合、遺伝子は発現したと示 される:B及びX及びQ。 前記の説明に関して、遺伝子発現指標の要約を以下に示す: 存在 A及び(X又はY)及び(Q又はR) B及びX及びI 限界値 A及びX及びS B及びX及びR B及びY及び(Q又はR) 非存在 他のすべての場合(例えば、任意のCの組合せ) ユーザーへの出力に際して、工程274で、存在は「P」、限界値は「M」そ して非存在は「A」と示される。 一旦全プローブ対が処理され、遺伝子の発現が示されれば、工程275で、1 0回のLRの平均がコンピューター処理される。さらに、NPOS及びNNEG を増大したプローブに関するIDIF値の平均が算出される。これらの値は、本 実験と他の実験の定量的比較に用い得る。 定量測定は、工程276で実行される。例えば、最新実験が過去の実験(例え ば、工程270で算出した値)と比較される。さらに、実験は、公知量で生物学 的試料中に存在するRNA(例えば細菌からの)のハイブリダイゼーション強度 と比較される。このように、遺伝子発現指標又は呼出の正確さを立証し、閾値を 修正し、又は前述の任意数の修正を実行し得る。 分かり易くするために、図9は、単一遺伝子に関して記載した。しかしながら 、本方法は生物学的試料中の多数の遺伝子に関して利 用し得る。したがって、単一遺伝子の分析のいかなる考察も、本方法が多重遺伝 子をプロセッシングするために拡張され得ないことを示すとは限らない。 図10A及び10Bは、ベースライン走査データと実験走査データを比較する ことにより遺伝子の発現を確定する方法の流れを示す。例えば、ベースライン走 査データは、遺伝子が発現されることが公知の生物学的試料からのものである。 したがって、この走査データを異なる生物学的試料と比較して、遺伝子が発現さ れるか否かを確定する。さらに、それは、単数又は複数の遺伝子の発現が生体内 で時間中にいかに変化するかを確定する。 工程302で、コンピューターシステムはベースラインからのN対の完全マッ チ及びミスマッチプローブの生走査データを受け取る。ベースラインからの完全 マッチプローブのハイブリダイゼーション強度を「Ipm」とし、ベースラインか らのミスマッチプローブのハイブリダイゼーション強度を「Imm」とする。工程 304で、バックグラウンドシグナル強度をベースライン走査データの対のハイ ブリダイゼーション強度の各々から差し引く。 工程306で、コンピューターシステムは実験生物学的試料からのN対の完全 マッチ及びミスマッチプローブの生走査データを受け取る。実験からの完全マッ チプローブのハイブリダイゼーション強度を「Jpm」とし、実験からのミスマッ チプローブのハイブリダイゼーション強度を「Jmm」とする。工程308で、バ ックグラウンドシグナル強度を実験走査データの対のハイブリダイゼーション強 度の各々から差し引く。 I及びJ対のハイブリダイゼーションは、工程310で正規化される。例えば 、IV(A)の項で考察したように、I及びJ対のハイブリダイゼーション強度 を対照のハイブリダイゼーション強度で 割る。 工程312で、I及びJ対のプローブのハイブリダイゼーション強度を差異閾 値(DDIF)及び比閾値(RDIF)と比較する。ある対(Jpm−Jmm)と他 の対(Ipm−Imm)のハイブリダイゼーション強度間の差が差異閾値以上である か、そしてある対(Jpm−Jmm)と他の対(Ipm−Imm)のハイブリダイゼーシ ョン強度の商が比閾値以上であるかが確定される。差異閾値は、典型的には、単 数又は複数の遺伝子の正確な発現モニタリングを生じるよう確定されたユーザー 定義値である。 (Jpm−Jmm)−(Ipm−Imm)>=DDIF及び(Jpm−Jmm)/(Ipm− Imm)>=RDIFである場合、NINC値は工程314で増大される。概して 、NINCは、遺伝子発現がベースライン試料より大きくなり(又は増大され) そうであることを示すプローブの実験対が示すことを示す値である。NINCは 、遺伝子の発現がベースライン試料と比較して実験試料では大きい(又は増大) か、小さい(又は低減)か、あるいは変わらなかったかの確定に用いられる。 工程316で、(Jpm−Jmm)−(Ipm−Imm)>=DDIF及び(Jpm−Jmm )/(Ipm−Imm)>=RDIFであるか否かを確定する。この発現が適正で ある場合は、NDEC値が増大される。概して、NDECは、遺伝子発現がベー スライン試料より少なくなる(又は低減される)ことを示すプローブの実験対を 示す値である。NDECは、遺伝子の発現がベースライン試料と比較して実験試 料では大きい(又は増大)か、小さい(又は低減)か、あるいは変わらなかった かの確定に用いられる。 遺伝子が実験試料より多く又は少なく発現されることを示すハイブリダイゼー ション強度を示す各対に関して、NPOS、NNEG 及びLR値をプローブの各対に関して算出する。これらの値は、図9に関して上 記で考察したのと同様に算出される。「B」又は「E」の添字は、その値がそれ ぞれベースライン試料を示すか実験試料を示すかを標示するために、各値に付加 した。工程322でハイブリダイゼーション強度の次の対が存在する場合、それ らは図示したのと同様に処理される。 ここで図10Bを参照すると、絶対デシジョン計算は、工程324でベースラ イン及び実験試料の両方に関して実行される。絶対デシジョン計算は、ベースラ イン及び実験試料の各々において遺伝子が発現されるか、限界値か又は存在しな いかの指標である。したがって、好ましい実施態様では、この工程は、試料の各 々に関して図9からの工程272及び274の実行を要する。これが実行中、単 独で得られた試料の各々に関する遺伝子発現の指標が存在する。 工程326で、デシジョンマトリックスを用いて2つの試料間の遺伝子発現の 差異を確定する。このデシジョンマトリックスは、上記で算出されたN、NPO SB、NPOSE、NNEGB、NNEGE、NINC、NDEC、LRB及び LRE値を用いる。デシジョンマトリックスは、NINCがNDEC以上である か否かによって、異なる計算を実行する。その計算を以下に示す。 NINC>=NDECである場合、以下の4つのP値が確定される: P1=NINC/NDEC P2=NINC/N P3=((NPOSE−NPOSB)−(NNEGE−NNEGB))/N P4=10*SUM(LRE−LRB)/N 次にこれらのP値を用いて、2つの試料間の遺伝子発現の差異を確 定する。 説明のために、P値は、前記でおこなったように、範囲に分類される。したが って、P値はすべて、以下による範囲に分類される: A=(P1>=2.7) B=(2.7>P1>=1.8) C=(P1<1.8) X=(P2>=0.24) Y=(0.24>P2>=0.16) Z=(P2<0.160) M=(P3>=0.17) N=(0.17>P3>=0.10) O=(P3<0.10) Q=(P4>=1.3) R=(1.3>P4>=0.9) S=(P4<0.9) 一旦P値が上記のブール値による範囲に分類されれば、2つの試料間の遺伝子発 現の差異が確定される。 NINC>=NDECである場合、遺伝子発現変化は、増大、限界的増大又は 変化なしとして示される。遺伝子発現指標の要約を以下に示す: 増大 A及び(X又はY)及び(Q又はR)及び(M又はN又はO) A及び(X又はY)及び(Q又はR又はS)及び(M又はN) B及び(X又はY)及び(Q又はR)及び(M又はN) A及びX及び(Q又はR又はS)及び(M又はN又はO) 限界的 A又はY又はS又はO 増大 B及び(X又はY)及び(Q又はR)及びO B及び(X又はY)及びS及び(M又はN) C及び(X又はY)及び(Q又はR)及び(M又はN) 変化なし 他のすべての場合(例えば任意のZの組合せ) ユーザーへの出力に際して、増大は「I」、限界的増大は「MI」そして変化 なしは「NC」と示される。 NINC<NDECである場合、以下の4つのP値が確定される P1=NDEC/NINC P2=NDEC/N P3=((NNEGE−NNEGB)−(NPOSE−NPOSB))/N P4=10*SUM(LRE−LRB)/N 次にこれらのP値を用いて、2つの試料間の遺伝子発現の差異を確定する。 P値は、NINC>=NDECである他の場合と同様の範囲に分類される。し たがって、P値は、この場合、同一範囲を示し、簡潔にするために繰り返さない 。しかしながら、その範囲は一般的に、以下に示すように2つの試料間の遺伝子 発現の異なる変化を示す。 NINC<NDECである場合、遺伝子発現変化は、低減、限界的低減又は変 化なしとして示される。遺伝子発現指標の要約を以下に示す: 低減 A及び(X又はY)及び(Q又はR)及び(M又はN又はO) A及び(X又はY)及び(Q又はR又はS)及び(M又はN) B及び(X又はY)及び(Q又はR)及び(M又はN) A及びX及び(Q又はR又はS)及び(M又はN又はO) 限界的 A又はY又はS又はO 低減 B及び(X又はY)及び(Q又はR)及びO B及び(X又はY)及びS及び(M又はN) C及び(X又はY)及び(Q又はR)及び(M又はN) 変化なし 他のすべての場合(例えば任意のZの組合せ) ユーザーへの出力に際して、低減は「D」、限界的増大は「MD」そして変化 なしは「NC」と示される。 上記で、ベースライン試料及び実験試料間の遺伝子発現間の相対的差異が確定 され得ることを示した。遺伝子が両試料中で発現されると示され(例えば、工程 324から)、以下の発現が適正である場合には、I、MI、D又はMD(即ち NCはなし)呼出をNCに変える別の試験を実施し得る: 平均(IDIFB)>=200 平均(IDIFE)>=200 1.4>=平均(IDIFE)/平均(IDIFB)>=0.7 したがって、遺伝子が両試料中で発現される場合、増大又は低減(限界的か否か )の呼出は、各試料に関する平均強度差が相対的に大きいか又は実質的に両試料 に関して同一である場合には、変化なし呼出に変えられる。IDIFB及びID IFEは各試料に関するすべてのIDIFの合計をNで割って算出される。 工程328で、定量的差異評価に関する値が算出される。対の各々に関する( (Jpm−Jmm)−(Ipm−Imm))を算出する。さらに、Jpm−Jmmの平均とIpm −Immの平均の商を算出する。これらの値は、工程330で結果を他の実験と 比較するのに用いられる。 実施例 以下の実施例で本発明をさらに説明するが、本発明はこれらに限定されない。実施例1.少数のネズミサイトカインに関するmRNAレベルを測定するために 設計される第一世代オリゴヌクレオチドアレイ A)標識RNAの調製 1)予選択遺伝子の各々から 14個の遺伝子(IL−2、IL−3、Il−4、IL−6、I1−10、I L−12p40、GM−CSF、IFN−γ、TNF−α、CTLA8、β−ア クチン、GAPDH、IL−11受容体及)BioB)を各々p Bluesc ript II KS(+)ファージミド(Stratagene,LaJolla,California ,USA)中にクローン化した。挿入物の配向は、T3 RNAポリメラーゼがセ ンス転写体を生じ、T7ポリメラーゼがアンチセンスを生じるようになされた。 in vitro転写(IVT)反応における標識リボヌクレオチド。ビオチン−又は フルオレセイン標識UTP及びCTP(1:3標識化:非標識化)+非標識化A TP及びGTPを、T7RNAポリメラーゼ(Epicentre Technologies,Madiso n,Wisconsin,USA)2500単位との反応に用いた。Melton et al.,Nucleic Acids Research,12:7035-7056(1984)に記載されているのと同様の方法で、切 断鋳型を用いてin vitro転写を実行した。典型的in vitro転写反応は、5μg D NA鋳型、Ambion’s Maxiscript in vitro Transcription Kit(Ambion Inc.,H uston,Texas,USA)に含まれているような緩衝液、及びGTP(3mM)、AT P(1.5mM)並びにCTP及びフルオレセイン処理UTP(全体で3mM、 UTP:F1−UTP 3:1)又はUTP及びフルオレセイン処理CTP(全 体で2mM、CTP:F1−CTP 3:1)を用いた。Ambion緩衝液中で実行 した反応は,20mM DTT及びRNアーゼ阻害剤を含有した。反応は、約1 .5〜約8時間実行した。 反応後、サイズ選択膜(ミクロコン−100)又はPharmaciaミクロスピンS −200カラムを用いて、取り込まれたヌクレオチドトリホスフェートを除去し た。RNAの総モル濃度は,260nmでの吸光度の測定値を基礎にした。RN A量の定量後、40mM RTris−酢酸pH8.1,100mM酢酸カリウ ム、30mM酢酸マグネシウム中で94℃で30〜40分間加熱することにより 、RNAを無作為に平均約50〜100塩基の長さに断片化した。断片化はRN A二次構造からの妨害の可能性を低減し、近接して間隔を置いたプローブ分子と の多重相互作用の影響を最小限にする。 2)cDNAライブラリーから 2つのネズミ細胞株:T10、即ちこの試験では標的遺伝子として用いられる 遺伝子(但し、IL−10,アクチン及びGAPDHは除く)を発現しないこと が公知のB細胞プラズマ細胞腫、及び2D6、即ちこの試験では標的遺伝子とし て用いられる遺伝子のほとんどを発現することが公知であるIL−12成長依存 性T細胞株(Th1型)の一方から標識RNAを産生した。したがって、T10 細胞株由来のRNAは、特定の標的遺伝子からの公知量のRNAを用いてスパイ クするのに適した良好な総RNAベースライン混合物を提供した。これに対比し て、2D6細胞株由来のmRNAは、標的遺伝子からの典型的内生的転写量のR NAを提供する良好な陽性対照を提供した。 i)T10ネズミB細胞株 IL−11の存在下で選択することにより、IL−6依存性ネズ ミプラズマ細胞腫細胞T1165(Nordan et al.,(1986),Science 233:566-5 69)からT10細胞株(B細胞)を得た。指向性cDNAライブラリーを調製す るために、RNAStat60(Tel−TestB)を用いて全細胞性RNA をT10細胞から単離し、PolyAtractキット(Promega,Madison,Wi sconsin,USA)を用いてポリ(A)+RNAを選択した。両方の反応で5−メチ ルデオキシシチジン5’トリホスフェート(Pharmacia LKB,Piscataway,New J ersey,USA)をDCTPの代わりに用いる以外は、Toole et al.,(1984)Natu re,312:342-347にしたがって、一次及び二次鎖cDNAを合成した。 cDNA頻度を測定するために、T10ライブラリーをプレート化し、DNA をニトロセルロースフィルターに移して、32P−標識βアクチン、GAPDH及 びIL−10プローブで精査した。アクチンは1:3000,GAPDHは1: 1000そしてIL−10は1:35000の頻度で表示された。上記のように NotI及びSfiI切断cDNAライブラリーin vitro転写反応から、標識化 センス及びアンチセンスT10RNA試料を合成した。 ii)2D6ネズミヘルパーT細胞株 2D6細胞株は、Fijiwara等により開発されたネズミIL−12依存性T細胞 株である。細胞を、10%加熱不活性化ウシ胎仔血清(JRH Biosciences) 、0.05mM P−メルカプトエタノール及び組換え体ネズミIL−12(1 00単位/mL、Genetics Institute,Cambridge,Massachusetts,USA)を含 有するRPM11640培地中で培養した。サイトカイン誘導のために、細胞を IL−12無含有培地中で一夜予備インキュベートし、次に再懸濁した(106 細胞/ml)。5nMカルシウムイオノフォアA23187(Sigma Chemical C o.,St.Louis Missouri,USA)及び1 00nM 4−ホルボール−12−ミリステート 13−アセテート(Sigma) を含有する培地中で、0、2、6及び24時間インキュベート後、遠心分離によ り細胞を収集し、RNAの単離前にリン酸緩衝塩水で1回洗浄した。 T10と同様の方法で、Gibco BRLから入手可能なα−ZipLox、Not I−SalIアームを用いて2D6cDNAを指向的にクローニングすることに より、標識化2D6mRNAを産生した。線状化pZ11ライブラリーをT7を 用いて転写して、上記のようにセンスRNAを生成した。 iii)RNA調製 細胞性RNAから直接生成される物質に関しては、細胞質RNAをFavaloro e t al.,(1980)Meth.Enzym.,65:718-749の方法により細胞から抽出し、ポリ( A)+RNAをオリゴdT選択工程(PolyAtract,Promega)を用いて単離した。 Eberwine et al.,(1992)Proc.Natl.Acad.Sci.USA,89:3010-3014(Van Geld er et al.,(1990)Science 87:1663-1667も参照)に記載された方法の変法を用 いて、RNAを増幅した。T7RNAポリメラーゼプロモーター部位を組み入れ たオリゴdTプライムを含有するcDNA合成キット(Life Technologies)を 用いて、1μgのポリ(A)+RNAを二本鎖cDNAに変換した。二次鎖合成 後、反応混合物をフェノール/クロロホルムで抽出し、膜濾過工程(ミクロコン −100,Amicon,Inc.,Beverly Massachusetts,USA)を用いて二本鎖DNA を単離した。上記のようにIVT工程を用いてcDNAから直接、標識化cRN Aを作製した。標識化cRNAの総モル濃度を260nmでの吸光度から確定し 、1000リボヌクレオチドの平均RNAサイズを想定した。1ODがRNA 40μgと等価で、細胞性mRNA 1μgがRNA分子3pmolから成ると いう 慣用的変換を用いて、RNA濃度を算出した。 さらに、いかなる中間体cDNA又はRNA合成工程も用いずに、細胞性mR NAを直接標識した。上記と同様にしてポリ(A)+RNAを断片化し、断片の 5’末端をキナーゼ処理して、T4 RNAリガーゼ(Epicentre Technologies )の存在下でビオチニル化オリゴリボヌクレオチド(5’−ビオチン−AAAA AA−3’)とともに一夜インキュベートした。あるいは、ビオチン(Schleich er & Schuell)に結合したソラレン誘導体とのUV−誘導化架橋により、mRN Aを直接標識した。 B)高密度アレイ調製 VLSIPS技術を用いて、20merオリゴヌクレオチドプローブの高密度 アレイを生成した。高密度アレイは、表2に列挙したオリゴヌクレオチドプロー ブを含む。中央ミスマッチ対照プローブが各遺伝子特異的プローブに対して提供 され、その結果16,000以上の異なるオリゴヌクレオチドプローブを含有す る高密度アレイが生じる。 表2.高密度アレイ設計。すべてのプローブに関して、中央一塩基ミスマッチ を有するミスマッチ対照が存在した。 高密度アレイは平面ガラススライド上に合成された。 C)アレイハイブリダイゼーション及び走査 cDNAから転写されたRNAを高密度オリゴヌクレオチドプローブアレイ( 単数又は複数)と低緊縮でハイブリダイズして、より高い緊縮条件下で洗浄した 。ハイブリダイゼーション溶液は、0.9M NaCl、60mM NaH2P O4、6mM EDTA及び0.005%TritonX−100を含有し、p H7.6に調整した(6xSSPE−Tとして示される)。さらに、溶液は、0 .5mg/ml非標識化分解ニシン精子DNA(Sigma Chemical Co.,St.Louis ,Missouri,USA)を含有した。ハイブリダイゼーション前に、RNA試料をハ イブリダイゼーション溶液中で10分間、9℃に加熱し、氷上に5分間放置して 、ハイブリダイゼーション流動セル内に入れる前に、室温に平衡させた。ハイブ リダイゼーション後、溶液を除去し、アレイを6xSSPE−Tで22℃で7分 間洗浄した後、0.5xSSPE−Tで40℃で15分間洗浄した。ビオチン標 識RNAを用いた場合は、ハイブリダイズRNAをストレプトアビジン−フィコ エリトリン複合体(Molecular Probes,Inc.,Eugene,Oregon,USA)で読み取 り前に染色した。ハイブリダイズ化アレイを、6xSSPE−T中の2μg/m lストレプトアビジン−フィコエリトリンで40℃で5分間染色した。 目的のために修正した走査同時焦点顕微鏡(Molecular Dynamics,Sunnyvale ,California,USA)を用いて、アレイを読みとった。スキャナーはアルゴンイ オンレーザーを励起源として用い,530nmバンドパスフィルター(フルオレ セイン)又は560nmロングパスフィルター(フィコエリトリン)を通して、 光電子増倍管で発光を検出した。 センス又はアンチセンス配向の核酸をハイブリダイゼーション実験に用いた。 光化学工程の順序を逆にして、相補的ヌクレオチドを組み入れることにより、同 一組の写真平板マスクをもちいて、いずれかの配向のアレイ(互いの逆補体)を 作製した。 D)ハイブリダイゼーションのパターン及び強度の定量分析 ハイブリダイゼーション結果の定量分析は、完全マッチプローブ(PM)が対 応するミスマッチプローブ(MM)より明るい場合を計数し、各プローブ族(即 ち、各遺伝子に関するプローブ収集物)に関する差(PM−MM)を平均し、そ してその値を非スパイク化試料(適用可能な場合には)を用いて同様に合成され たアレイに関する並行実験で得られた値と比較することを包含した。差の平均法 は、無作為交差ハイブリダイゼーションからの信号は等しく、平均して、PM及 びMMプローブに関与するが、一方特異的ハイブリダイゼーションはPMプロー ブの法により多く関与するというものである。対毎の差を平均することにより、 実信号は構成的に加わり、一方、交差ハイブリダイゼーションからの関与が無効 にされる傾向がある。 差異(PM−MM)値の平均の変化の大きさは、スパイク実験の結果、並びに 公知量で各試料中にスパイクされた内部標準細菌RNAに関して観察された信号 を比較することにより、解釈した。分析は、本明細書中に記載した算法及びソフ トウエアを用いて実行した 。 E)プローブ選択の最適化 各標的遺伝子に関するプローブ選択を最適化するために、標的遺伝子の各々か ら転写された標識化RNAの混合物を用いて、オリゴヌクレオチドプローブの高 密度アレイをハイブリダイズした。データ獲得システムに接続したレーザー照明 走査同時焦点蛍光顕微鏡を用いて高密度アレイを走査することにより、高密度ア レイ上の各位置での蛍光強度を測定した。 次に二段階法でさらに別のデータに関してプローブを選択した。先ず、計数す るために、プローブ及びその対応するミスマッチプローブ間の強度差は、閾値限 界(この場合は、50カウント又はバックグラウンドの約半分)を超えねばなら なかった。これは、十分ハイブリダイズしなかったプローブ及びミスマッチ対照 が完全マッチに匹敵する強度でハイブリダイズするプローブを考慮から排除した 。 高密度アレイを、原則的として、高密度アレイ上に配列を全く含有しない標識 化RNA試料とハイブリダイズした。この場合、センスRNAと相補的なオリゴ ヌクレオチドプローブが選択された。したがって、アンチセンスRNA集団はア レイ上のいかなるプローブともハイブリダイズできなかったはずである。プロー ブ又はそのミスマッチが閾値(バックグラウンドより100カウント多い)以上 のシグナルを示した場合、それはその後の分析には含まれなかった。 次に、特定の遺伝子に関するシグナルを、各遺伝子に対して選択されたプロー ブに関して平均差(完全マッチ−ミスマッチ対照)として計数した。 E)結果:高密度アレイは標的核酸の特異的及び高感度検出を提 供する 上記で説明したように、初期アレイは、12のネズミmRNA−即ち、9サイ トカイン、1サイトカイン受容体、2構成的発現遺伝子(5−アクチン及びグシ セラルデヒド3−ホスフェートデヒドロゲナーゼ)−1ラットサイトカイン及び 定量参照として役立つ1細菌遺伝子(大腸菌ビオチンシンターゼ、BioB)と 相補的な16,000プローブ以上を含有した。これらの相対的に簡単なアレイ を用いた初期実験は、短in situ合成オリゴヌクレオチドが複合細胞性RNA集 団中のRNAを定量的に検出するのに十分な感受性及び特異性を有してハイブリ ダイズするよう作製され得るか否かを確定するよう意図された。これらのアレイ は、意図的に非常に冗長で、発現レベルの確定に必要以上の多さであるRNA当 たり数百のオリゴヌクレオチドを含有した。これは、多数のプローブのハイブリ ダイゼーション行動を検査し、実質的により多くの遺伝子を網羅する最小プロー ブ組の先験的選択のための一般配列規則を開発するために実施した。 オリゴヌクレオチドアレイは、モニタリングされるRNAの各々に対するプロ ーブ対の収集物を含有した。各プローブ対は、好ましくは特定メッセイージの部 分列と相補的である(完全マッチ又はPMプローブとして示される)20−me r、及び中央一の単一塩基の差異を除いて同一である相手で構成された。各対の ミスマッチ(MM)プローブは、ハイブリダイゼーション特異性に対する内部対 照として役立った。PM/MM対の分析は、交差ハイブリダイゼーションシグナ ルの存在下で、まれなRNAからの低強度ハイブリダイゼーションパターンを高 感度に且つ正確に認識させた。 アレイハイブリダイゼーション実験のために、上記のように、個々のクローン 、クローン化CDNAライブラリーから、又は直接、 細胞性mRNAから、標識RNA標的試料を調製した。in vitro転写(IVT) 反応に蛍光標識リボヌクレオチドを組み入れて、RNAを30〜100塩基の平 均サイズに断片化することにより、アレイハイブリダイゼーションのための標的 RNAを調製した。30分〜22時間の範囲の間、自己含有流動細胞(容量〜2 00μl)中で、試料をアレイとハイブリダイズした。アレイの蛍光画像形成は 、走査同時焦点顕微鏡(Molecular Dynamics)を用いて成し遂げられた。全アレ イは、15分未満で11.25μm(100x100μm合成領域の各々での過 剰試料採取の〜80倍)の解像度で読みとられ、個々のハイブリダイゼーション 反応の各々の迅速且つ定量的測定値が得られた。 1)ハイブリダイゼーションの特異性 ハイブリダイゼーションの特異性を評価するために、上記の高密度アレイを、 IL−2、IL−3、IL−4、IL−6、アクチン、GAPDH及びBioB 又はIL−10、IL−12p40、GM−CSF、IFN−γ、TNF−α、 mCTLA8及びBioBの50pMのRNAセンス鎖を用いてハイブリダイズ した。ハイブリダイズ化アレイは、最小交差ハイブリダイゼーションにより被験 標的核酸の各々に対して強力な特異的シグナルを示した。 2)複合標的試料中の遺伝子発現レベルの検出 全哺乳類細胞メッセージ集団の存在下で、個々のRNA標的がどれくらい良好 に検出され得るかを確定するために、スパイク実験を実施した。公知量の個々の RNA標的を、ネズミB細胞株T10から作製された代表的cDNAライブラリ ーから得られた標識RNA中でスパイクさせた。T10細胞株は、サイトカイン がモニタリングされ、IL−10だけが検出可能レベルで発現されるために、選 択された。 RNA混合物を選択された標的遺伝子で一回スパイクし、次に直ちにハイブリ ダイゼーションが残りの混合物に対して読み取り値の人工的上昇を提供するため に、スパイク化試料を一連の手順で処理して、ライブラリーRNAと付加RNA との間の差を軽減した。したがって、「スパイク」を試料に付加し、これを37 ℃に加熱して、アニーリングした。次に試料を凍結させ、解氷して、5分間沸騰 させ、氷上で冷却して、室温に戻し、その後ハイブリダイゼーションを実施した 。 図2Aは、13の標的RNAを全RNAプール中で1:3,000(200〜 300コピー/細胞と等価)のレベルでスパイクした。RNA頻度は、個々のR NAモル量/全RNAモルとして示された。図2Bは、インターロイキン−2及 びインターロイキン−3(IL−2及びIL−3)RNAに特異的なプローブを 含有する小部分のアレイ(図2Aの矩形領域)を示し、図2Cは、スパイク化標 的の非存在下での同一領域を示す。ハイブリダイゼーションシグナルは、スパイ ク化及び非スパイク化画像間の比較により示されたように特異的で、より明るい 行(PMプローブに対応する)とより暗い行(MMプローブに対応する)が交互 に並ぶパターンで示されるように、完全マッチ(PM)ハイブリダイゼーション はミスマッチ(MM)から良好に識別された。異なる完全マッチハイブリダイゼ ーションシグナル間に観察された変異は高度に再現可能で、ハイブリダイゼーシ ョンの配列依存性を反映する。2〜3の場合、複合RNA集団の他の成員との交 差ハイブリダイゼーションのために、完全マッチ(PM)プローブはそのミスマ ッチ(MM)相手より有意に明るくはなかった。パターンが高度に再現可能であ るために、そして検出がRNA当たり単一のプローブのみに依らないために、こ の型のまれな交差ハイブリダイゼーションは低レベルのRNAでさ え、高感度に且つ正確に検出され得た。 同様に、例えばRNA又はプローブ二次構造による低頻度の不十分なハイブリ ダイゼーション、多型又はデータベース配列エラーの存在は検出の妨げとならな い。ハイブリダイゼーション及び交差ハイブリダイゼーションの観察されたパタ ーンの分析から、本明細書中に記載した最良の感度及び特異性を有するオリゴヌ クレオチドプローブの選択のための一般原則が形成される。 3)標的濃度とハイブリダイゼーションシグナルとの関係 第二組のスパイク実験を実行して、RNAレベルの直接定量のためにハイブリ ダイゼーションシグナルが用いられる濃度の範囲を確定した。図3は、10サイ トカインRNAを、1:300〜1:300,000の範囲のレベルで、B細胞 (T10)cDNAライブラリーからの0.05mg/mlの標識化RNA中に 一緒にスパイクした。1:300,000の頻度は、2〜3未満コピー/細胞で 存在するmRNAのものである。10μgの全RNA中で、200μlの容量で 、1:300,000の頻度は特異的RNAの約0.5ピコモル及び0.1フェ ムトモル(〜6x107分子又は約30ピコグラム)の濃度に相当する。 ハイブリダイゼーションは、40℃で15〜16時間、平行して実行した。1 0のサイトカインRNAの各々の存在は、最低頻度でも、バックグラウンド以上 に再現可能的に検出された。さらに、ハイブリダイゼーション強度は、1:30 0,000〜1:3000の間でRNA標的濃度と線状に関連した(図3)。1 :3000〜1:300では、プローブ部位が15時間ハイブリダイゼーション の途中で高濃度で飽和するよう開始されたため、シグナルは10という依りむし ろ4〜5の因子により増大した。線状反応範囲は、ハイブリダイゼーション時間 を低減することにより、高濃度にまで広 げ得る。短時間ハイブリダイゼーションと長時間ハイブリダイゼーションを組合 せて、104倍の範囲以上のRNA濃度を定量的に網羅し得る。 盲検スパイク実験を実行して、複合RNA集団中に広範囲の濃度で存在する多 数の関連RNAを同時に検出し、低領する能力を調べた。ネズミB細胞CDNA ライブラリーから転写された0.05mg/mlのセンスRNA+異なる濃度の 10のサイトカインRNAの各々の組合せを含有する4つの試料の組を調製した 。個々のサイトカインRNAを下記のレベルのうちの1つでスパイクした:0、 1:300,000、1:30,000、1:3000又は1:300。4つの 試料+非スパイク化参照試料を、40℃で15時間、別々のアレイとハイブリダ イズした。ハイブリダイゼーションのパターン及びそれが非スパイク化参照試料 とどのように異なるかによりRNA標的の存在又は非存在を確定し、強度により 濃度を検出した。4つの盲検試料中の10のサイトカインの各々の濃度は正しく 測定され、擬似陽性又は擬似陰性はなかった。 特に注目に値する一例を挙げる:IL−10は、CDNAライブラリーを作製 するために用いられるマウスB細胞中で発現され、1:60,000〜1:30 ,000の頻度でライブラリー中に存在することが公知であった。公知でないも のの1つにおいて、付加量のIL−10RNA(1:300,000の頻度に対 応する)を試料中にスパイクした。固有のレベルより10〜20%だけ上回る増 大が示された場合でも。スパイク化IL−10RNAの量を正確に測定した。こ れらの結果は、発現の微妙な変化が同様に合成されたアレイ上の同様に調製され た試料を用いた並行実験を実施することにより、高感度に測定されることを示す 。実施例2.刺激後の時間の一関数としてサイトカインmRNAを測 定するT細胞誘導実験 次に、本発明の高密度アレイを用いて、生化学的刺激後の異なる時間でのネズ ミT細胞におけるサイトカインMRNAをモニタリングした。ネズミTヘルパー 細胞株(2D6)からの細胞をホルボールエステル 4−ホルボール−12−ミ リステート 13−アセテート(PMA)及びカルシウムイオノフォアで処理し た。次にポリ(A)+MRNAを、刺激後0、2、6及び24時間目に単離した 。単離mRNA(約1μg)を、二重鎖cDNA合成工程とその後のin vitro転 写反応とを組合せた方法を用いて、標識化アンチセンスRNAに変換した。この RNA合成及び標識法は、全mRNA集団を、明らかに非偏向性及び再現可能性 様式で、20〜50倍だけ増幅する(表2)。 次に、4つの時点からの標識化アンチセンスT細胞RNAをDNAプローブア レイと2〜22時間ハイブリダイズした。4つのその他のサイトカインmRNA (IL−3、IL−10、GM−CSF及びTNFα)の有意の変化とともに、 γ−インターフェロンmRNAレベルの大きな増大が観察された。図4に示すよ うに、サイトカインメッセージは、同一動力学では誘導されなかった。1:13 0,000未満のサイトカインmRNAレベルの変化は、γ−インターフェロン に関して観察された非常に大きな変化とともに、はっきりと検出された。 これらの結果は、本方法に固有の大きな実験的動的範囲の値を際だたせる。ハ イブリダイゼーション結果からのRNAレベルの定量的査定は直接的で、付加的 対照ハイブリダイゼーション、試料操作、増幅、クローニング又はシーケンシン グを伴わない。本方法はさらに、効率がよい。最新プロトコール、計器及び分析 ソフトウエアを用いて、独りのユーザーが1つのスキャナーで1日に30もの多 数のアレイを読みとり、分析し得る。実施例3.100以上のネズミ遺伝子に関する65,000プローブを含有する 高密度アレイ 図5は、全ネズミB細胞RNA集団とのハイブリダイゼーション後の65,0 00以上の異なるオリゴヌクレオチドプローブ(50μmの特徴サイズ)を含有 するアレイを示す。この複雑性を有するアレイを、15分未満に7.5limの 解像度で読み取った。アレイは、上記のより簡単なアレイ上に示される12のネ ズミ遺伝子、35U.S.C.§102()付加的ネズミ遺伝子、3つの細菌遺 伝子、及び1つのファージ遺伝子を含めた118の遺伝子に対するプローブを含 有する。約300プローブ対/遺伝子が存在し、プローブは本明細書中に記載さ れた選択規則を用いて選択される。各遺伝子の翻訳領域の3’末端の配列の60 0個の塩基から、プローブを選択した。21のネズミRNAの全部が、約1:3 00,000〜1:100の範囲のレベルで、B細胞RNA集団中にはっきりと 検出された。 T細胞誘導実験(図4)からの標識化RNA試料をこれらのより複雑な118 遺伝子アレイとハイブリダイズし、両方のチップ型に共通して、遺伝子組に関し て同様の結果が得られた。図4に示したものの他に、20以上のその他の遺伝子 に関して、発現変化がはっきりと観察された。 RNAの信頼できる検出のためには遺伝子当たり、もっと少ない組のプローブ で十分か否かを確定するために、118遺伝子チップからのハイブリダイゼーシ ョン結果を、20プローブ/遺伝子の10の異なる小集団を用いて、分析した。 即ち、アレイが遺伝子当たり20対だけのプローブを含有するデータを分析した 。20対の10の小集団をアレイ上の遺伝子当たり約300プローブから選択し た。初期プローブ選択は、上記と同様に、プローブ選択を用いて、算法を削減し て、実行した。次に、選択及び削減で残ったプローブから、20対のうちの10 の被験体を無作為に選択した。標識化RNAをネズミB細胞RNA集団中で1: 25,000、1:50,000及び1:100,000のレベルでスパイクし た。スパイク化RNAに関するハイブリダイゼーションシグナルの変化は、より 小さなプローブ組で、3レベルすべてで、一貫して検出された。予期されたよう に、ハイブリダイゼーション強度は、多数のプローブの平均を取った場合、ぴっ たりと密集しない。この分析は、遺伝子当たりの20プローブ対の組が低レベル での発現変化の測定に十分であるが、このような小プローブ組を用いた極最低レ ベルでRNAをルーチンに検出するためにはプローブ選択及び実験手順の改良が 好ましいことを示す。このような改良としては、進行中の、わずかに長いオリゴ ヌクレオチドプローブ(例えば,25merプローブ)の使用と結びついたより 高い緊縮性ハイブリダイゼーションが挙げられるが、これらに限定されない。実施例4.数千の遺伝子へのスケールアップ 約1650の異なるヒト遺伝子に対する25−merオリゴヌクレオチドプロ ーブを含有する4つの高密度アレイの組の各々は、全部で6620の遺伝子に対 するプローブを提供した。各遺伝子に対しては約20プローブが認められた。ア レイ上の特徴サイズは、50μであった。この高密度アレイを、本質的に上記と 同様のプロトコールを用いてcDNAライブラリーと首尾よくハイブリダイズし た。すべての公知の発現配列タッグ(EST)に対するオリゴヌクレオチドプロ ーブを含有する高密度アレイの同様の組が準備中である。実施例5.数千のRNAのうちの10の同時モニタリングのための 直接スケールアップ 高感度、特異的及び定量的であるのに加えて、本明細書中に記載されたアプロ ーチは、非常に多数のmRNAのモニタリングに対して、本質的に平行で、容易 に比例計算できる。モニタリング差あれるRNAの数は、RNA当たりのプロー ブ数を低減し、そしてアレイ当たりのプローブ数を増大することにより非常に増 大され得る。例えば、上記の技術を用いて、1.6cm2(20x20μm合成 特徴)の面積に400,000もの多数のプローブを含有するアレイが一般に合 成され、読み取られる。20プローブ対/遺伝子を用いて、プローブ冗長性の重 要な利点を保持しながら、単一アレイ上で10,000遺伝子がモニタリングさ れる。4つのこのようなアレイの組は、公的データベース中に発現配列タッグ( ESTS)が存在する40,000以上のヒト遺伝子を網羅し、新規のESTが 、それらが利用可能になるように組み込まれる。化学合成の組合せ性のために、 この複雑さを有するアレイが、ここで用いられるより簡単なものと同じ数の工程 で同量の時間で作られる。遺伝子当たりさらに少ないプローブでそして高密度の アレイを用いると、単一又は少数の小チップ上で全シーケンシング化ヒト遺伝子 の同時モニタリングが可能になる。 多数の遺伝子に対する発現レベルの定量的モニタリングは、遺伝子機能を解明 し、疾病の原因及びメカニズムを探査するのに、そして潜在的治療及び診断標的 の発見のために有益であることを立証する。ゲノム情報の本体が成長すると、本 明細書に記載した型の高度平行法は、細胞の根元的生理学を解明する手助けとな る配列情報を用いる有効且つ直接的方法を提供する。実施例6.ニューラルネットを用いたプローブ選択 プローブの塩基の配列又はその他のプローブ特性を基礎にしたプ ローブのハイブリダイゼーション及び交差ハイブリダイゼーション強度を予測す るために、ニューラルネットを養成し得る。次に、ニューラルネットを用いて任 意数の「最良」プローブを摘み取ることができる。ニューラルネットを養成して これを実行すると、予測強度と実測強度との間に中等度の(0.7)相関が生じ 、ハイブリダイゼーションより交差ハイブリダイゼーションに対するより良好な モデルとなる。 A)入力/出力マッピング ニューラルネットを養成して、20merプローブのハイブリダィゼーション 特性を同定した。20merプローブを80ビット長入力ベクターにマッピング すると、最初の4ビットはプローブの最初の位置の塩基を示し、次の4ビットは 第二の位置の塩基を…表した。したがって、4つの塩基は下記のようにコードさ れた: A:1000 C:0100 G:0010 T:0001 ニューラルネットワークは2つの出力:ハイブリダイゼーション強度及び交差 ハイブリダイゼーション強度を生じた。出力は、実際の実験からの出力の95% が0.〜1.の範囲におさまるように、線状に尺度を定められた。 B)ニューラルネットアーキテクチャー ニューラルネットは、80の入力ニューロン、20ニューロンを有する1つの 隠れ層及び2ニューロンを有する出力層を有するバックプロパゲーションネット ワークであった。S状伝達関数を用いた:(s(x)=1/(1+exp(−1* x)))これは非線状(S状)様式で、0〜1の入力値を一定基準で評価する 。 C)ニューラルネット養成 バックプロパゲーションネットワーク用のNeural Works Professional 2.5(N eural Works Professionalは、Neural Ware,Pitts burgh Pennsylvania,USAの製品である)からのデフォルトプログラムを用いて 、ネットワークを養成した。養成組は、約8000例のプローブ、関連ハイブリ ダイゼーション及び交差ハイブリダイゼーション強度で構成された。 D)ニューラルネット重量 ニューラルネット重量は、2つのマトリックスに提示される:81x20マト リックス(表3)(重量1)及び2x20マトリックス(表4)(重量2)。表3.ニューラルネット重量(81x20マトリックス)(ウエイト1) 表4.第二ニューラルネット計量マトリックス(2x21)(ウエイト2) E)ネット実行のためのコード ニューラルネットを実行するためのコードを、下記の表5(neuraal n.c)及び表6(lin alg.c)に提示する。 表5.ニューラルネット実行のためのコード(neural n.c.) 表6ニューラルネット用コード(lin alg.c) 実施例7.総称的差異スクリーニング 光指向性ポリマー合成に用いられるマスクを紛れ込ませて、総称的差異スクリ ーニングのための任意の(偶発的)プローブオリゴヌクレオチドを包含する高密 度アレイを生成した。その結果生じたアレイは、34,000対以上の25me r任意プローブオリゴヌクレオチドを含有した。各対中のオリゴヌクレオチドは 、位置13の単一ヌクレオチドが異なった。 上記のようにハイブリダイゼーション、線状、染色及び走査後、データファイ ル(プローブ同一性及びハイブリダイゼーション強度に関する情報を含有)を作 製した。 各プローブ対K(Kは1〜34,320の範囲)を包含する2つのオリゴヌク レオチド間の強度の差を算出した。さらに、試料iの複製jに対する対Kのオリ ゴヌクレオチド間の強度差を下記のように算出した: Xijk1−Xijk2 (式中、Xはハイブリダイゼーション強度であり、iはいずれかの試料(この場 合は試料1又は2)を示し、jはいずれかの複製(この場合は複製1又は各試料 に対しては2つ)を示し、Kはプローブ対(この場合は、1…・・34,320 )であり、1はプローブ対の一方の成員を示し、2はプローブ対の他方の成員を 示す)。 図16a及び16b及び16cは、各プローブに関する試料1の複製1及び2 間(図16a、正常細胞株)の、そして試料2の複製1及び複製2間(図16b 、腫瘍細胞株)の差異を示す。したがって、図16aは、縦軸上のK−1〜34 ,320、並びに横軸上のKに関する(X11k1−X11k2)−(X12k1−X12k2) の値をプロットする。2つの複製は、全プローブ対に関して、(X11k1−XN11 k2 )/(X12k1−X12k2)の平均比を基礎にして正規化される(即ち、正規化後 、平均比は約1である)。同様に、図15bは、(X21k1−X21k2)/(X22k1 −X22k2)の平均比を基礎にして、2つの複製間の正規化後の(X21k1−X21k2 )−(X22k1−X22k2)の値をプロットする。図16cは、2つの複製を平均し た試料1及び2間の差異をプロットする。この値は、[(X21k1+X22k2)/2 ]/[(X11k1+X12k2)/2]の平均比を基礎にした2つの試料間の正規化後 の((X21k1+X22k2)/2)-((X11k1+X12k2)/2)として算出される 。 図17a、17b及び17cは、濾過されたデータを示す。図16aは、各オ リゴヌクレオチド対の差に関する試料1の複製1及び2のハイブリダイゼーショ ン強度の相対変化を示す。複製間で正規化(上記参照)後、以下のように比を算 出する:(X11k1−X11k2)/(X12k1−X12k2)の絶対値が>1である場合に は、比=(X11k1−X11k2)/(X12k1−X12k2)であるか、さもなくば比=( X12k1−X12k2)/(X11k1−X11k2)(逆)。図17aと同様の 方法で正規化し、濾過し、そしてプロットした各オリゴヌクレオチド対の差に関 する試料2の複製1及び2の比を図17bに示す。比は図17aで算出したもの と同じであるが、(X21k1−X21k2)/(X22k1−X22k2)及び(X22k1−X22 k2 )/(X21k1−X21k2)の絶対値を基礎にした。図17cは、各オリゴヌクレ オチド対の差に関して2つの複製を平均した試料1及び試料2の比を示す。比率 は図17aと同様に算出するが、しかし図16cの場合と同様に、正規化後の[ (X21k1+X22k2)/2]/[(X11k1+X12k2)/2]及び[(X11k1+X12 k2 )/2]/[(X21k1+X22k2)/2]の絶対値を基礎にした。 2つの試料間の最大示差的ハイブリダイゼーションを示すオリゴヌクレオチド 対は、観察されたハイブリダイゼーション比及び差異値を分類することにより、 同定し得る。最大変化(増大又は低減)を示すオリゴヌクレオチドは、試料1及 び2の比率プロットから容易に分かる(図17c)。これらの差異は、バックグ ラウンドノイズ中に存在するとは思えない。確認済みのオリゴヌクレオチド対配 列を基礎にして、遺伝子又は疑わしい配列タッグを有するESTを、配列データ ベース、例えばGENBANK中で探索して、遺伝子がクローニング及び特性化 されていたか否かを確定する。探索が陰性である場合には、適切なプライマーを 作製して、mRNA、cDNAから直接、又はcDNAライブラリーからcDN A又はcDNAの一部が得られる。 図16a及び16bから、いくつかのオリゴヌクレオチド対が同一試料に対す る2つの複製間に大きい差異を示すことが観察される。これは、与えられた組織 中の示差的発現に起因する、と考えられる。これらのオリゴヌクレオチド対は、 非常に高度に発現される遺伝子を検出し、したがってこれらの対に対する複製の 偏差は、低レ ベルで発現されるヌクレオチドと結合するオリゴヌクレオチド対より大きい(即 ち、平均の標準偏差は平均に比例する)。それが、2つの試料間の相対的変化が 2つの試料間の示差的発現を検出する良好な指標である理由である(図17c) 。どのオリゴヌクレオチド対が最大のものかを確定するために、絶対及び相対差 測定を組合せて評価する。 関連オリゴヌクレオチド対の数の増大(冗長性増大)及び二色ハイブリダイゼ ーション/検出図の使用は、バックグラウンド変異の低減に役立つと予期される 。これは、小差の検出感度をより高くし、ノイズ及び擬陽性出現を低減する。こ の実施例に用いられる25merアレイは考え得るすべての25merの小集団 で、したがってオリゴヌクレオチド対の総数の増大は、利用可能な配列空間をよ り完全な適用範囲とすることにより未知の配列の遺伝子の変化を検出する能力を 大いに増大する。実施例8.核酸末端標識 マウス細胞からのいくつかのRNA転写物並びに完全mRNA標本を、Mg2+ の存在下で断片化した。フルオレセインか又はビオチンで5’末端を標識したリ ボA。(デオキシリボ核酸6merポリA)を、次に標準条件下でRNAリガー ゼを用いて断片化RNAと結紮した。 標識は有効であると思われ、プローブとして標識化RNAを用いて得られたハ イブリダイゼーションパターンは、in vitro転写工程で標識されたRNAを用い て得られたものと同様であった。実施例9.標識効率の定量 特異的全長非断片化RNA種を全mRNAプール中でに、異なる濃度でスパイ クした後、末端標識して、標識効率の定量をおこなった。次に、上記のように調 製した標的オリゴヌクレオチドの高密度 アレイとのハイブリダイゼーションにより、プール中のスパイク化RNAの相対 濃度を測定した。これにより、mRNAプール中で低濃度で特定のRNA種を検 出する能力を評価し得る。実施例10.核酸のPCR標識 ポリメラーゼ連鎖反応(PCR) 10%ビオチン−dUTPで置換した20μlPCR反応を実施し、各PCR 産物の量をゲル分析で概算した。約250fmolの各PCR産物をプールした 。3000xgで予備回転させ、その後200μlのH2Oで洗浄して3000 xgでさらに1分間回転させて、Pharmacia S300セファクリルカラム(型番 27−5130−01)を調製した。プール化PCR産物を入れて、3000x gで2分間回転させた。 カラムの内容物を出し、溶出液を高速真空乾燥させた。 DNアーゼ断片化 乾燥させたPCRプールを、NEN Dupont末端標識キット(型番NEL824) からの13μlのH2O中に再懸濁した。2.5μlのCoCl2及び12.5μ lのTdT緩衝液を付加した。10mM Tris,pH8を用いて、Gibco B RL DNアーゼ1を0.25単位/μlに希釈した。希釈DNアーゼ1μlを PCR産物プールに付加し、37℃で6分間インキュベートして、99℃で10 分間変性し、4℃に冷却した。全容量は29μlであった。 末端トランスフェラーゼ(TdT)標識 断片化PCRプールに、2μlのTdT酵素(NENキット2単位/μlスト ックから)を付加し、次に4μlのNENキットビオチン−ddATPを付加し た。最終容量は35μlで、これを37℃で1.5時間インキュベートした。 ハイブリダイゼーション 35μlの標識化標的を2つの17.5アリコートに分解し、一方をコードチ ップ(センス鎖配列及びその互換物を含有する遺伝子チップ)、他方を非コード (アンチセンス)チップとした。182.5μlの2.5M TMACl(Sigm a,10mM Tris,pH8を用いて1:2に希釈した5Mストック液)を付 加した。TritonX−100を付加して、最終濃度を0.001%とした。 ある実験では、4μlの100nM対照オリゴヌクレオチドを染色工程というよ りむしろ、本溶液に付加した。 混合物を95℃で5分間変性させて、チップカートリッジに直接付加し、37 ℃で60分間混合してハイブリダイズさせた。 染色及び洗浄 遺伝子チップシステム(Affymetrix,Inc.,Santa Clara,CA)に用いた流動 セルからハイブリダイゼーション溶液を取り出して、6xSSPE/0,001 %TritonX−100で3回小室を洗浄して、TMAClを除去した。 フィコエリトリン染色溶液を以下のように調製した:190μlの6xSSP E/0,001%TritonX−100+10μlの20mg/mlアセチル 化BSA+0,4μlのストックフィコエリトリン(Molecular Probes型番S8 66)+4μlのフルオレセイン対照オリゴ100nMストック。 室温で5分間混合しながら、染色溶液を流動セルに付加した。染色溶液を流動 セルから除去し、洗浄緩衝液を用いて手動で3回洗浄した。 35℃で、6xSSPE/0,001%TritonX−100を用いて、チ ップをハイブリダイゼーションステーション(GeneChip System,Affymetrix,I nc.,)上で洗浄した。新鮮洗浄溶液をドレイン当たり9回変えて使用し、走査を この緩衝液中でおこなった 。この実験では、標的配列を正確に同定した。実施例11.末端標識PCR産物 PCR産物を断片化し、Boehringer MannheimからのTdTを用いて標識した :PCR増幅後、5μlの50μlPCR反応液を1%アガロースゲル上で反応 させて、増幅反応の総収量を概算した。DNAを断片化するために、残りの45 μlの溶液をDNアーゼI(H2O中に希釈して、最終濃度を5単位DNアーゼ I/DNAμgとした)と併合して、31℃で15分間反応させた。次にDNア ーゼを95℃で10分間加熱して不活性化した。その後、ターミナルトランスフ ェラーゼ反応の用意ができるまで、断片化DNA溶液を4℃に保持した。 ターミナルトランスフェラーゼ反応混合物は、断片化PCR試料、20μLの 5xターミナルトランスフェラーゼ反応緩衝液、6μlの25mM CoCl2 (最終濃度1.5mM)、1μlの蛍光ジデオキシヌクレオチドトリホスフェー ト(ddNTP最終濃度10μM)及び2μLのBoehringer Mannheimターミナ ルトランスフェラーゼ(TdT、最終濃度50単位/反応)で構成され、水を加 えて最終容量を100μlにした。 反応液を37℃で30分間インキュベートした。その後、全反応容量を1.7 ml試験管に移し、5xSSPE、0.05%Tritonを加えて500μl として、通常通りハイブリダイズし、走査した。 50μLのPCR反応液用プロトコールは、GeneChipTMHIVPRT検定(Af fymetrix,Sunnyvale,CA)に添付される使用説明書に記載されている。実施例12.CAIPは塩基呼出を改良する ある断片末端標識実験では、ウシ腸アルカリ性ホスファターゼ( CAIP)をDNアーゼによる断片化中に用いて、GeneChipシステムでの塩基呼 出の精度を改良した(図18参照)。 CIAPは、いかなる従来の増幅、並びにポリメラーゼその上ポリメラーゼ反 応にも組み込まれなかったあらゆるヌクレオチドを分解するのに有用である。こ のような分解はその後の反応、例えば尾部形成及び標識反応におけるヌクレオチ ドの取込みを防止する。実施例13.ハイブリダイゼーション後末端標識 ハイブリダイゼーション後末端標識実験を実施した。GeneChipシステム中での 標的とプローブアレイとのハイブリダイゼーション後、図19に示すように、タ ーミナルトランスフェラーゼ(TdTアーゼと示す)を用いて、標的を標識した 。 ハイブリダイゼーション後標識は、プローブアレイ(チップ)を図20及び2 1に示されているように呼び反応させると、良好な結果得られることが示された 。 図21は、DNアーゼ滴定実験の結果を示す。種々の滴定実験を、下記の表7 に示す。表7.ハイブリダイゼーション末端標識呼び出し精度。精度は、比=次の算出強 度に対する最大の1.2。算出強度=調整強度から差し引かれるタイル組中のA 、C、G又はTの最小値。調整強度=PCRの生強度−PCRなしの生強度。 これらの結果は、塩基呼出精度が標的断片の長さにより強くなりうることを示 す。 その他の実験は、1単位のDNアーゼが理想的断片長を得るのに特に有用であ ることを示した。実施例14.ポリTによる末端標識(テイリング) 実施例13に記載したのと同様の方法を用いてポリ−A類似体(標識化又は非 標識化)でテイリング処理した核酸は、図22に示すように、標識化ポリ−Tを 用いて標識し得る。実施例15.蛍光トリホスフェート標識の合成 0.5mlエッペンドルフ試験管中の0.5μmol(50μLの10mM溶 液)のアミノ誘導化ヌクレオチドトリホスフェート、 3’アミノ−3’デオキシチミジントリホスフェート(1)又は2’−アミノ− 2’−デオキシウリジントリホスフェート(2)に、メタノール中の25μLの ホウ酸ナトリウムの11M水性溶液,pH7、87μLのメタノール及び88μ L(10μmol,20wquiv)の5−カルボキシフルオレセイン−X−N HSエステルの100mM溶液を付加した。混合物を短時間回転させて、暗中で 15時間、室温に放置した。次にイオン交換HPLCにより試料を精製して、フ ルオレセイン処理誘導体、次式3又は式4を、約78〜84%の収率で得た。 実験は、これらの分子がターミナルトランスフェラーゼ(TdT)に対する基 質ではないことを示唆する。しかしながら、これらの分子はポリメラーゼ、例え ばクレノウ断片に対する基質であると考えられる。実施例10.アズ−トリアジン−3,5[2H,4H]−ジオンの 合成 類似体アズ−トリアジン−3,5[2H,4H]−ジオン(「6−アザーピリ ミジン」)ヌクレオチド(図23a参照)を、Petrie et al.,Bioconj.Chem. 2:411(1991)に用いられたのと同様の方法により、合成する。 5−ブロモ−U/dUTO又はddUTPを含めた、その他の有用な標識試薬 も合成される(例えば、Lopez-Canovas,L.et al.,Arch.Med.Res.25:189-1 92(1994);Li,X.,et al.,Cytometry 20:172-180(1995);Boultwood,J.et al .,J.Pathl.148:61ff.(1986);Traincard,et al.,Ann.Immunol.1340:399 -405(1983);及び図23a及び23b参照)。 上記の構造のすべてに対応するヌクレオチド類似体(特に、図23bのもの) の合成の詳細は、文献に説明されている。塩基にリンカーを付加するために、公 知の手法が適用される。リンカー修飾ヌクレオチドを次にトリホスフェートアミ ンに変換させて、市販の活性化誘導体を用いて、染料又はハプテンを最終的に付 着させる。 その他の適切な標識としては、非リボース又は非−2’デオキシリボース含有 構造(このうちのいくつかを図23cに示す)、並びに糖修飾ヌクレオチド類似 体(例えば図23d)が挙げられる。 本明細書中に提示した指針を用いて、本発明の実施に有用な試薬の合成方法及 び標識取込み方法(酵素的又はその他の方法)は、当業者には明らかである(例 えば、Chemistry of Nucleosides and Nucleotides 3,Townsend,L.B.ed.,Pl enum Press,New York,atchpt.4,Gordon,S.The Synthesis and Chemistry of Imidazole and Benzamidizole Nucleosides and Nucleotides(1994);Gen Ch em.Chemistry of Nucleosides and Nucleotides 3,Townsend,L.B.ed.,Plen um Press,New York(1994);can be made by me thods simliar to those set forth in Chemistry of Nucleotides 3,Townsend ,L.B.ed.,Plenum Press,New York,at chpt.4,Gordon,S.The Synthesis and Chemistry of Imidazole and Benzamidizole Nucleosides and Nucleotide s(1994);Lopez-Canovas,L.et al.,Arch.Med.Res 25:189-192(1994);Li,X. ,et al.,Cytometry 20:172-180(1995);Boultwood,J.et al.,J.Pathol.1 48:61 ff.(1986);Traincard,et al.,Ann.Immunol.1340:399-405(1983) 参照)。実施例11.ビオチン−chem Link(Boehringer-Mannheim) 標識密度は、1ビオチン/10塩基と推測される。ビオチン−chem Li nkのアデノシン及びグアノシンのN7との配位、非共有結合は、20μl中の 1μgのRNA又はDNA+1μlのBCLを30分間85℃に加熱する工程を 包含する。 RNA標識実験(4組の4プール化RNA転写物) 非常に不十分な標識および/またはハイブリダイゼーション(5pMは観察で きない。20pMは非常に弱い)。ミクロコン−100sを用いて非組み込み標 識を除去すると、標識後には試料が失われることがあった。標識後にRNAを断 片化した。これは問題とすべきことではないと思われる(BM tech he lp)。 dsDNAのBCL標識 全チップに亘る低シグナル、バックグラウンド。識別できない。 高速タッグ(Vector Labs)(RNA) 1ビオチン/10〜20塩基とする。5つの反応を実行した: a)RNA1+RNA2+RNA3(各5pmol、全体5.2μg)+25 μl高速タッグ試薬; b)RNA1+RNA2+RNA3(各9pmol、全体9.4 μg)+25μl高速タッグ試薬; c)RNA1+RNA2+RNA3(各々18pmol、全体で19μg)+ 40μl高速タッグ試薬; d)RNA4+RNA5+RNA6(各々10pmol、全体で8.7μg) +25μl高速タッグ試薬; e)RNA7+RNA8+RNA9(各々10pmol、全体で11.4μg )+25μl高速タッグ試薬。 加熱法を用いて、S−SをRNAと結合させた。結果:IVT法により標識さ れた同一標的より20倍低いハイブリダイゼーションシグナル。実施例12.RNAリガーゼ/bio−a6末端標識 この実験は一般に、以下の工程を包含する:a)RNAを断片化し;b)RN A断片をポリヌクレオチドキナーゼ/ATPで5’リン酸化し;そしてc)RN Aリガーゼを用いて、RNAの5’末端をBioA6の3’末端に結紮した。こ れは、次式で表される: 5’ビオチン−AAAAAA−OH3’+5’P−RNA−OH3’=5’b ioAAAAAA−RNA3’ 従来、この方法を用いて、全細胞性mRNAを標識し、これを非包装チップ( 高密度オリゴヌクレオチドアレイ)(2x3スライド上)と10μl中でハイブ リダイズした。混合しないことは有意の問題であって、ハイブリダイゼーション 強度を低くした。in vitro転写(IVT)では、これらの条件下での標識化RN Aは、bio−A6/RNAリガーゼ標識標的より10倍高いシグナルを生じた 。 その他の実験では、bio−A6:RNAの3つの異なる比を用いた: 1)1xbioA6=0.5nmolビオチン−A6/1μgR NA; 2)2xbioA6;そして 3)4xbioA6。 標識後、試料をミクロコン−EZ及びミクロコン−3により回転させて、酵素 を除去し、緩衝液成分から希釈した。 チップ(高密度オリゴヌクレオチドアレイ)とハイブリダイズしたbio−A 6標識化標的は、in vitro転写(IVT)標識化標的とほぼ同一のハイブリダイ ゼーション強度を生じた。 通常濃度のPEを用いて、15分間染色した。有意に高いシグナル又はバック グラウンドは、bioA6/1μgRNAの4倍では、観察されなかった。 これらの実験用のために、BioA6:(5’ビオチン−AAAAAARNA )はGensetに注文した。実施例13.遺伝子特異的転写物の調製 鋳型DNA調製 ベクターの線状化: 挿入物と側面を接するT3及びT7RNAポリメラーゼプロモーター部位を有 するベクタ中で、遺伝子がすでにクローン化されてはいない場合は、下記のPC R増幅を参照。 センス転写物に関しては挿入物の3’末端で、又はアンチセンスに関しては5 ’末端で切断する酵素でベクターを線状化する。挿入配列を調べて、REが内部 で切断されていないことを立証する。好ましい実施態様では、3’突出端を生じ ない制限部位が選択された。 線状化後、試料のアリコートをゲル上を動かして(非切断ベクターの次に)、 完全消化を立証した。 試料を任意にプロテイナーゼK(100〜200ug/ml)で 50℃で20分〜1時間処理して、酵素又は残留RNアーゼ(プラスミドミニ予 備プロトコールに使用)を除去した。 線状化DNAは、フェノール/クロロホルム抽出及びエタノール沈殿又は3〜 4回のミクロコン−100濃縮/再希釈による精製DNAである(下記参照)。 PCR増幅 遺伝子の所望領域がすでにRNAポリメラーゼプロモーターを有するクローニ ングベクター内に内場合には、増幅が唯一好ましい。 ゲノムDNA(又はcDNA)で出発して、5’T3/T7RNAポリメラー ゼプロモーター配列及び3’遺伝子特異的配列を有するPCRプライマーを用い て、当該ORF(又はチップ上に示された遺伝子の領域)を増幅した。 以下の5’配列は十分働いた(19〜21遺伝子特異的塩基が3’末端に付加 された)。 5’−GAATTGTAATACGACTCACTATAGGGAGG−[+1 9〜21遺伝子特異的塩基]−3’ 5’末端は以下のもので構成される: a)ユーザー選択の6つの5’側面位置塩基−プロモーター配列の一部ではな いが、最大IVT効率には必要 b)コアT7RNAポリメラーゼプロモーター配列の17塩基 c)転写される最初の6塩基(+1〜+6の配列が効率に影響を及ぼす) その他のPCRプライマーはその場合、5’末端にT3RNAポリメラーゼプ ロモーター配列を含有する。以下の配列がよく働いた5’−AGATGCAAT TAACCCTCACTAAAGGGAGA−(+19〜21遺伝子特異的塩基 )−3’ 5’末端は以下のもので構成される: a)6つの5’側面位置塩基(配列はこの例とは変わり得る) b)コアT3RNAポリメラーゼプロモーター配列の17塩基 c)+1〜+6転写塩基 標準PCR条件を用いて所望の配列を増幅。最初の5周期はプライマー単独の 遺伝子特異的部分にもっともよく適したアニーリング温度(典型的には55〜5 8℃)で、その後25周期は70℃でアニーリング。アガロースゲル上のPCR 産物を点検(3〜5ulの100μl rxn)。この段階で低領する必要はな い。 任意のプロテイナーゼK処理: 1ulのプロテイナーゼK(20mg/ml)(Ambion)を残りのPCR反応 液に付加し、50〜60℃で20分〜1時間インキュベートした。これは通常は 必要ないが、しかしin vitro転写(IVT)産物が、キットに含まれる対照IV T産物が完全長を有する場合には、この工程はミクロコン−100及びIVT前 に付加される。 ミクロコン50/100精製 他の精製方法は試験中である。エタノール沈殿はミクロコン−50精製に置換 され得る。注意:ミクロコンは漏出する可能性がある。流出部分はすべて保守す ること。 380μlのRNアーゼ無含有水をPCR産物に付加し、使用説明書(Amicon )に示唆されたようにミクロコン−100又はミクロコン−50を用いて濃縮す る。希釈及び濃縮を2〜3回繰り返す。最終濃縮試料は5〜100μlとすべき である。 ビオチンによるin vitro転写標識 最大収量を上げるために、AmbionのT3(#1338)又はT7(#1334 )Megascriptシステムを用いる(それらの専売緩衝液 はポリメラーゼを阻害せずにより高いヌクレオチド濃度を可能にする)(キット 冊子中のAmbion使用説明書及び示唆を読むこと)。 示唆通りにIVTを実行するが、しかし(1:3)ビオチニル化:非標識化C TP及びUTPを用いる。Megascriptキットと一緒に入ってくるT3及びT7 10xヌクレオチドを入れ替えてはいけない。 例えば4つのIVGT標識反応のためのNTPミックスは以下のように製造す る: 8μlのAmbionのT7 10xATP[75mM] 8μlのAmbionのT7 10xGTP[75mM] 6μlのAmbionのT7 10xCTP[75mM] 6μlのAmbionのT7 10xUTP[75mM] 15μlのBio−11−CTP[10mM](ENZO#42818) 15μlのBio−16−UTP[10mM](ENZO#42814) 各IVT標識反応のために、付加する(室温で−氷上でない): 14.5ulのNTPミックス 2.0ulの10xT7転写緩衝液(Ambion) *1.5ulの精製PCR産物(1μg以下) 2.0ulの10xT7酵素ミックス(Ambion)* 1ug以上のDNAをIVT反応に付加してはならない。より高濃度のDNA は実際に反応を阻害し、収率をより低くする。最終rNTP組成物: 7.5mM ATP 7.5mM GTP 5.625mM 冷UTP/1.875mM bio−UTP 5.625mM 冷CTP/1.875mM bio−CTP 37℃で4〜6時間インキュベートする。いくつかの転写物に関し ては、あるいは最大収率が重要でない場合は、短いインキュベーション時間で十 分である。 任意に:DNアーゼ1処理 1μlのRNアーゼ無含有DNアーゼI(Ambionキットと一緒に提供される) を各反応に付加して、十分混合する。37℃で15〜20分間インキュベートす る。 任意に−プロテイナーゼK処理 この工程は、チップに、及びストレプアビジン−フィコエリトリンと結合して いる非特異的タンパク質により引き起こされるバックグラウンドを低減するのに 役立つ: RNアーゼ無含有水をIVT反応に付加して、最終容量を99ulとする。 1ulのAmbionの20mg/mlプロテイナーゼKを付加する。 50℃で20〜30分間インキュベートする。 ミクロコン精製 いくつかのその他の精製法を試験した−多くの方法がrNTPを十分に除去し なかった、あるいは低収率を示した。カルボキシビーズベースの精製用プロトコ ール(Archana Nair)は、非常に見込みがあり、ミクロコン精製の代わりにすぐ に用いられる。 注:さらに精製する前に、IVT反応のアリコートを傍らに取りのけておく。 1%を取りのけておけば、必要な場合に、この工程のトラブル発生を解決し得る 。 1.400ulのDEPC水を試料に付加し、ミクロコン−50又は−100 で試料を濃縮する(Ambionの示唆通りに)。流出分画はすべて保守する。 2.希釈/濃縮を3〜4回繰り返す。最終容量を10〜100μlとする。 下記のコメント参照。 ゲル上のIVT産物を点検 通常、非変性アガロース/TBEゲル上の〜0,01〜1%の反応物を点検す れば十分である。電気泳動前に、試料を65℃に15分間加熱した。予測サイズ 付近の単一バンドが通常観察される。ゲル上に十分な間隔があれば、非精製及び 精製IVT産物の両方の2又は3つの異なる希釈物をゲル上で処理する(各々の 〜0.01%、0.1%及び1%)。1xTBE緩衝液中で1:10,000希 釈でSybr Green II(FMC)でゲルを染色する(エチジウムブロミドより高感度) 。 転写物サイズの正確な測定が所望される場合には、変性ゲルをビオチニル化R NA基準(Ambionから入手)で処理し得る。 260°による転写物収量の定量 75〜150μgRNA/1ug出発DNA鋳型を除く。精製転写物の定量の ために、最終容量60〜70ul(ミクロキュベット用)中に希釈される約1% の濃縮試料は、正確な範囲(0.1〜1OD)内に吸光度読み取り値を示した。 正確なピペット分取容量(>1μl)のためには、先ず、一連の希釈液を作るこ とが通常は必要である(例えば、ユーザーのRNA試料の1/10希釈液を作り 、次に60〜70ulの最終容量中の10%希釈液を測定する)。通常は、同一 キュベットでのブランク読み取りを確実にし、RNA試料が希釈される同一緩衝 液/水を使用する。 純粋な転写物の正確な定量が有意のスパイク実験には不可欠であるため、よく 注意してIVT反応から余分のヌクレオチドが十分除去され、A260°に関与し ないことを立証すべきである。 ミクロコン流出は、A260°に関して保守され、点検される必要がある。有意 の吸光度が最終流出に認められる場合には、有意の吸 光度が260nmで検出されなくなるまで、RNAはさらにもう1回希釈及び濃 縮を施されねばならない。 ミクロコン濾過装置は時折り漏出するため、流出分画すべてを保守するのが適 切である。保持/収集試料中の転写体RNA濃度が予測より非常に低い場合には 、新しいカートリッジを用いて(次に少なくとも4回、希釈、濃縮して)、流出 分画を再濃縮し得る。実施例14.細胞/組織からの全mRNAの標識 出発物質:少なくとも5x105−1x106細胞*(0.1ug〜5ugのポ リA+)からの良質ポリA+RNA。より多くのポリA+RNA(5μgまで) を用いて開始するのがより経済的であるが、しかし物質が限定される場合には、 0.1μgという少ないポリ(A)+で十分量の標識化RNA標的(IVT標識 /増幅後10μug)を得ることができる。 二本鎖cDNA合成: 本プロトコールは、Gibco BRLOs Superscript Choice Systemで提供される使 用説明書の補足である。Gibcoプロトコールを読み進める前に、cDNA合成の ためのGibco BRL’s Superscript Choice Systemに従うが、但し、キットと一緒 に提供されたオリゴ(dT)又は無作為プライマーの代わりに、逆転写一次鎖c DNA合成をプライミングするためのT7−(T)24配列(下記)を用いた。 T7(T)24プライマー:5’−GGCCAGTGAATTGTAATACGA CTCACTATAGGGAGGCGG−(T)24−3’ 第一鎖合成 BRL使用説明書に指示されているように、0.1μg〜5μgのポリ(A)+ RNA、並びに調整量のH2O及び酵素を使用。例 えば: 3μlのDEPC−水 4.5μl(1μg/μl)のmRNA 1μl(100pmolμl)のT7−(T)24プライマー 1.70℃で10分間混合/回転/インキュベートする。 2.氷上で冷却する。 3.以下の成分を(氷上で)RNA/プライマーに付加する。 4μlの5x一次鎖cDNA緩衝液 2μlの0.1M DTT 1μlの[10mM]dNTPミックス 4.37℃で2分間インキュベートする。 5.4.5μlのSuperscript II逆転写酵素/ミックスを十分付加する。(1 ulのSSII RT/RNAlug)を使用。<1ugRNAに関しては、1 ulのRTを使用。 6.37℃で1時間インキュベートする。 最終反応組成物(20μl容量): 50mM Tris−HCl,pH8.3 75mM KCl 3mM MgCl2 10mM DTT 各々500uM:dATP、dCTP、dGTP、dTTP 100pmolのT7−(T)24プライマー 4.5ugのmRNA 900単位のRT(200単位/mRNA 1μg) 第二鎖合成 1.一次鎖反応物を氷上に置く(迅速に回転沈降させる) 2.付加: 95μlのDEPC−H2O 30μlの5x二次鎖緩衝液 3μlの[10mM]dNTPミックス 1μlの[10単位/μl]大腸菌DNAリガーゼ 4μlの[10単位/μl]大腸菌DNAポリメラーゼI 1μlの[2単位/μl]RNアーゼH 最終組成物(150μl): 25mM Tris−HCl,pH7.5 100mM KCl 5mM MgCl2 10mM(NH42SO4 0.15mM b−NAD+ 各々250uM:dATP、dCTP、dGTP、dTTP 1.2mM DTT 65単位/mlのDNAリガーゼ 250単位/mlのDNAポリメラーゼI 13単位/mlのRNアーゼH 3.16℃で2時間混合/回転沈降/インキュベートする。 4.2μlの[10単位]T4DNAポリメラーゼを付加する。 5.16℃で5分間インキュベートする。 6.10μlの0.5M EDTAを付加/−20℃で保存。 クリーンアップ フェノール/クロロホルム抽出 任意に:抽出中の試料損失を低減するためには、下記のPLGプロトコールを 参照。 1.等容量(162ul)のフェノール:クロロホルム:イソアミルアルコー ル(25:24:1)(10mM Tris−HCl ,pH8.0/1mM EDTA−Sigmaで飽和)を付加。 2.攪拌/14000xgで5分間回転。水性相を新しい1.5ml試験管に 移す。 PLG−フェノール/クロロホルム抽出 Phase Lock Gel(PLG)*は、フェノールークロロホルム抽出物の水性相と 有機相の間に不活性密閉バリアを形成する。固体バリアは試料(水性相)のより 完全な回収を可能にし、試料の界面汚染を最小限にする。PLGOは、1.5m l試験管中の予測定アリコートとして販売されており、ユーザーは、これに試料 及びフェノールークロロホルムを直接付加する。 1.Phase Lock Gel(PLG I−軽を含有する1.5ml試験管)を微小遠 心分離器中で20〜30秒間ペレット化する[PLGI−重も働くが、この適用 に関しては我々は特に試験はしなかった]。 2.全(162μl)cDNA試料をPLG管に移す。 3.等容量(162μl)の(25:24:1)フェノール:クロロホルム: イソアミルアルコール(10mM Tris−HCL,pH8.0/1mM E DTA−Sigmaで飽和)を付加。 4.逆さにして混合する(攪拌しない)。PLGは懸濁液の一部にはならない 。全速(12,000xg又はそれ以上)で2分間微小遠心分離。 5.水性上相を新しい1.5ml管に移す。 PLG Iは5Prime-3Prime,Inc.,50に関しては型番p1−175850、2 00に関しては型番p1−188233から得られる。 ミクロコン−50精製 他の精製方法を試験中である。エタノール沈降はミクロコン−5 0精製に置換し得る。注意:ミクロコンは漏出する可能性がある。流出部分はす べて保守すること。 1.300ulの5mM Tris,pH7.5を試料に付加する。 2.Amiconが供給した指示書にしたがって、ミクロコン−50カラム(Microc on-50カラム、Amicon部品型番42416)を通して回転させて濃縮する。 3.希釈/濃縮を3〜4回繰り返し、収集し、カラム故障の場合の流出物を傍 らに置く。 濃縮して最終濃度を5〜10ulとし、可能な場合には、カートリッジを回転 させて乾燥させないよう注意する。上層を収集する。 ビオチンによるin vitro転写標識 収量を最大にするために、AmbionのT3(#1338)又はT7(#1334 )Megascriptシステムを用いる(それらの専売緩衝液はポリメラーゼを阻害せず により高いヌクレオチド濃度を可能にする)。 示唆通りにIVTを実行するが、しかし(1:3)ビオチニル化:非標識化C TP及びUTPを用いる。Megascriptキットと一緒に入ってくるT3及びT7 10xヌクレオチドを入れ替えてはいけない。先に進める前に、Ambionの詳細な 使用説明書及び示唆をよむこと。 NTP標識ミックス 4つのIVT標識反応のためのNTPミックスの製造のためには、以下のもの を組合せる: 8μlのAmbionのT7 10xATP[75mM] 8μlのAmbionのT7 10xGTP[75mM] 6μlのAmblonのT7 10xCTP[75mM] 6μlのAmbionのT7 10xUTP[75mM] 15μlのBio−11−CTP[10mM](ENZO#42818) 15μlのBio−16−UTP[10mM](ENZO#42814) IVT標識反応 1.各反応のために、室温で−氷上でない以下のものを併合する 14.5μlのNTP標識ミックス 2.0μlの10xT7転写緩衝液(Ambion) *1.5μlのds cDNA(0.1〜1μgが最適:下記の注参照) 2.0μlの10xT7酵素ミックス(Ambion) *1ug以上のcDNAをIVT反応に付加してはならない。より高濃度のDN Aは実際に反応を阻害し、収率をより低くする。 最終rNTP組成物: 7.5mM ATP 7.5mM GTP 5.625mM 冷UTP/1.875mM bio−UTP 5.625mM 冷CTP/1.875mM bio−CTP 2.37℃で4〜6時間インキュベートする(いくつかの転写物に関しては、 あるいは最大収率が重要でない場合は、短いインキュベーション時間で十分であ る)。 3.未使用NTP標識ミックスを−20℃で保存する。 クリーンアップ 任意のDNアーゼ1処理 1.1μlのRNアーゼ無含有DNアーゼI(Ambionキットと一緒に提供され る)を各反応に付加して、十分混合する。 2.37℃で15〜20分間インキュベートする。任意のプロテイナーゼK処理 この処理は、チップと、及びストレプアビジン−フィコエリトリンと結合して いる非特異的タンパク質により引き起こされるバックグラウンドを低減するのに 役立つ: 1.RNアーゼ無含有水をIVT反応に付加して、最終容量を99ulとする 。 2.1ulのAmbionの20mg/mlプロテイナーゼKを付加する。 3.50℃で20〜30分間インキュベートする。 ミクロコン精製 いくつかのその他の精製法を試験した−多くの方法がrNTPを十分に除去し なかったか、あるいは低収率を示した。カルボキシビーズベースの精製用プロト コール(Archana Nair)は、非常に見込みがあり、ミクロコン精製の代わりにす ぐに用いられる。 注:さらに精製する前に、IVT反応のアリコートを傍らに取りのけておく。 1%を取りのけておけば、必要な場合に、この工程のトラブル発生を解決し得る 。 1.400ulのDEPC水を試料に付加し、ミクロコン−50又は−100 で試料を濃縮する(Ambionの示唆通りに)。流出分画はすべて保守する。 2.希釈/濃縮を3〜4回繰り返す。最終容量を10〜100μlとする。 3.ミクロコン濾過装置は時折り漏出するため、流出分画すべてを保守するの が適切である。保持/収集試料中の転写体RNA濃度が予測より非常に低い場合 には、新しいカラムを用いて流出分画を再濃縮し、次に少なくとも4回、希釈、 再濃縮する。 収量に関する注記 1.ds cDNA合成のために4〜5ugのポリ(A)+で出発して、IV Tのために20%の精製ds cDNA試料を用いたが、但し、IVT反応当た り〜75〜125ugの標識化RNAを除く。 2.水(又はTE)で最終容量60〜70ul(ミクロキュベット用)中に希 釈される〜1%の濃縮試料の読み取りにより、正確な範囲(0.1〜1OD)内 での吸光度読み取り値が得られた。正確なピペット分取容量(>1μl)のため には、先ず、一連の希釈液を作ることが通常は必要である。例えば、ユーザーの RNA試料の1/10希釈液を作り、次に60〜70ulの最終容量中の10% 希釈液を測定する。同一キュベットでのブランク読み取りを確実にし、RNA試 料を希釈するのに用いた同一緩衝液/水を使用する。 3.標識化RNAの正確な定量のために、よく注意してIVT反応から余分の ヌクレオチドが十分除去され、A260°に関与しないことを立証すべきである。 ミクロコン流出は、A260°に関して保守され、点検される必要がある。有意 の吸光度が最終流出に認められる場合には、有意の吸光度が260nmで検出さ れなくなるまで、RNAはさらにもう1回希釈及び濃縮を施されねばならない。 ゲル上の非断片化試料の点検 断片化前に標識化RNAを電気泳動処理して、標識化転写物のサイズ分布を観 察する。試料を65℃で15分間加熱し、アガロースゲル/TBEゲル上で電気 泳動処理して、ほぼ理想通りの転写物サィズ範囲を得た。ゲル上に十分なスペー スが存在する場合には、非精製及び精製IVT産物の両方の2又は3つの異なる 希釈物をゲル上で処理する(各々の〜0.01%、0.1%及び1%)。1xT BE緩衝液中で1:10,000希釈でSybr Green II(FMC)でゲルを染色する (エチジウムブロミドより高感度)。 あるいは、断片化前及び後のRNA集団のサイズ分布のより正確な測定のため には、ビオチニル化RNA分子量マーカー(Ambion)を用いて、変性ゲルを通し て試料を電気泳動処理する。実施例15.ソラレン−ビオチンによるDNAの直接標識 ソラレン−ビオチン試薬は凍結乾燥されるようになり、「Rad-Free Universal Oligo Labeling and Hybridization Kit」(Schleicher & Schuell)の一部と して別々に入手できる。キットと一緒に購入すれば実際により安くなるので、余 分のキット構成部品を手に入れて、節約できる。Rad-Free Universal Oligo Lab eling and Hybridization Kit:型番#483122(20nmolのソラレン −ビオチンを含有する)。UV長波365nmランプを含む同一キット:#48 3124。 1.凍結乾燥ソラレン−ビオチン試薬を回転沈降させて、以下の: a)断片化DNA/RNA又はオリゴヌクレオチドをいくつかの試薬(さらに 濃縮が必要)で標識する場合には、14ulのDMFか、又は b)断片化前に限定的に標識する場合には56ulのDMF に再懸濁する。標識は、断片化前でも後でも、同様の結果が得られるが、しか し高濃度の塩(>20mM)中では標識されないため、断片化前におこなう方が 容易である。 2.RNA/DNA濃度を0.5ug/10ul(10ugのDNAに対して 200ul)に、塩を20mM未満に調整する。pHは問題なく(pH2.5〜 10)、したがって、RNA/DNAを再懸濁又は希釈するのに滅菌又はDEP C化水を用い得る。プラス ミドDNAは線状化する必要がある。RNA/DNAが高塩中に存在する場合に は、適切なサイズのミクロコン(ミクロコン3でも断片化物質に対して働くが、 〜70分/周期を要する)を用いて希釈、濃縮し得る。 3.試料を10分間沸騰させ、氷上で急速に冷却する(氷上で5分〜3時間保 存)[重要−dsDNAは、標識前に鎖が分離されない場合には、試薬により架 橋されるようになる]。 4.弱光中でDNA/RNA溶液20ul当たり1ulのソラレン−ビオチン 試薬を付加する(DNA/RNA1ug当たり56ulのDMF中に再懸濁され たソラレン−ビオチンは1ulであった)。ソラレン−ビオチンを14ul中に 再懸濁した場合、標識に必要な量をDMF中に1:3で希釈する(1ulの濃縮 ソラレン−ビオチン+3ulのDMF)。 5.溶液を氷上の96−ミクロウエルプレートのウエル中に移す(〜150u l/ウエル)。 6.光源が試料から約2cmの距離になるように、365nmUVランプをプ レート上部に直接置く。試料を1時間照射する。 7.試料を微小遠心分離管に移して、2容量のH2O飽和nブタノールをふか して、非取込みソラレン−ビオチンを抽出する。攪拌/遠心分離1分間。 8.ブタノール(上層)を捨てる。抽出を繰り返す。 9.通常通りに断片化する。ハイブリダイゼーション前に正常な場合は変性さ せる(99〜100℃で10分間)。 *長UV照射は、結果を改良しない。 *DNA/RNA 1ug当たりさらに多くのソラレン−ビオチンをふかしても 、結果は改良されるとは思えない。実施例16.ソラレン−ビオチン標識実験 標準プロトコールによるRNA標識 ソラレン−ビオチンで標識した4つの異なる断片化RNA転写体のプール チップ(各々5pM)とのハイブリダイゼーションの結果。PB標識標的は、 IVT(bio−U+C)標識標的より約〜5倍低い強度を示した。 断片化前対後標識 ハイブリダイゼーション強度に有意差は認められなかった。 ソラレン−ビオチン対RNA比 PB:RNAの比率より4倍高い値で標識してもチップ上のハイブリダイゼー ション強度には有意の影響は認められなかった。 標識反応時間/UVランプ強度 1対3時間標識、あるいは365nmでの15〜20mW/cm2(Affyラン プ)対5〜7mW/cm2(S&Sランプ)強度に、有意さは認められなかった 。 ソラレン−ビオチン ソラレン:平面、三環式化合物。 ソラレン−ビオチン:14原子リンカーアームを介してビオチンと接合したソ ラレン。 核酸に対して高親和性。 DNA/RNA中の挿入体。 長波UV光で照射されると、共有結合するようになる。実施例17.ターミナルトランスフェラーゼ末端標識プロトコール 本プロトコールは、PRT 440Sチップのみを用いて試験し、最適化した 。 DNアーゼ断片化 これは、4つの標識反応には十分である: 4pmolのHIV PCR標的(3.17ugの1.2kbの挿入物) Xul DNアーゼ(BRL) Xul(1単位/ug) ウシアルカリ性ホスファターゼ,1単位/ul(BRL) 2.5ul(2.5単位/rx) 希釈CAP緩衝液(BRL) 2.5ul MgCl2 Xul(1.25mM) H2Oで善良を100ulとする 37℃で15分間 95℃で10分間 4℃で保持。 TdT標識 F−N6−ddATP、F−ddATP、F−ddCTP及びF−ddUTP は、反応中で比較可能的に標識される。F−N6−ddATPを用いることにし た。 断片DNA試料 25ul(1pmol) 5xTdT緩衝液(Boehringer) 20ul(1x) 25mM CoCl2(Boehringer) 10ul(2.5mM) F−N6−ddATP(1mM) 1ul(10uM) TdT(25U/ul)(Boehringer) 1ul(25U/rx) H2O 43ul 37℃で30分間 95℃で5分間 4℃で保持。 PRT 440Sハイブリダイゼーション(Relaステーション) 標識化試料 100ul 10xSSPE;0.1%TritonX−100 300ul 対照(100nM)213オリゴ 5ul H2O 195ul 45℃ハイブリダイゼーション30分。 6xSSPE、0.005%TritonX−100で20℃で洗浄;4周期 /10ドレイン充填。 530nmでチップを走査。ピクセルサイズ11.25um。実施例18.他の標識法 結紮検定 RNAリガーゼによる5’末端でのA6RNAオリゴヌクレオチドのビオチン との結紮により、RNAを直接標識し得る。細菌遺伝子であるCreをT7RN Aポリメラーゼを用いて転写して、アンチセンスRNAを生成した。RNAを断 片化し、オリゴヌクレオチドキナーゼを用いてキナーゼ処理して、5’ホスホリ ル化末端を生成した。ビオチンA6RNAを次に、T4RNAを用いて結紮した 。5pmの結紮化RNAを標識化Creと一緒に遺伝し発現チップ上で試験した 。 ポリAポリメラーゼを用いた3’RNAの直接標識 ポリAポリメラーゼは、RNAの遊離3’ヒドロキシル末端上のポリA尾部を 、前駆体としてATPを用いて、触媒するために用いられている。近年、ポリA ポリメラーゼをCTPを有する3’RNAに首尾よく用いて、標識化標的を生じ ることが、Joomyeong Kim et al.,(1995)Nucl.Acids Res.,23(12):2245-2 251に報告されている。 本方法の利点は、センスRNA(mRNA)がビオチンCTPにより直接標識 され得ることである。CTPの消費は、IVT反応に比して1/5節減される。実施例19.直接標識プロトコール mRNAを直接標識するための試薬 1)100μM rATP200μl 198μL DEPC H2O 2μL(10mM)rATP 2)100μg/mlBSA NEBアセチル化BSA 3)30mM DTT 4)10単位/μLポリヌクレオチドキナーゼ Boehringer Mannheim3’ホスフェート無含有型番#83829 5)1nmol/μL BioA6 Genetic Institute 6)5単位/μL T4RNAリガーゼ+10xT4RNAリガーゼ緩衝液 Epicentre Technologies,型番#LR5025 7)5xRNA断片化緩衝液 200mM Tris−酢酸塩,pH8.1 500mM KOAc 150mM MgOAc 直接標識プロトコール 断片化 1.5ml滅菌試験管に付加する DEPC−H2O(1μg)中の8μLポリ(A)+RNA 2μL 5xRNA断片化緩衝液 94℃で35分間加熱。 キナーゼ反応 10μL断片化RNAに付加: 2.4μLrATP(100μM) 2μL BSA(100μg/ml) 2μL DTT(30mM) 1.6μL DEPC−H2O 2μL ポリヌクレオチドキナーゼ(10単位/μL) 37℃で2.5時間インキュベート。94℃で2分間加熱(酵素を加熱により 不活性化)。 T4RNAリガーゼ反応 20μLキナーゼ処理RNAに付加: 0.5μL BioA6(DEPC−H2O中1nmol/μL) 3μL rATP(19mM) 3μL 10xT4RNAリガーゼ緩衝液 0.5μL DEPC−H2O 17℃で一夜〜2日間。94℃で2分間。実施例20.総称的DNAアレイとハイブリダイズ又は結紮した標的DNA試料 に関する塩基呼出を実施するためのコンピューター計算 n−merの総称的DNA配列上に一組のn電子タイルアレイを作成すること によるDNA標的の再シーケンシング 標的を再シーケンシングする本方法は、通例の再シーケンシングGeneChipで用 いられる方法と同様であるが、但し、チップ上に一続きのタイルプローブを物理 的に配置する通例のGeneChipと異なって、総称的GeneChipを用いて、コンピュー ターが総称的アレイ(総称的アレイは考え得るn−mer配列を含有する)から 適切なプロー ブ情報を取り出すことにより、一組のnタイルアレイを電子的に再構築する。概 して、標的DNAを再シーケンシングするために、標的はタイルプローブのn− mer相補的ワードスペクトルに分解される。各タイルプローブに関しては、総 称的チップ(総称的チップは、最高階の最も近い隣接体を含有する)上に一組の 「一階の最も近い隣の」タイルプローブ(単一塩基置換を含有するプローブ)が 存在する。この工程は、n−merのワードを有する標的配列によるタイリング と呼ばれる(図24)。標的内の既定位置で塩基呼出を成すために、その位置で のタイルプローブの強度を、その位置でのその「最も近い隣」の強度と比較する 。単一塩基置換がプローブ内の異なる位置で起きるために、n組のこのような「 最も近い隣」が存在する。最高強度を生じるプローブ内の特定位置での塩基置換 は、プローブ内のその位置に対して呼び出される塩基である(図25)。標準通 例GeneChipに対する総称的DNAアレイの使用の利点は、標的の各塩基 呼出に対して高度の冗長性が達成されることである。n−mer総称的アレイは 、標的内の各塩基に対してnの塩基呼出を成すが、一方通例再シーケンシングG eneChipは、単一塩基呼出のみをおこなう。 標的塩基の最終塩基呼出は、各標的位置のnの異なる電子的タイリングからの 塩基呼出の電子的票決により決定される(図26)。 不正確な電子的タイルを濾し出すためのnの電子的タイルアレイから得られる 塩基呼出の精度の経験的使用 既定の参照DNA試料を総称的DNAアレイとハイブリダイズし/結紮した。 一組のnの電子的タイルを作成し、対応する塩基呼出をおこなった。既定タイル 置換シリーズが正しい塩基呼出をおこなう場合にはスコア1,塩基呼出が正確で ない場合にはスコア0として、精度スコア表を構築した(図27)。任意の既定 塩基呼出に対 する塩基置換の強度の比によって、既定の塩基呼出に関する信頼レベルを、各採 点に付加した。 次に種々のDNA試料を第二総称的DNAアレイとハイブリダイズし/結紮し た。さらに一組のnの電子タイルが生成されたが、但し、この時点で、0精度ス コアを有するすべてのタイルを廃棄し、精度スコア1を有するものだけを全塩基 票決手順に含めた(図28)。結果は、正確な塩基呼出の全体的パーセンテージ を劇的に改良するというものであった。 参照試料と変異体との間の「局所的」正規化タイルプローブ強度の比較は、突 然変異を検出する高感度方法である。 既定のn−mer総称的アレイに関して、標的の複雑性が増大すると、標的を 正しく再シーケンシングする能力は低減する。標的複雑性が増大すると、標的内 でそれ自体反復するn−merタイルプローブの数は増大し、異なる位置での最 も近い隣の間の交差トークが増大し、そして全体的交差ハイブリダイゼーション が増大する。これらの因子はすべて、標的内の塩基のミスコールに関与する。参 照標的に対する試料標的の比較は、再検出による非特異的ノイズをすべて「濾し 取る」ための強力な方法を提供する。 参照及び試料間を比較する一方法は、タイルプローブそれ自体を比較すること である。しかしながら、直接比較をおこなう前に、いくつかの方法で強度を正規 化して、チップ対チップ及び試料対試料変異を説明しなければならない。私は、 「局所的」正規化法を用いて、シグナルを正規化した。「局所的」正規化により 、簡単に、タイルプローブの強度をその最近隣接体の強度の和で割ることができ る(図29)。 正規化のこの方法は、試料間に良好なシグナルトラッキングを生じ、「バブル 」の形成により示される突然変異の存在に非常に感度 が高い(図30)。この「局所的」正規化タイルプローブ比較はさらに、差異分 析及び仕上げにより、突然変異の存在がより容易に可視化されるフォーマットに 変えられる。 突然変異を検出するための誘導差異法 突然変異を片出するために参照及び試料間の比較を用いる別の方法は、タイル プローブとその最近隣接体との間の突然変異性「誘導」差異によるものである。 この方法の一階最近隣接体タイル分析への適用は、参照標的中の「局所的正規化 」プローブを試料標的中の対応するプローブとの比較を包含する。塩基をミスコ ールするために、パートIIでは非情報性であるタイルは、ここでは、そのタイ ル内のあるプローブ成員が参照及び試料間に誘導された(強度の増大又は低減を 引き起こされる)ために情報性で、突然変異の存在を示す(図31)。これらの 誘導は既定標的位置に対して前方及び逆の鎖上の善タイルを合計したもので、そ の結果生じる数字は、突然変異が存在するか否かの測定値である(図32、図3 3)。実施例21.総称的結紮GeneChip上の二重鎖安定性を増大し、その結果 生じる結紮シグナルを増大するためのMenPoc合成プローブの5’末端上の イノシンの使用 二重鎖安定性を増大するための縮重塩基、例えばイノシン(他のすべての塩基 を有する対)のMenPoc合成プローブ末端への付加の使用を、我々は調べた 。実際、プローブの末端上への1〜6イノシンの付加は、総称的結紮GeneC hip上のハイブリダイゼーション及び結紮反応の両方のシグナル強度を実際に 増大したということを、我々は見出した。 イノシン(0〜6)を製造中にプローブの5’末端に置き、これらの末端イノ シンの作用を、DNアーゼI消化、TdT標識化78 8bpDNA断片をチップに結紮することにより、検定した。2〜6イノシンを 用いた場合の明るさの増大は、二重鎖安定性の増強を示した。6つのイノシンを 用いると、2〜4つのイノシンに比して強度のわずかな低減が認められたが、こ れは末端イノシンがおそらくは四つ組様二次構造を形成し始めたためである。実施例22.総称的結紮GeneChip上で用いた場合のT4リガーゼ及びT aqリガーゼの特異性の間の比較 T4リガーゼ又はTaqリガーゼが総称的結紮GeneChipに対して標的 を結紮するのにより特異的であるか否かを、我々は調べた。Taqリガーゼを用 いるためには、40℃又はそれ以上で結紮反応を実施する必要があった。したが って、二重鎖の熱安定性を増大するために、MenPocプローブの末端に6つ のイノシンを有する8merチップを、我々は用いた。これにより、44℃でT aqリガーゼ反応を実施し、これと37℃でのT4結紮反応とを比較することが できた。その結果は、TaqがT4リガーゼよりもさらに特異的で、T4リガー ゼが結紮できない一組の標的末端を結紮した。 Taqはあまり特徴を照らし出さないが、しかしT4より強度が明るく、この ことはTaq対T4の特異性を示す。 標的内の既定位置でのタイルプローブ及び最接近隣接体置換の強度プロフィー ルは、TaqがT4より特異的であり、TaqはT4がシグナルを検出できなか ったプローブでシグナル強度を検出することを示す。本明細書に記載した実施例 及び実施態様は説明のためのものであり、その点に関しての種々の修正又は変更 が当業者に示唆され、そしてそれらは本出願並びに添付の請求の範囲の精神及び 範囲に含まれる、と理解される。本明細書中に引用した出版物、特許、特許出願 はすべて、参照により本明細書中に含まれる。DETAILED DESCRIPTION OF THE INVENTION Nucleic acid analysis Reference to related application   The present invention is described in U.S. Pat. S. S. N. 60 / 010,47 Part 1 and the "Labeling of Nucleic" filed January 9, 1997. Provisional Patent Application for "Acids" (Inventors: Lockhart, Cronin, Lee, Tran, Matsuz aki, McGall and Barone). Included herein). Background of the Invention   Some of the disclosures of the present invention include materials that are subject to copyright protection. Copyright holder Is in the exact form that appears in the patent and trademark office patent files or records. Differences in electrophotographic reduction with either patent documents or patent disclosure No dispute, but otherwise all rights are reserved.   Many disease states are due to changes in the copy number of the genetic DNA or Changes in the level of transcription of (eg, initiation, , RNA processing, etc.), and changes in the expression levels of various genes I do. For example, loss and gain of genetic material plays an important role in malignant transformation and progression. play. These gains and losses are “driven” by at least two genes. It is considered to be. Oncogenes are positive regulators of tumorigenesis, while tumor suppressors The gene is a negative regulator of tumorigenesis (Marshall, Cell, 64: 313-326 (1991); W einberg, Science, 254: 1138-1146 ( 1991)). Thus, one mechanism for activation of unregulated growth is the oncogene Increasing the number of genes encoding proteins or expression of these oncogenes Increasing the level of (eg, against changes in cells or the environment) Mechanisms include loss of genetic material or the generation of genes encoding tumor suppressors. It is to reduce the current level. This model is based on the genetics associated with glioma progression. Supported by material loss and gain (Mikkelson et al., J. Cell Biochem. 4 6: 3-8 (1991)). Thus, certain genes (eg, oncogenes or tumor suppressors) Changes in the expression (transcription) levels of the factor) serve as indicators of the presence and progression of various cancers. stand.   Similarly, control of the cell cycle and cell development, and disease, may affect the transcriptional level of a particular gene. It is characterized by fluctuations in Thus, for example, viral infections are often It is characterized by increased expression of the Lus gene. For example, herpes simplex, Epstein -Virus infection (eg, infectious mononucleosis), cytomegalovirus, varicella- Herpes zoster virus infection, parvovirus infection, human papillomavirus infection, etc. All are characterized by increased expression of various genes present in each virus . Detection of elevated expression levels of characteristic viral genes provides an effective diagnosis of a disease state. Offer. In particular, viruses such as herpes simplex enter a quiescent phase and have a short, rapid It only appears during duplication. Increased expression levels of characteristic viral genes Enables detection of active growth (and possibly infection) conditions such as   "Traditional" hybridization to monitor or quantify gene expression The use of a zation protocol is problematic. For example, two of the same molecular weight or Further gene products are used because they are not easily separated by electrophoresis. Demonstrate that it is difficult or impossible to identify by Northern blot. Similarly, high Hybridization efficiency and cross-reactivity are determined by the specific subsequence ( Region), so that for one probe for the target gene, Or even for a few probes, to get accurate and reliable measurements difficult.   VLSIPSTMThe development of technology has led to a number of different orientations occupying very small surface areas. A method for synthesizing an array of oligonucleotide probes was provided (US Pat. 5,143,854 and PCT patent publication WO 90/15070). US special Patent Application No. 082,937 (filed June 25, 1993) discloses a complete distribution of a target nucleic acid. To provide sequences and to check for the presence of nucleic acids containing specific nucleotide sequences. Describes how to make an array of oligonucleotide probes that can be used to generate You.   Conventional methods for measuring differences or changes in nucleic acid abundance in the expression of various genes ( For example, differential display, SAGE, cDNA sequencing, clone spotty ) To determine the appropriate sequence-specific probe for the target sequence. Requires assumptions or prior knowledge of them. Other methods, such as deduction Hybridization does not require prior sequence knowledge, but is differentially expressed It does not directly provide sequence information about the nucleic acid. Summary of the Invention   The present invention, in one embodiment, monitors the expression of a number of preselected genes. (Referred to herein as "expression monitoring"). Another embodiment In another aspect, the invention relates to a set of two or more nucleic acid (eg, RNA or DNA) samples. Provide a way to check the difference between the components. Nucleic acid abundance in biological samples from which samples are obtained If the expression level reflects the expression level of the expression profile between two or more samples, Provide a way to identify differences in These "general difference screening" The method is fast, easy to apply, and provides specific information on specific sequences whose expression differs between the two samples. Direct sequences for nucleic acids that do not require empirical assumptions and whose abundance varies between samples Provide information.   In one embodiment, the present invention provides a method for detecting a nucleic acid level difference between two or more nucleic acid samples. Provide a confirmation method. This method comprises the steps of (a) using a probe oligonucleotide attached to a surface. (B) providing one or more oligonucleotide arrays comprising the otides; A) hybridizing the nucleic acid sample with one or more of the arrays described above; The nucleic acid in the nucleic acid sample described above and one of the above which is complementary to the above nucleic acid or a subsequence thereof Or more probe oligonucleotides in the array. (C) combining one or more of the above arrays with a nucleic acid ligase. And (d) the difference in hybridization is the difference in nucleic acid levels described above. Determining the hybridization differences between the nucleic acid samples that show the differences. Include.   In another embodiment, determining differences in nucleic acid levels between two or more nucleic acid samples The method comprises the following steps: (a) a process comprising a constant region and a variable region. One or more oligonucleotide arrays, including oligonucleotides (B) combining said nucleic acid sample with one or more of said arrays and hybridizing Recombined to complement the nucleic acid in the nucleic acid sample with the nucleic acid or a subsequence thereof Forming a hybrid duplex between the above variable regions that are: The difference in hybridization between the nucleic acid samples indicates a difference in the nucleic acid level. Determine hybridization differences.   In yet another embodiment, the difference in nucleic acid levels between two or more nucleic acid samples Comprises the following steps: (a) 1 Providing one or more high density oligonucleotide arrays; (b) a nucleic acid as described above. A sample is hybridized to one or more of the arrays described above to form a nucleic acid sample as described above. One or more of the above, which is complementary to the nucleic acid therein and the above nucleic acid or a subsequence thereof Form a hybrid duplex with the probe oligonucleotide in the array And (c) differences in hybridization indicate differences in nucleic acid levels as described above. The hybridization differences between the nucleic acid samples are determined.   In yet another embodiment, the difference in nucleic acid levels between two or more nucleic acid samples Comprises the following steps: (a) specific preselection gene or mRN Probe oligonucleotide not selected for hybridizing with nucleic acid from A (B) providing one or more oligonucleotide arrays each comprising A) hybridizing the nucleic acid sample with one or more of the arrays described above; The nucleic acid in the nucleic acid sample described above and one of the above which is complementary to the above nucleic acid or a subsequence thereof Or more probe oligonucleotides in the array. Forming heavy chains; and (d) differences in hybridization are at the nucleic acid level as described above. The difference in hybridization between the above nucleic acid samples showing a difference in   In another embodiment, determining differences in nucleic acid levels between two or more nucleic acid samples The method comprises the following steps: (a) random selection, accidental selection, nucleo Nucleotides selected by a method selected from the group consisting of: Probe oligonucleotides containing sequences or subsequences and possible preselected lengths One or more oligonucleotides each encompassing all oligonucleotides Providing an otide array; (b) combining the nucleic acid sample with one or more of the above-described arrays. A) hybridize with the nucleic acid in the nucleic acid sample and the nucleic acid One or more of the above that are complementary to the sequence Form hybrid duplex with probe oligonucleotides in array above And (c) differences in hybridization indicate differences in nucleic acid levels as described above. Determine the differences in hybridization between the nucleic acid samples described above.   In another embodiment, determining differences in nucleic acid levels between two or more nucleic acid samples The method comprises the following steps: (a) random selection, accidental selection, nucleo Nucleotides selected by a method selected from the group consisting of: Probe oligonucleotides containing sequences or subsequences and possible preselected lengths One or more oligonucleotides each encompassing all oligonucleotides Providing an otide sequence; (b) the position of the probe oligonucleotide on the array as described above. Software that describes the location and sequence; (c) providing the nucleic acid sample Hybridizing with one or more arrays, the nucleic acid in the nucleic acid sample and the In one or more of the above arrays that is complementary to the nucleic acid or subsequences thereof. Forming a hybrid duplex with the lobe oligonucleotide; and (d) The above-mentioned software is used so that the above-mentioned hybridization shows the above-mentioned nucleic acid level difference. Operate the wear.   The present invention further provides a method for monitoring the expression of multiple genes simultaneously. You. In one embodiment, the methods comprise: (a) one or more RNs of the gene; Provide a target nucleic acid comprising an A transcript, or a pool of nucleic acids derived from the RNA transcript (B) using a probe oligonucleotide having the nucleic acid pool immobilized on its surface; (C) hybridizing to the oligonucleotide array comprising; Contacting the oligonucleotide array with a ligase; and (d) prior to accessing said array. Quantifying the hybridization of the nucleic acid, wherein the quantification is Provides level measurements.   Another embodiment for identifying differences in nucleic acid levels between two or more nucleic acid samples is (A) probe oligonucleotides in which the members of each pair differ from each other in the preselected nucleotides Providing one or more pairs of oligonucleotides, each comprising a pair of leotides (B) hybridizing the nucleic acid sample with one or more of the arrays described above. And the nucleic acid in the nucleic acid sample is complementary to the nucleic acid or the subsequence thereof. Between one or more of the above probe oligonucleotides in one or more arrays Forming a hybrid duplex; (c) differences in hybridization are above the nucleus Determine hybridization differences between the above nucleic acid samples that show differences in acid levels The step of performing   Another method of simultaneously monitoring the expression of multiple genes involves the following steps (A) Includes a probe oligonucleotide consisting of a constant region and a variable region (B) providing one or more oligonucleotide arrays that: A target nucleic acid comprising RNA transcripts of more than one of the above genes, or Providing a pool of nucleic acids from the transcript; (c) a pool of one or more nucleic acids as described above. Hybridization with an array of oligonucleotide probes immobilized on the surface And (d) quantifying the nucleic acid and the hybridization. In the case, quantification provides a measure of the level of transcription of the gene.   The invention further provides for identifying differences in nucleic acid levels between two or more nucleic acid samples. For preparing a nucleic acid array for use in the present invention. In one embodiment, the method comprises the steps of: (A) a probe oligonucleotide comprising a constant region and a variable region Providing an oligonucleotide array comprising: (b) one or more The nucleic acid sample is hybridized with the array, and the variable region and the With the nucleic acid in the nucleic acid sample described above, including the subsequence complementary to the variable region A sample forming a hybrid duplex; (c) a sample comprising the hybrid duplex described above. Attaching the nucleic acid to the probe oligonucleotide array described above; High-density oligonucleotide containing sample nucleic acid attached to the array after removal of attached nucleic acid A leotide array is provided.   In another embodiment, ascertaining differences in nucleic acid levels between two or more nucleic acid samples The method of preparing a nucleic acid array for performing the method includes the following steps: (B) combining said array with one or more of said two or more nucleic acid samples; Is contacted with one or more of the above two or more nucleic acid samples. Nucleic acids form a hybrid duplex with the probe oligonucleotides in the array above. (C) subjecting the sample nucleic acid containing the hybrid duplex to the probe Attached to the oligonucleotide array; and (d) removing the non-attached nucleic acids by Provide a high-density oligonucleotide array holding a sample nucleic acid attached to the array You.   The invention further provides kits for performing the methods described herein. . One kit contains one or more probe oligonucleotides attached to the surface. Containing a container containing a further oligonucleotide array, and a ligase Includes container. Another kit includes a probe oligo consisting of a constant region and a variable region. Containing one or more oligonucleotide arrays containing nucleotides Container. This kit is complementary to the above constant region or subsequences thereof. Optionally includes a constant oligonucleotide.   Preferred high-density oligonucleotide arrays of the present invention comprise more than 100 different Lobe oligonucleotides. In this case, each different probe oligo The nucleotides are located at a predetermined region of the array. Each different probe oligonucleotide Nucleotides are terminally covalent Adheres to the surface via And the density of the different probe oligonucleotides The degree is 1cmTwoThere are about 60 or more different oligonucleotides per. High density array Can be used for all of the array-based methods described herein. Expression moni High-density arrays used for tarling typically have one or more preselected Includes oligonucleotide probes that are selected to be complementary to nucleic acid from the gene No. In contrast, general difference screening arrays are random, incidental, It may contain arbitrarily selected probe oligonucleotides or may be specific (pre- Selection) include sequences or subsequences encompassing all possible nucleic acid sequences of length.   In a preferred embodiment, the oligonucleotide comprises all possible nucleic acids of a particular length. The pool of leotide or oligonucleotide subsequences contains all possible 6me rs, all possible 7 mers, all possible 8 mers, possible All 9 mers, all possible 10 mers, all possible 11 me selected from the group consisting of rs and all possible 12mers.   The present invention further provides a method for labeling a nucleic acid. In one embodiment, the method comprises: (A) providing a nucleic acid; and (b) amplifying the nucleic acid by amplification. (C) fragmenting said amplicon to cleave said amplicon; Forming a strip; and (d) attaching the label moiety to at least one of the above fragments .   In another embodiment, the method comprises the steps of: (a) providing a nucleic acid; b) transcribing the nucleic acid to form a transcribed nucleic acid; (c) fragmenting the transcribed nucleic acid To form a fragment of the transcribed nucleic acid described above; Combine with the above fragment.   In yet another embodiment, the method comprises the steps of: (a) binding to a support; Providing at least one nucleic acid that matches; Providing a labeling moiety that can be bound to the nucleic acid with a terminal transferase; (c) Providing said terminal transferase; and (d) said terminal The labeled moiety is linked to the nucleic acid using a transferase.   In yet another embodiment, the method comprises the steps of: (a) binding to a support; (B) determining the number of monomer units of said nucleic acid Increasing to form a common nucleic acid tail on said at least two nucleic acids; (D) providing a labeling moiety capable of recognizing the common nucleic acid tail of Part and the above-mentioned label part.   In yet another embodiment, (a) providing at least one nucleic acid that binds to the support. (B) providing a labeled moiety that can be bound to the nucleic acid using a ligase; c) providing the ligase as described above; and (d) attaching the labeled moiety using ligase. The nucleic acid is bound to the above nucleic acid moiety.   The present invention further provides a compound of the formula described herein.Definition   As used herein, an array of oligonucleotides refers to one or more oligonucleotides. Multiple heterogeneous bonds (preferably via a single terminal covalent bond) to the solid support above (Continuous) oligonucleotides, where multiple supports are present If so, each support carries more than one oligonucleotide. "Array" The term is defined as the total set of oligonucleotides on the support (s), or parts thereof. Shows a set. The term "identical array" refers to two or more arrays When used for substantially the same abundance there Used to mean an array having the same oligonucleotide species. Oligo Spatial distribution of nucleotide species differs between the two arrays, but preferred practice In embodiments, it is substantially the same. The two arrays are designed to be identical Abundance, composition and distribution of oligonucleotide probes, even when synthesized Is recognized. These fluctuations are preferably subtle. And / or compensated for by the use of a control as described herein. It is.   The phrase "mass parallel screening" is at least about 100, preferably About 1000, more preferably about 10,000, and most preferably about 1.0 Shows simultaneous screening of 000 different nucleic acid hybridizations .   The terms "nucleic acid" or "nucleic acid molecule" refer to single-stranded or double-stranded forms of deoxylysine. Ribonucleotide or ribonucleotide polymer, unless otherwise specified. Includes known analogs of natural nucleotides that can function similarly to nucleotides.   Oligonucleotides comprise from about 2 to about 1000 nucleotides, more typically about Single stranded nucleic acids ranging from 2 to about 500 nucleotides in length.   As used herein, a “probe” refers to one or more types of chemical bonds. More usually, by complementary base pairing, usually by hydrogen bond formation, Oligonucleotide that can bind to a target nucleic acid. Field used in this specification If the oligonucleotide probe is a natural base (ie, A, G, C or T) or a modified Decorated bases (7-deazaguanosine, inosine, etc.) may be included. In addition, Oligonu The base in the nucleotide probe is not a host unless it interferes with hybridization. They are linked by a bond other than a homodiester bond. did Therefore, the oligonucleotide probe is composed of a phosphodiester bond Rather, they are peptide nucleic acids linked by peptide bonds.   The term "target nucleic acid" refers to the Soy nucleic acid (often derived from a biological sample and is therefore also called sample nucleic acid) Is shown). The target nucleic acid can be essentially any source of nucleic acid (eg, chemical synthesis, amplification). Width reaction, method sample, etc., but are not limited thereto). Be recognized. It is the presence or absence of one or more target nucleic acids to be detected. Or the amount of one or more target nucleic acids to be quantified. The target nucleic acids to be detected are the ones to which they specifically bind (hybridize) The nucleotide sequence that is complementary to the nucleic acid sequence of the probe (s) Have first. The term target nucleic acid means that the probe specifically hybridizes Specific subsequences of large nucleic acids or their abundance (concentration) and / or expression level Indicate the entire sequence (eg, gene or mRNA) for which it is desired to detect a gene.   “Ligatable oligonucleotide” or “ligatable probe” or “ligatable probe” “Ligonucleotide probe” refers to the use of ligase (eg, T4 DNA ligase). 5 shows an oligonucleotide that can be linked to another oligonucleotide by use. Communicating The ligatable oligonucleotide is preferably a deoxyribonucleotide. Communicating The nucleotides encompassing the ligatable oligonucleotide are preferably "standard" nucleotides. Reotide; A, G, C and T or U. However, induction, modification or substitution Nucleotides (eg, inosine) are present unless their presence prevents the ligation reaction. Can be. Linkable probes are labeled as long as the label does not interfere with the ligation reaction. Or otherwise qualified Can be Similarly, internucleotide linkages may be modified unless the modification interferes with ligation. It is. Thus, in some cases, the linkable oligonucleotide is a peptidic Nucleic acid.   "Subsequence" refers to a sequence of a nucleic acid that encompasses a portion of the long sequence of the nucleic acid.   "Wobble" refers to degeneracy at a specific position in an oligonucleotide . Fully degenerate or “four-way” fluctuation refers to a collection of nucleic acids (eg, DN at the position of the fluctuation) A with A, G, C or T for A and A, G, C or U for RNA (Ligo nucleotide probe). Fluctuations represent nucleotides A, G, C Alternatively, it is approximated by substituting inosine, which is a base pair having T or U. Typically contains the fully degenerate fluctuations that occur during the chemical synthesis of oligonucleotides. Oligonucleotides have four different nuclei at specific binding steps where fluctuations are introduced. It is prepared by using a mixture of reotide monomers.   The term "cross-link", when used in reference to cross-linked nucleic acids, refers to a complementary nucleic acid sequence. Attach nucleic acids so that they do not separate under the typical conditions used for denaturation. And Crosslinking preferably involves the formation of covalent bonds between nucleic acids. Crosslink nucleic acids The method of doing so is set forth herein.   The phrase "bound to a support" refers to covalent bonds, hydrogen bonds, ionic interactions Direct or indirect, including attachment by hydrophobic interactions or other methods. It means to be combined here.   "Amplicons" are the products of amplification of nucleic acids by PCR or other methods. .   "Transcribing nucleic acid" refers to the production of ribonucleic acid from deoxyribonucleic acid and its The reverse (the production of deoxyribonucleic acid from ribonucleic acid) You. Nucleic acids can be used for DNA-dependent RNA polymerase, reverse transcriptase, or other methods. Is more transcribed.   Labeled moieties can be detected by various methods described herein or known in the art. Means the part that can be served.   The term "complexity" is defined in Britten et al., Methods of Enzymol. 29: 363 (19 74) used herein according to the standard meaning of this term as determined by (For further explanation of nucleic acid complexity, see Cantor and Schimmel Biophysica l See also Chemistry: Part III, 1228-1230).   “Substantially binds” refers to a complementary hybrid between a probe nucleic acid and a target nucleic acid. Indicate the ligation and achieve the desired detection of the target polynucleotide sequence Small size that can be accommodated by reducing the stringency of the hybridization medium Includes matches.   The phrase "specifically hybridizes with" refers to a specific nucleotide sequence that is duplicated. Under stringent conditions when present in a mixture (eg, whole cell) DNA or RNA Indicates that a molecule preferentially binds, duplexes or hybridizes with the sequence. You.   The term "stringent conditions" means that the probe preferentially hybridizes to its target subsequence. Conditions that soy and hybridize with little or no other sequences. Stringency conditions are sequence-dependent and will be different in different circumstances. The longer the array, the higher the temperature Specifically hybridizes with. Generally, stringent conditions are limited ionic strength and pH Melting point (Tm) Is selected to be about 5 ° C. lower. TmIs 50% of the probes complementary to the target sequence are in equilibrium (the target sequence is generally extra Therefore, at Tm, 50% of the probes are occupied at equilibrium) and Hybridization temperature (under limited ionic strength, pH and nucleic acid concentration). Typical Typically, the stringent condition is p H7.0-8.3 and a salt concentration of at least about 0.01-1.0 M Na ion concentration ( Or other salts) and the temperature is short (e.g., 10-50 nucleotides). ) Is at least about 30 ° C. Stringent conditions may further include destabilizing agents, such as This can be achieved, for example, by the addition of formamide.   The term "perfect match probe" is perfectly complementary to a particular target sequence 1 shows a probe having a sequence. The test probe is typically a part (target) of the target sequence. Sequence). The perfect match (PM) probe is , A "normalization control" probe, an expression level control probe, and the like. However A perfect match control or perfect match probe is a "mismatch control" or "mismatch Match Probe ". For expression monitoring arrays, complete mapping A multiprobe typically comprises a specific sequence or subsequence of the target nucleic acid (eg, Preselected (designed) to be complementary to the gene. By contrast, the general difference In a heterogeneous screening array, the specific target sequence is typically not known. The latter In that case, a perfect match probe is not preselected. Perfect match probes in this context The term refers to one or more specific preselected nucleotides, such as: Probe from the corresponding "mismatch control" that differs from the exact match That's because.   The terms "mismatch control" or "mismatch probe" are used for expression monitoring. In a scanning array, sequences are carefully selected so that they are not completely complementary to a particular target sequence. Shows the probe to be used. For each mismatch (MM) control in the high density array Is preferably a corresponding perfect match that is completely complementary to the same specific target sequence ( PM) probes are preferably present. "Generic" (for example, random, In an (arbitrary, accidental, etc.) array, the target nucleic acid (s) is known The exact and mismatched probes are determined, designed or selected a priori Can not. In this case, the probes are preferably provided in pairs, in which case the probes Each pair of probes differs in one or more preselected nucleotides. Thus, It is not known a priori which of the probes is a perfect match, but one The probe specifically hybridizes to a specific target sequence, and the other probe of the pair For sequences, it serves as a mismatch control. Perfect match and mismatch pro The probes need not be provided as pairs, but are alternated in certain preselected nucleotides. A larger set of different probes (eg 3, 4, 5, or more) Seems to be offered. The mismatch (es) is Although it can be located anywhere, a terminal mismatch is It is not so desirable as it is unlikely to interfere with the solution. In particular In a preferred embodiment, the mismatch is labeled under test hybridization conditions. Mismatch is likely to destabilize the duplex with the target sequence, Located at or near the center. In a particularly preferred embodiment, the exact match is a single It differs from the mismatch control in the centrally located nucleotide.   The term "background" or "background signal intensity" Labeled target nucleic acids and components of oligonucleotide arrays (eg, oligonucleotides Probe, control probe, array substrate, etc.) Shows the hybridization signal due to the interaction. Background Signals are also generated by the inherent fluorescence of the array components themselves. Single back Ground signal is calculated for all arrays or different background A round signal is calculated for each region of the array. Preferred embodiment Then, the background is the array or Average hybridization for a minimum of 1% to 10% of probes in the area of the ray It is calculated as the signal intensity. Expression monitoring arrays (ie, Lobes are preselected to hybridize with specific nucleic acids (genes)) A different background signal is calculated for each target nucleic acid. different If a background signal is calculated for each target gene, The round signal is calculated for a minimum of 1% to 10% of the probe for each gene. Of course, one skilled in the art would recognize that the probe hybridized sufficiently to If they appear to bind specifically to the target sequence, It should not be used for calculating the signal. Or background Is a probe that is not complementary to any sequence found in the sample (eg, opposite Sense nucleic acid or gene not found in the sample, eg, the sample is of mammalian origin Probe if directed to a bacterial gene) Calculated as the average hybridization signal intensity generated by Bag Background is also created by areas of the array that lack any probes. Calculated as the average signal intensity.   The term “quantify” refers to the abundance or concentration of a nucleic acid (eg, the level of transcription of a gene). When used in the context of quantifying (bell), indicates absolute or relative quantification. Absolute quantification The activation is carried out at a known concentration of one or more target nucleic acids (eg, a control nucleic acid, eg, Bio B or the target nucleic acid itself in known amounts) and By querying the intensity of the incubation against a known target nucleic acid (eg, generating a standard curve). Is achieved). Alternatively, relative quantification is performed on two or more Hybridization signal between genes or between two or more treatments Compare the hybridization strength Achieved by quantifying the change in degree and, consequently, the level of transcription.   "Percentage of sequence identity" or "sequence identity" is a To compare two optimally aligned sequences or subsequences on a span In this case, the part of the polynucleotide sequence within the comparison window Is relative to the reference sequence (not including additions or deletions) for optimal alignment of the two sequences. When compared, they can optionally include additions or deletions (eg, gaps). Percente Are the same subunits (eg, nucleobases or amino acid residues) in both sequences Resulting in a number of match positions, and the number of match positions is the total number of positions in the comparison window. Divide and multiply the result by 100 to get the percentage sequence identity. Array Percentage of gender is determined using the program GAP or BESTFIT (see below) Is calculated using the default gap weight.   Methods for aligning sequences for comparison are well known in the art. Comparison Optimal alignment of sequences for Smith and Waterman, Ad. v. Appl. Math., 2: 482 (1981)). Homology of Needleman and Wunsch, J. Mol. Biol., 48: 443 (1970) Pearson and Lipman, Proc. Natl. Ac ad. Sci. USA 85: 2444 (1988)) for a similar method. Computer processing (Intelligenetics, Mountain View, California CLUSTAL and Wisconsin Genetics Softw in PC / Gene program are Package, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wi GAP, BESTFIT, FASTA and TFASTA at sconsin, USA (But not limited to), or by censorship Can be implemented. In particular, for aligning sequences using the CLUSTAL program The method is described in Higgins and Sharp, (Gene, 73: 237-244 (1988) and CABIOS 5: 151-153). (1989)).BRIEF DESCRIPTION OF THE FIGURES   FIG. 1 shows a schematic diagram of expression monitoring using an oligonucleotide array. Extracted poly (A)+Converts RNA to cDNA, which is then labeled ribonucleotide Transcribe in the presence of triphosphate. L is biotin or a dye such as fluor It is Resin. Fragments RNA by heating in the presence of magnesium ions . Hybridization in flowing cells containing a two-dimensional DNA probe array Execute After a brief washing step to remove non-hybridized RNA, The array is scanned using a scanning confocal microscope. Cellular without the use of cDNA intermediates Alternatives where the mRNA is directly labeled are described in the examples. Image analysis software The ware converts the scanned array image into a test film, where the specific physical The observation intensity at the target location is associated with a particular probe array.   FIG. 2A contains over 16,000 different oligonucleotide probes. 3 shows a fluorescence image of a high density array. This image shows a murine B cell (T10) cDNA library. Transcribed from the library, with 13 specific RNA targets and 1: 3,000 (about 100 Biotin-labeled random spiked at a level of 50 pM) Obtained after hybridization of fragmented sense RNA (15 hours at 40 ° C.) Was. Glow at any position is hybridized with a specific oligonucleotide probe. Shows the amount of labeled RNA that has been placed. FIG. 2B shows the results for IL-2 and IL-3 RNA. 2B shows an array of small portions (rectangular regions in FIG. 2A) containing different probes. For comparison FIG. 2C shows a non-spike Using a modified T10 RNA sample (T10 cells do not express IL-2 and IL-3) 2 shows the same region of the array after hybridization. The variation in signal strength It was highly reproducible and reflected the sequence dependence of hybridization efficiency. That The center cross and the four corners of a are the hybridization solution at a constant concentration (50 pM). Contains a control sequence that is complementary to a biotin-labeled oligonucleotide added to You. The sharpness of the image near the boundary of the figure is the resolution of the reading device (11.25 μm) And did not depend on the spatial resolution of the array synthesis. Edge of each composite drawing Area pixels were deliberately ignored in quantitative analysis of the image.   FIG. 3 shows the hybridization intensities for 11 different RNA targets (each part). 2 presents a plot of the average (PM-MM intensity difference for a gene) versus the log / log of the concentration. . This hybridization signal was quantitatively related to the target concentration. Real The experiment was performed as described in the examples herein and in FIG. 10 sites Cain RNA (+ bioB) was recovered in the range of 1: 300,000 to 1: 3000. Spiked into labeled T10 RNA with a bell. Signal up to 1: 300 frequency It continued to increase with increasing concentration, but the reaction was , Went down a straight line at high level. The linear range is for short hybridizations. By use, it can be extended to high concentrations. Genes expressed in T10 cells RNA (IL-10, β-actin and GAPDH) from Detected at a level consistent with the results obtained by probing the library. Was.   FIG. 4 shows mice at various times after stimulation with PMA and calcium ionophore. Figure 2 shows cytokine mRNA levels in 2D6T helper cells. 0, 2, after stimulation Poly (A) at 6 and 24 hours+RNA And converted to a double-stranded cDNA containing the RNA polymerase promoter. Was. Next, the cDNA pool was pooled with biotin-labeled ribonucleotide triphosphate. Transcribe and fragment in the presence of the oligonucleotide probe probe for 2 and 22 hours. Hybridized with Ray. Prior to hybridization, a known amount of Using the signals obtained for the bacterial RNA (biotin synthetase) Then, the fluorescence intensity was converted to the RNA frequency by making a comparison. 50,000 The signal corresponds to a frequency of about 1: 100,000 to 1: 5,000, and a system of 100 The signal corresponds to a frequency of 1: 50,000. IL-2, IL-4, IL-6 and RNA for IL-12p40 is about 1: 200 in these experiments, Not detected above the 000 level. Error bars are the same at different times Estimated uncertainty at the level for a given RNA relative to the level for RNA (2 5%). Relative uncertainty estimates are based on the results of repeated spike experiments. And IL-10, β in specimens from both T10 and 2D6 cells (unstimulated) -Based on repeated measurements of actin and GAPDH RNA. Indeterminate absolute frequency Gender is the message-to-message difference in hybridization efficiency, as well as Includes differences in mRNA isolation, cDNA synthesis, and RNA synthesis and labeling steps. The absolute frequency uncertainty is estimated to be a factor of three.   FIG. 5 shows more than 63,000 different oligonucleotides for 118 genes. 2 shows a fluorescence image of an array containing the probe. Labeled murine B cell RNA samples After overnight hybridization, images were obtained. Each square composite area is 50x At 50 μm, contains 107-108 copies of the specific oligonucleotide . The array was scanned at 7.5 μm resolution in about 15 minutes. Bright rows, high level Indicates the RNA present. Low-level RNA has a hybridization pattern Was unequivocally detected on the basis of a quantitative assessment of About 1: 300,000 At a level in the range of 1 : 1: 100. A total of 21 murine RNAs were detected. Center cross , The checkerboard in the corner and the MUR-1 area in the upper part indicate the label pair added to all samples. Contains a probe complementary to the control oligonucleotide.   FIG. 6 shows the components used to execute the software of the embodiment of the present invention. 1 shows an example of a computer system.   FIG. 7 shows an exemplary software used to execute the software of an embodiment of the present invention. 1 shows a system block diagram of a computer system.   FIG. 8 shows the hybridization intensity of the pair of perfect match and mismatch probe. High-level flow of the process of monitoring gene expression by comparing degrees Is shown.   FIG. 9 uses a decision matrix to determine whether a gene is expressed. 2 shows the flow of the process.   10A and 10B compare baseline scan data and experimental scan data. This shows the flow of the process for determining the expression of the gene.   FIG. 11 monitors gene expression after the number of probes is reduced or reduced. 2 shows a flow of a process of increasing the number of probes to perform   Figures 12a and 12b illustrate the probe oligonucleotide / ligation reaction system. . FIG. 12 generally illustrates the various components of the probe oligonucleotide / ligation reaction system. Will be described. FIG. 12b shows a non-ligand using the probe oligonucleotide / ligation reaction system. Explain the identification of perfectly complementary targets: oligonucleotide hybrids.   13a, 13b, 13c and 13d show the ligation / hybridization reaction Are described, and various consolidation strategies are described. FIG. The ligation / hybridization reaction is optional in various embodiments. Various components will be described. FIG. 13b shows the end of the probe oligonucleotide. A consolidation strategy for identifying mismatches is described. FIG. 13c shows the sample oligonucleotide. A ligation strategy that identifies mismatches at the ends of the links is described. FIG. 13d shows the probe end. A method is described for improving discrimination at both ends and sample ends.   Figures 14a, 14b, 14c and 14d are used with restriction digestion of sample nucleic acids. The connection identification to be performed will be described. FIG. 14a shows SacI (6 cutters) and Hsp92 The recognition site and cutting pattern of II (4 cutters) are shown. FIG. 14b shows the (target) The effect of SacI cleavage on a nucleic acid sample will be described. FIG. 14c shows SacI and S A 6 Mb genome digested with phI, resulting in a ~ 1 kb genomic fragment with 5'C ( E. coli). FIG. 14d shows the general difference screening of these fragments. Hybridization / ligation with chip and hybridization with appropriate nucleic acid Use of those subsequences as probes to format (format I) Alternatively, the fragments are labeled and hybridized / ligated to the oligonucleotide array. And analyzed directly (format II).   Figures 15a, 15b, 15c, 15d and 15e show general difference screening. The analysis of differentially displayed DNA fragments on the array is described. FIG. 15a shows an anchoring port. Primary-strand cDNA by reverse transcription of poly (a) mRNA using primer (T) Shows synthesis. FIG. 15b shows an engineered restriction site at the 3 'end and a degenerate base (NA, G, C, T) The upstream primer for a PCR reaction containing (G, C, T) is described. FIG. c shows random primed PCR of the primary cDNA. Figure 15d shows the PCR product FIG. 15e shows a restriction digest, PCR on a generic ligation array with its 5 'end. Indicate product classification.   Figures 16a, 16b and 16c show replication 1 and replication for sample 1 and sample 2 nucleic acids. The difference between the two products will be described. FIG. 16a shows replication 1 and sample 1 for the normal cell line, sample 1. And the difference between the two replicates. FIG. 16b shows replication 1 and 2 for sample 2 (tumor cell line). The difference between duplicates 2 is shown. FIG. 16c shows the difference between samples 1 and 2 averaged from the two replicates. Plot.   FIGS. 17a, 17b and 17c show the filtered data of FIGS. 16A, 16b and 16c. The data will be described. FIG. 17a shows a duplicate of Sample 1 for the difference between each oligonucleotide pair. 2 shows the relative change in the hybridization intensity of Preparations 1 and 2. FIG. Each oligonucleotide was normalized, filtered and plotted in the same manner as 7A. 4 shows the ratio of replicas 1 and 2 of sample 2 with respect to the difference between the paired pairs. FIG. 17c shows each oligonucleotide Shown is the ratio of Sample 1 and Sample 2 averaging two replicates for the difference in leotide pairs. ratio The rate is calculated as in FIG. 17A, but as in FIG. 16c, after normalization. [(X21k1+ X22k2) / 2] / [(X11k1+ X12k2) / 2] and [(X11k1+ X12k2 ) / 2] / [(X21k1+ X22k2) / 2].   FIG. 18 illustrates post-fragmentation labeling using CIAP processing.   FIG. 19 shows the results after hybridization on the high-density oligonucleotide array. 1 presents a schematic diagram of an end marker.   FIG. 20 shows the pre-reaction of the high-density array before hybridization and end labeling. 5 presents a schematic of the end labeling using.   FIG. 21 shows the measurement of TdTase end-labeled call accuracy after hybridization. The results will be described.   FIG. 22 illustrates oligo dT labeling on high density oligonucleotide arrays.   FIG. 23 illustrates various labeling reagents suitable for use in the methods disclosed herein. I will tell. FIG. 23a shows various labeling reagents. FIG. 23b shows still another labeling reagent. Is shown. Figure 23c shows non-ribose or non-2'-deoxyribose containing labels. You. FIG. 23d shows a sugar-modified nucleotide analog label 23d.   FIG. 24 shows target DNA molecules using a set of generic n-mer tile probes. Re-sequencing will be described.   FIG. 25 illustrates four tile arrays residing on a 4-mer generic array. You.   FIG. 26 illustrates base calling at the eighth position of the target.   FIG. 27 illustrates a base vote table.   FIG. 28 illustrates the effect of applying accuracy score conversion to HIV data.   FIG. 29 illustrates mutation detection by intensity comparison.   FIG. 30 illustrates the detection of bubble formation of a mutation in the HIV genome.   FIG. 31 illustrates guided difference nearest neighbor probe scoring.   FIG. 32 shows a generic ligation GeneChip.TMAnd HIV using induction difference analysis Illustrates the mutations found in the PCR target (B).   FIG. 33 illustrates mutation detection using a comparison between a reference target and a sample target. .Detailed description I. Expression monitoring and general difference screening   The present invention provides methods for expression monitoring and general difference screening . The term expression monitoring refers to a specific, typically preselected, gene. Used to indicate the level of expression. In a preferred embodiment, the present invention Expression monitoring methods involve the scheduled support of one or more genes whose expression levels are to be detected. Using a high-density array of oligonucleotides selected to be complementary to the You. The nucleic acid sample is hybridized to the array and the resulting hybrid The expression signal provides an indication of the level of expression of each gene of interest. High Degree of probe redundancy (typically there are many probes per gene) For this reason, expression monitoring methods provide essentially accurate absolute readings and No comparison required.   In another embodiment, the invention relates to the presence of a particular nucleic acid in two or more nucleic acid samples. A general difference screening method for confirming differences in abundance (concentration) is provided. General difference Different screening methods involve two or more nucleic acid samples on the same array of high density oligos. And the same oligonucleotide probe composition as the nucleotide array and Different high-density oligonucleotides with intentionally identical oligonucleotide spatial distribution Hybridizing with the array. The resulting hybridization The nucleic acids are then compared in two or more samples with differences in abundance (concentration). Confirm that it will be.   The concentration of the nucleic acid in the sample may affect the level of transcription of the gene in the sample from which the nucleic acid is obtained. When screened, general difference screening methods involve two or more samples. To identify differences in transcription (and consequently in expression) of nucleic acids . The differentially (eg, over or under) expressed nucleic acid identified in this manner is expressed at an expression level. To determine and / or isolate genes that differ between two or more samples Can be used for   General difference screening methods use array screening as opposed to expression monitoring methods. Beneficial in that it does not require a priori assumptions about lobe oligonucleotide composition is there. In contrast, the sequence of the probe oligonucleotide is A random, accidental or any arbitrary subset of the pseudoprobes. Oligonuk If the reotide probe is short enough (eg, 12 mer or less), the array will be Contains all possible nucleic acids. General difference screening array is arbitrary Or the fact that the sequence of each probe in the array is public, despite the fact that Because of this knowledge, general difference screening methods still rely on differentially expressed nuclei in a sample. Provides direct sequence information about the acid.   The expression monitoring and general difference screening methods of the present invention are numerous (eg, 1000 or more) arbitrarily selected different oligonucleotide probes (pro Lobe oligonucleotides). In this case, the sequence and position in the array of each different probe is known. Nucleic acid test The material (eg, mRNA) is hybridized to the probe array, Is detected.   Hybridization using high-density oligonucleotide probe arrays , An effective means for detecting and / or quantifying the expression of a specific nucleic acid in a complex nucleic acid population May be provided herein and in co-pending application US Ser. No. 08 / 529,11. No. 5 (submitted September 15, 1995) and PCT / US96 / 14839. ing. The expression monitoring and difference screening method of the present invention detects disease, Confirmation of differential gene expression between two samples (eg, comparison of pathological and healthy samples) Up-regulate or down-regulate expression of specific genes For use in a wide range of environments, including screening for regulated compositions Can be.   In a preferred embodiment, the methods of the invention are used to alter nuclear expression in disease states. Acid expression (transcription) levels can be monitored. For example, cancer is a specific marker, For example, in the case of breast cancer, the HER2 (c-erbB-2 / neu) proto-oncogene Characterized by overexpression. Similarly, overexpression of receptor tyrosine kinase (RTK) For cancer of the breast, liver, bladder, pancreas, and glioblastoma, sarcoma, and squamous cell carcinoma (Carpenter, Ann. Rev. Biochem., 56:88). 1-914 (1987)). Conversely, cancer (eg, colorectal, lung, and breast) Characterized by mutation or underexpression of a gene, such as P53 (eg, Tominaga  et al., Critical Rev. in Oncogenesis, 3: 257-282 (1992)).   If the specific gene is known, a high-density array is preferably A probe oligonucleotide selected to be complementary to the sequence or subsequence contains. High probe redundancy of each gene is achieved, and the absolute expression level of each gene is The bell is determined.   Conversely, if the gene is not known to differ in expression between a healthy state and a disease state In this case, the general difference screening method of the present invention is particularly suitable. Healthy and pathological nucleic acids Hybridization with the general difference screening array disclosed herein The comparison of hybridization and hybridization patterns can be modulated by pathological conditions. Identify the genes that change.   Similarly, using the expression monitoring and general difference screening methods of the present invention, Monitors the expression of various genes for limited stimuli, eg, drug, cell activation, etc. Can ring. The method allows for simultaneous monitoring of the expression of multiple genes Especially useful for. This is because end-point transcription is complex and certain genes are overexpressed or underexpressed. It is particularly useful for drug testing when it is not easy to determine if it is expressed. But Thus, if the disease state or the mode of action of the drug is not fully characterized, The method rapidly establishes particularly relevant genes. Furthermore, if the gene is known If present or inferred, expression monitoring is preferably used, On the other hand, when the specific gene is not known, a general screening method is used. You.   When using the general difference screening method disclosed herein, the specific gene Lack of knowledge about the disease does not hinder the identification of a useful treatment. For example, Hybridization patterns on certain high density arrays for cells are known, If the pattern for the affected cells is significantly different, A library of compounds for what causes the turns to be like those for healthy cells Lee can be screened. This is a very detailed measure of the cellular response to a drug. To provide   Therefore, a general difference screening method is useful for gene discovery and Powerful to elucidate the mechanisms underlying the complex cellular response to various stimuli Provide tools For example, in one embodiment, the general difference screen is " Expression fingerprinting ". Different mRNAs from certain cell types Under certain conditions (e.g., in a disease state, having a mutation in a particular gene) If they were found to show distinct overall hybridization patterns Like. In that case, this pattern of expression (expression fingerprint) is reproducible And if it is clearly distinguishable in different cases, as a very detailed diagnosis Can be used. The pattern is fully interpretable, but is specific to a particular cellular state. Is unusual ( And preferably have no diagnostic and / or prognostic relevance).   Both expression monitoring and general difference screening are used for drug safety testing Can be. For example, when creating new antibiotics, the expression It should not have a significant effect on the lofil. Hybridization pattern Can be used as a detailed measure of the effect of an agent on cells. In other words, poison Can be used as a biological screen.   The expression monitoring and general difference screening methods of the present invention are useful for gene discovery. Are suitable. For example, as explained above, the general difference screening method is The difference in the abundance of nucleic acids in one or more samples is ascertained. These differences are 2 shows changes in the expression levels of previously unknown genes. By difference screening array The sequence information provided is, as described herein, unknown genetic information. Can be used to identify offspring.   The expression monitoring method is based on the fact that many genes discovered to date share sequence attributes. By using the fact that they were classified into tribes on the basis of Can be. The large number of probes allows them to be placed in high-density arrays. Or a member representing a known member or part of a known member from all types of genes. Rigo nucleotide probes may be included. Already known such "chips" ( When using genes, contains both variable and common regions Generates a positive signal at the locus. For unknown genes, the common family of gene families Only areas produce a positive signal. Results show potential for newly discovered genes You.   Therefore, the expression monitoring and general difference screening methods of the present invention are not To enable the development of "dynamic" gene databases. You. The Human Genome Project and Commercial Sequencing Project are functional Or a large static database listing thousands of sequences, independent of genetic interactions Generated. Assays using the methods of the present invention may be used to determine gene function and other genes. Creates a "dynamic" database that defines its interactions. Genes of many genes Does not have the ability to monitor the present simultaneously, or has a large number of "unknown" nucleic acids. Without the ability to detect differences in abundance, creating such a database would be It's an outrageously big job.   The redundant feature of using DNA sequence analysis to determine expression patterns is that A cDNA library is prepared from the RNA isolated from the cells and then the library is Sequencing. Once the DNA has been sequenced, The data enumerates the sequences obtained and counts them. If thousands of sequences have to be determined Second, the frequency of those gene sequences can be used to determine the gene expression pattern for the cell under test. Limit turns.   When compared using expression monitoring or general difference screening, Arrays for obtaining data by the method of the invention are relatively fast and easy. An example For example, in one embodiment, the cells are stimulated to induce expression. RNA is a cell And then a direct labeling or cDNA copy is made. DNA weight In the process, fluorescent molecules are incorporated. Labeled RNA or labeled cDNA can then be used overnight And hybridized with the high-density array. Hybridization is further Determination of the level of all single strands of a hybridized nucleic acid without sequencing Provide quantitative assessment. Furthermore, the method of the present invention is very sensitive, A few copies of the expressed gene are detected. This procedure is presented here. This is shown in the working example. These uses of the method of the present invention are illustrative. There is no limitation in any way. II. High-density arrays for general difference screening and expression monitoring   As described above, the present invention monitors the expression levels of a large number of nucleic acids (detection and detection). And / or quantification) and / or the nucleic acid concentration between two or more samples ( Abundance). The method comprises the steps of: A sample (target nucleic acid) is combined with one or more high-density arrays of nucleic acid probes. Hybridization and subsequent hybridization to each probe in the array Quantifying the amount of the target nucleic acid obtained.   Nucleic acid hybridization is often used to determine the level of expression of various genes. (Eg Northern blots) are used in the presence of a large population of heterogeneous nucleic acids. Small variations in abundance (eg, transcription and, implicitly, expression) of nucleic acids (eg, genes) in The suitability of high-density arrays for quantitation of proteins was a surprising finding of the present invention. Was. Signals (eg, specific genes or gene products, or differentially abundant nucleic acids) ) Is less than about 1 in 1,000, often less than 1 in 10,000, more preferably Less than about 1 in 50,000, most preferably less than about 1 in 100,000, Is present at a concentration of 1 in 300,000 or 1 in 1,000,000.   Oligonucleotide arrays have oligonucleotides as short as 10 molecules , More preferably 15 oligonucleotides, most preferably 20 or 25 oligonucleotides. The nucleic acid expression level is specifically detected using the oligonucleotide. Using the connection identification method In some cases, the oligonucleotide array contains shorter oligonucleotides. In this case, 6 to 15 nucleotides, more preferably about 8 to about 12 nucleotides Oligonucleotides comprising oligonucleotides of length in the range Arrays are preferred. Of course, as described herein, longer oligonucleotides Arrays containing nucleotides are also suitable.   Expression monitoring arrays designed to detect specific preselected genes At least about 10, preferably at least about 100, more preferably at least About 1000, more preferably at least about 10,000, and most preferably Provides simultaneous monitoring of at least about 100,000 different genes.   A) Advantages of oligonucleotide arrays   In one preferred embodiment, the high density array used in the method of the invention is chemically synthesized. Oligonucleotides. The use of chemically synthesized oligonucleotide arrays For example, genomic clone blot arrays, restriction fragments, oligonucleotides, etc. In contrast, it offers a number of advantages. These advantages are generally divided into four:   1) Manufacturing efficiency;   2) reduction of differences between and within arrays;   3) increased information content;   4) Improved signal to noise ratio   1) Manufacturing efficiency   In a preferred embodiment, the array is synthesized using a method of spatial processing parallel synthesis. (See, for example, Section V below). Oligonucleotides are chemically synthesized It is covalently attached to the array surface in a highly parallel fashion. This is a very efficient Enables generation. For example, thousands of specifically selected 20mer oligonucleotides Contain dozens (or even hundreds) of arbitrary aggregates of leotide Are synthesized with a synthesis cycle of 80 or less. Arrays are based solely on sequence information. Is designed and synthesized. Therefore, unlike the blotting method, the array Preparation requires handling of biological material do not do. Cloning process, nucleic acid purification or amplification, cataloging of clones or amplification products There is no necessity. Accordingly, the high-density oligonucleotide array of the present invention The preferred chemical synthesis is more efficient than the blotting method, Enables production of rays.   2) reduction of differences between and within arrays;   The use of chemically synthesized high-density oligonucleotide arrays in the methods of the invention Improve interray and intraarray mutations. Preferred oligonucleotide arrays for the present invention B) Large batch (currently 49 arrays / wafer, Multiple wafers are synthesized in parallel). This is a different time and place As general diagnostic and testing tools allowing direct comparison of assays performed in To be suitable.   Because of the precise controls obtained during chemical synthesis, the arrays of the present invention have the same probe Less than about 25% between high density arrays with composition (intra-production batch or between batches), Preferably less than about 20%, even more preferably less than about 15%, more preferably about 1% It exhibits less than 0%, even less than about 5%, and most preferably less than about 2% mutation. That A mutation is one or more oligonucleotides between two or more arrays. Hybridization intensity at the labeled probe (versus the labeled control target nucleic acid mixture) )). More preferably, the array mutations are two or more. Hybridization between one or more arrays measured for one or more target genes Assayed as a variation in the intensity of the dilation (relative to the labeled control target nucleic acid mixture) You.   In addition to inter- and intra-array variations, chemically synthesized arrays can also be spotted. Phase, especially the spotting method using cell-derived nucleic acids (eg, cDNA) Reduce mutations in opposite probe frequency. Many genes have levels of thousands of copies / cell. Expression, but on the other hand Others are expressed only at a single copy / cell. The cDNA library uses this material Because it is made from, it reflects this very large bias. Library normalization ( Adjustment of the amount of each different probe by comparison with a reference cDNA) While reducing the representation of the columns to some extent, normalization is approximately a factor of two or three. The results show that the probability of selecting highly expressed cDNA is reduced. This In contrast, the chemical synthesis method uses almost the same concentration of all oligonucleotide probes. Can be guaranteed to be expressed in degrees. This reduces intra-gene (inter-array) mutations and Between hybridization signals for different oligonucleotide probes Enable direct comparison.   3) increased information content;   i) Benefits for expression monitoring   The use of high-density oligonucleotide arrays for expression monitoring is It offers a number of benefits not recognized by law. For example, a transcript of a specific target gene The use of a number of different probes that specifically bind to Allows optimization of probe sets for extraction and errors due to cross-reactivity with other nucleic acid species Provide a high degree of redundancy and internal controls that minimize the likelihood of   Clearly appropriate probes are often used for expression monitoring by hybridization. Prove that it is not effective for taring. For example, a certain subsequence of a specific target gene Are found in other regions of the genome, and probes directed to these subsequences Cross-hybridizes with the region and is a significant measure of the expression level of the target gene Does not provide a signal. Even probes that show little cross-reactivity Are generally insufficient for the formation of structures that interfere with effective hybridization. It may not be appropriate to indicate hybridization. Finally, a number of programs In pairs with robes, everything in the pair It is difficult to determine the optimal hybridization conditions for a given probe No. Due to the high degree of redundancy provided by multiple probes for each target gene Eliminate probes that perform poorly under a given set of hybridization conditions Very sensitive and reliable measurement of the expression level (transcription level) of the gene. Still have enough probes for a particular target gene to provide be able to.   Furthermore, the use of a number of different probes for each target gene is closely related Enables monitoring of expression of a family of nucleic acids. Subsequences conserved throughout the family, And to hybridize with different subsequences in different nucleic acids in the family, Probes can be selected. Therefore, hybridization with such arrays This is when different genes are of approximately the same size and have a high level of homology. To allow simultaneous monitoring of different members of the gene family. Such a measurement Difficult or impossible with traditional hybridization methods.   ii) General advantages   Because high-density arrays contain such a large number of probes, Controls for mutations or mutations in the gene, overall hybridization conditions Controls, controls on sample preparation conditions, and metabolic activity of cells from which nucleic acids are obtained. Controls and mismatches for non-specific binding or cross-hybridization A number of controls can be provided, including controls.   Effective detection and quantification of gene transcription in complex mammalian cell message populations Using relatively short oligonucleotides and relatively low (eg, 40 or less) , Preferably 30 or less, more preferably 25 or less, and most preferably 20,15. And 10 or less) oligo It can be determined using nucleotide probes / genes. Strongly for each gene And there are a number of probes that hybridize specifically. This is a Rather than imply that the probe is necessary for detection, there are many to choose from. Selection can be, for example, array uniqueness (gene family), inspection of splice variables, or genetics. Sub-type hot spot (cannot be easily performed by cDNA spotting method) And other considerations such as   In use, an expression monitor is used, each containing about 400,000 probes. A set of four arrays is created for logging. ESTs exist in public databases Sets of about 40 probes (20 probes) that are complementary to each of about 40,000 genes Lobe pair) is selected. This set of ESTs is approximately 1/3 to 1 of all human genes / 2, these arrays were used in a parallel set of overnight hybridizations. Let them all levels.   4) Improved signal to noise ratio   Blotted nucleic acids sometimes rely on ionic, electrostatic and hydrophobic interactions Add the blotted nucleic acid to the substrate. The bond is formed at a number of points along the nucleic acid, It limits freedom and hinders the ability of the nucleic acid to hybridize to its complementary target. This In contrast, preferred arrays of the invention are chemically synthesized. Oligonucleotide Otide probes are attached to the substrate by a single terminal covalent bond. Probe is flexible And participate in complex interactions with their compulsive targets. The result and As a result, the probe array of the present invention has significantly higher hybridization levels than the blotted array. Shows the efficiency of the isolation (10 times, 100 times, and 1000 times as efficient Even there). Generate pre-defined signals using fewer target oligonucleotides And thereby dramatically improve the signal-to-noise ratio. As a result, the present invention Method allows the detection of only a few copies of nucleic acids in very complex nucleic acid mixtures I do.   B) Preferred high density arrays   Preferred high density arrays of the present invention are about 100 or more, preferably about 1000 or more. , More preferably about 16,000 or more, most preferably about 65,000 or 2 More than 50,000, or even more than about 1,000,000, different oligonucleotides Nucleotide probes. Oligonucleotide probes range from about 5 to about 50 Or about 5 to about 45 nucleotides, more preferably about 10 to about 40 nucleotides. And most preferably in the range of about 15 to about 40 nucleotides in length. Especially preferred In some embodiments, the oligonucleotide probe is 20 or 25 nucleotides in length. However, in other preferred embodiments (especially when a ligation discrimination reaction is used) The oligonucleotide probes are preferably shorter (e.g. 6-20, more Preferably 8 to 15 nucleotides in length). Relatively short oligonucleotides The probe hybridizes specifically to the target sequence and is sufficient to discriminate Was the discovery of the present invention. Thus, in one preferred embodiment, the oligonucleotide Otide probes are less than 50 nucleotides in length, typically less than 46 nucleotides And more generally less than 41 nucleotides, most commonly less than 36 nucleotides. Full, preferably less than 31 nucleotides, more preferably less than 26 nucleotides And most preferably less than 21 nucleotides. The probe has an additional 16 nu Less than nucleotides, less than 13 nucleotides, less than 9 nucleotides and 7 nucleosides The length may be less than the tide. In addition, oligonucleotide probes are relatively About 1000 nucleotides, more typically up to about 500 nucleotides It is recognized that it may be a range of length.   Location of each different oligonucleotide probe in the array, and some In one embodiment, the sequence is known. In addition, many different probes are relatively small. Occupying a small area, generally about 60 or more, more usually about 100 or more, Generally about 600 or more, often about 1000 or more, and more often about 5000 Or more, most often about 10,000 or more, preferably about 40,000 or more, Preferably at least about 100,000, and most preferably at least about 400,000. Different oligonucleotide probes / cm onTwoHigh density with probe density of Provide an array. Small surface area of the array (often about 10 cmTwoLess than, preferably About 5cmTwoLess than, more preferably about 2 cmTwoLess than, and most preferably about 1. 6cmTwo<) Indicates small sample volumes and very uniform hybridization conditions (less than Temperature control, salt content, etc.) while a very large number of probes Enables massively parallel processing of redidation.   Finally, due to the small area occupied by high density arrays, very small liquid volumes (eg, 250 μl or less, more preferably 100 μl or less, most preferably 10 μl Below). In addition, hybridization conditions are Very homogeneous and the hybridization format can be automated Wear. III. Gene expression monitoring and general difference screening   As described above, the present invention monitors gene expression (expression monitor The difference in the abundance of nucleic acids in two or more nucleic acid samples. (General difference screening). In general, the invention The method of monitoring the gene expression of (1) comprises: (1) one or more target genes; Certain of the target nucleic acids comprising the RNA transcript (s) Or a pool of nucleic acids from the RNA transcript (s); (2) The nucleic acid sample is hybridized with a high-density array of probes (including the control probe). Soy; and (3) detecting the hybridized nucleic acid and performing relative expression (transcription) Calculating the level. These methods preferably involve specific preselection Includes the use of high-density oligonucleotide arrays containing probes for genes I do.   In contrast, arrays used in the general difference screening method of the present invention are: However, no specific target gene needs to be identified. On the contrary, the method If the particular gene is not known prior to performing the difference screen, Designed to detect changes or differences in gene expression.   Methods for general difference screening typically include 1) one or more high density Oligonucleotide arrays (preferably one or more nucleotides 2) providing two or more nucleic acid samples. 3) hybridizing the nucleic acid sample to one or more arrays to form a nucleic acid sample in the nucleic acid sample; Form a hybrid duplex between the nucleic acid and the probe oligonucleotides in the array And 4) determining the hybridization differences between the nucleic acid samples. Include.   Providing a nucleic acid sample, hybridizing the sample to an array, and hybridizing Detection of nucleic acid (s) is monitored by expression monitoring and general differential screening. The learning method is implemented in essentially the same way. Disclosed herein As such, in a preferred embodiment, the method is used for oligonucleotide probe selection. More in part, at least two nucleic acid samples in a general difference screen Distinguished in terms of use and in subsequent analysis.   A) Provision of nucleic acid sample   To determine the concentration of nucleic acid in a sample, such an analytical nucleic acid It is desirable to provide a fee. Genetic differences in nucleic acid concentration or differences in nucleic acid concentration between different samples If it reflects the transcript level or differences in transcript levels of the offspring (s), the gene ( A nucleic acid sample containing one or more mRNA transcript (s), or Desirably provides a proposed gap from the mRNA transcript (s). Honcho As used herein, nucleic acid from mRNA transcript is defined as mRNN for its synthesis. A indicates the nucleic acid for which the A transcript or a subsequence thereof last served as a template. Therefore , CDNA reverse transcribed from mRNA, RNA transcribed from cDNA, cDN DNA amplified from A, RNA transcribed from the amplified DNA, etc. are all mRN A, and the product thus obtained is detected by the original transcript in the sample. Indicates presence and / or abundance. Therefore, suitable samples include genes ( MRNA transcript (s), cDNA reverse transcribed from mRNA, cDN CRNA transcribed from A, DNA amplified from gene, transcribed from amplified DNA However, the present invention is not limited thereto.   Transcript level (and thereby expression) of one or more genes in a sample In particularly preferred embodiments where it is desirable to quantify, the nucleic acid sample is one or more Concentration of the mRNA transcript (s) of the gene of The concentration of the nucleic acid (s) from the gene (s) is determined by the level of transcription (and therefore expression) of that gene. Bell). Similarly, the hybridization signal Preferably, the intensity is proportional to the amount of hybridized nucleic acid. Proportionality is relatively strict Dense (eg, doubling of the transcription rate may result in doubling of the mRNA transcript in the sample nucleic acid pool And doubling of the hybridization signal). Those skilled in the art understand that proportionality is more forgiving and even non-linear. Therefore, for example If target mRN The 5-fold difference in the concentration of A is 3-6 times the hybridization intensity A test that produces a difference is sufficient for most purposes. More accurate quantification is required If necessary, run with appropriate controls and prepare sample preparations as described herein. Mutations induced in production and hybridization can be corrected. further, Using serial dilutions of the "standard" target mRNA, the method may be used according to methods known to those skilled in the art. A positive curve can be prepared. Of course, simple detection of the presence or absence of the transcript, or If large differences in changes in nucleic acid concentration are desired, elaborate control or calibration is required. No need.   In the simplest embodiment, such a nucleic acid sample is isolated from a biological sample And / or otherwise total mRNA or total cDNA derived therefrom. . The term "biological sample", as used herein, refers to or from an organism. (Eg, cells). The sample can be any biological tissue Or have a liquid. Often the sample is a "clinical sample" which is This is the sample obtained. Such samples include sputum, blood, blood cells (eg, Leukocytes), tissue or microneedle biopsy, urine, peritoneal fluid or cells therefrom. But not limited to these. Biological samples may also include tissue sections, e.g. Examples include frozen sections taken for histological purposes.   Nucleic acids (genomic DNA or mRNA) can be obtained from any number of sources well known to those of skill in the art. Can be isolated from a sample by a method. If a change in gene copy number is detected, One skilled in the art understands that nome DNA is preferably isolated. Conversely, one or more When the expression level of a gene is to be detected, preferably, RNA (mRNA) Is isolated.   Methods for isolating total mRNA are well known to those skilled in the art. example For example, nucleic acid isolation and purification methods are described in Chapter 3 of Laboratory Techniques in Bi. ochemistry and Molecular Biology: Hybridization With Nucleic Acid Probes , Part 1. Theory and Nucleic Acid Preparation, p. Tijssen, ed. Elsevier , N.Y. (1993) and Chapter 3 of Laboratory Techniques in Biochemistry an d Molecular Biology: Hybridization With Nucleic Acid Probes, Part 1. Theo ry and Nucleic Acid Preparation, p. Tijssen, ed. Elsevier, N.Y. (1993) In more detail.   In a preferred embodiment, for example, acidic guanidinium-phenol-chloropho Total nucleic acid was isolated from a given sample using the Lum extraction method and PolyA by column chromatography or using (dT) n magnetic beads+mR NA is isolated (for example, see Sambrook et al., Molecular Cloning: A Laboratory). Manual (2nd ed.), Vol. 1-3, Cold Spring Harbor Laboratory, (1989) or Current Protocols in Molecular Biology, F. Ausubel et al., Ed. Greene Pub lishing and Wiley-Interscience, New York (1987)).   It is often desirable to amplify a nucleic acid sample before hybridization. I Even if such an amplification method is used, if a quantitative result is desired, the relative frequency of the amplified nucleic acid One skilled in the art understands that care must be taken in the use of methods to maintain or control I do.   Methods of "quantitative" amplification are well known to those skilled in the art. For example, quantitative PCR Involves co-amplification of a known amount of a control sequence using the same primers. this is, Provides an internal standard used to calibrate the PCR reaction. In that case, high density The array contains probes specific to an internal standard for quantification of amplified nucleic acids.   One preferred internal standard is a synthetic AW106 cRNA. A W106 cRNA is isolated from RN isolated from a sample according to standard techniques known to those skilled in the art. Combined with A. Next, reverse transcription of the RNA using reverse transcriptase I will provide a. The cDNA sequence is then amplified using labeled primers (eg, PC R). The amplification products are separated, typically by electrophoresis, and the amount of radioactivity (amplification) (Proportional to the amount of product). Next, the AW106 RNA standard is used to produce The amount of mRNA in the sample is calculated by comparison with the signal generated. Quantitative P Detailed protocols for CR are described in PCR Protocols, A Guide to Methods and Applications, Innes et al., Academic Press, Inc. N.Y., (1990) ing.   Other suitable amplification methods include polymerase chain reaction (PCR) (Innes et al., PCR Protocols, A Guide to Methods and Application. Academic Pres s, Inc. San Diego, (1990)), ligase chain reaction (LCR) (Wu and Wallace) , Genomics, 4: 560 (1989), Landegren, et al., Science, 241: 1077 (1988). And Barringer, et al., Gene, 89: 117 (1990)), transcription amplification (Kwoh, et al.). ., Proc. Natl. Acad. Sci. USA, 86: 1173 (1989)) and self-supporting sequence replication (Gau telli, et al., Proc. Nat. Acad. Sci. USA, 87: 1874 (1990)). However, it is not limited to these.   In a particularly preferred embodiment, reverse transcriptase and oligo dT and phage T7 Sample mRNA is reverse transcribed with primers consisting of , Providing a single-stranded DNA template. Duplicate secondary DNA strands using DNA polymerase Combine. After the synthesis of double-stranded cDNA, T7 RNA polymerase is added to convert the RNA. Transcribe from cDNA template. Successive rounds of transcription from each single-stranded cDNA template results in amplification RNA is obtained. Methods for in vitro polymerization are well known to those skilled in the art (eg, Sambrook, supra), this particular method is In Vitro Amplification Preserves the Relative Frequency of Different RNA Transcripts Van Gelder, et al., (Proc. Natl. Acad. Sci. USA, 87: 1663-1667 (1990)). Is described in detail. Further, Eberwine et al., Proc. Natl. Acad . Sci. USA, 89: 3010-3014 uses the original amplification using two rounds of in vitro transcription. 10 of substance6Achieve more than two-fold amplification, thereby limiting biological samples In any case, a protocol is provided that allows expression monitoring.   The direct transcription method described above provides an antisense (aRNA) pool, and Is understood. If antisense RNA is used as the target nucleic acid, The oligonucleotide probe provided is complementary to a subsequence of the antisense nucleic acid. Selected as is. Conversely, when the target nucleic acid pool is a pool of sense nucleic acids Oligonucleotide probe is selected to be complementary to a subsequence of the sense nucleic acid. Selected. Finally, if the nucleic acid pool is double-stranded, the target nucleic acid is Probe contains either of the antisense strands, You.   The protocols cited above generate a pool of sense or antisense nucleic acids. Method. In fact, using one approach, the desired sense or antisense Nucleic acids can be produced. For example, the cDNA is flanked by T3 and T7 promoters. Vector (eg, Stratagene's pBluescript II K). S (+) phagemid). T3 polymerase In vitro transcription yields RNA of one sense (sense based on insert orientation). ) On the other hand, in vitro transcription by T7 polymerase produces RNAs with the opposite sense. Generate. Other suitable cloning systems are Cre-loxP plasmid sub- Includes phage lambda vectors designed for cloning (eg, Pala zzolo et al. Gene, 88: 25-36 (1990)).   In particularly preferred embodiments, highly active RNA polymerases (eg, for T7 About 2500 units / μl, sold by Epicentre Technologies).   B) Labeling of nucleic acids   i) Labeling method / strategy   In a preferred embodiment, detecting one or more labels attached to the sample nucleic acid By doing so, the hybridized nucleic acid is detected. Labels are well known to those skilled in the art Can be incorporated by any of a number of means. However, the preferred embodiment In one embodiment, the label is simultaneously incorporated during the amplification step in the preparation of the sample nucleic acid. For example, polymerase chain reaction using labeled primers or labeled nucleotides The reaction (PCR) provides a labeled amplification product. Nucleic acids (eg, DNA) are labeled Should be amplified in the presence of deoxynucleotide triphosphate (dNTP) Things. The amplified nucleic acid is fragmented, exposed to an oligonucleotide array, and The extent of hybridization is determined by the amount of label here associated with the array . In a preferred embodiment, labeled nucleotides (eg, fluor Transcription amplification using CEJN-labeled UTP and / or CTP Incorporate into nucleic acids.   Alternatively, the label may be the original nucleic acid sample (eg, mRNA, polyA mRNA, cDN A) or directly after amplification is completed. Such labeling is increasing Reduces the time required for the amplification reaction, which favors increasing the yield of the breadth product. Sign Means for adding to the nucleic acid include, for example, nick translation or nucleic acid keying. A nucleus that links the sample nucleic acid to a label (eg, a fluorophore) after the enzyme treatment Terminal labeling by addition (linking) of an acid linker (eg, labeled R NA). End labeling is described in Section III (B) (ii) below. This will be described in more detail in section i).   Detectable labels suitable for use in the present invention include spectroscopic, photochemical, biochemical Any set detectable by chemical, immunochemical, electrical, optical or chemical means Products. Labels that are useful in the present invention include labeled streptavia. Biotin, magnetic beads (eg DynabeadsTM), Fluorescent dyes (eg fluorescein, Texas red, rhodamine, green fluorescent tan Park etc. See, eg, Molecular Probes, Eugene, Oregon, USA), radioactive labels (For example,ThreeH,125I,35S,14C or32P), enzymes (eg horseradish) Commonly used in peroxidase, alkaline phosphatase and ELISA And other chromogenic labels, such as colloidal gold (eg, 40-80 in diameter) Gold particles in the size range of nm emit green light with high efficiency), or colored glass or Is plastic (eg, polystyrene, polypropylene, latex, etc.) beads Is mentioned. Patents teaching the use of such markers include U.S. Pat. Nos. 817,837, 3,850,752, 3,939,350, 3, Nos. 996,345, 4,277,437, 4,275,149 and 4 , 366,241.   Fluorescent labeling gives it a very strong signal at low background Preferred. It also provides high resolution and sensitivity optical Can be detected. Nucleic acid samples are all labeled with a single label, e.g., a fluorescent label. obtain. Alternatively, in another embodiment, the different nucleic acid samples are each labeled with a different label. If they have the knowledge, they can be hybridized simultaneously. For example, some targets are green Having a fluorescent label, the second target may have a red fluorescent label. Scanning process Distinguishes the site of binding of the red label from the site of the green fluorescent label. Each nucleic acid sample ( The target nucleic acids) are analyzed separately from each other.   Suitable chromogens that can be used include light in the discriminating range of wavelengths so that the color is observed. Absorbs light or emits light when irradiated with radiation of a particular wavelength or range of wavelengths. Molecules and compounds, such as phosphors.   A wide range of suitable dyes are available, provide intense color and have A small amount is absorbed. Exemplary dyes include quinoline dyes, triarylmethane dyes , Acridine dye, alizarin dye, lid rain, insect dye, azo dye, anthra Quinoid dyes, cyanine dyes, phenazathionium dyes and phenazoxonium Dyes.   A wide range of phosphors can be used alone or with quencher molecules. The phosphor Are divided into various classes with certain primary functionalities. These primary functionalities Include: 1- and 2-aminonaphthalene, p, p'- Diaminostilbene, pyrene, quaternary phenanthridine salt, 9-aminoacridi , P, p'-diaminobenzophenone imine, anthracene, oxacarboxy Anine, marocyanine, 3-aminoequilenin, perylene, bisbenzoxazo , Bis-p-oxazolylbenzene, 1,2-benzophenazine, retinol , Bis-3-aminopyridinium salt, herebligenin, tetracycline, Telophenol, benzimidazolylphenylamine, 2-oxo-3-chrome , Indole, xanthene, 7-hydroxycoumarin, phenoxazine, sari Tilate, strophantidine, porphyrin, triarylmethane and flavi N. To have or incorporate such functionalities for linking Individual fluorescent compounds that can be modified for Examples include: dansyl chloride; fluorescein, such as 3,6-dihydroxy-9-phenylxanthohydrol; rhodamine isothio Cyanate; N-phenyl 1-amino-8-sulfonatonaphthalene; Nyl 2-amino-6-sulfo sodium naphthalene: 4-acetamido-4- Isothiocyanatostilbene-2,2'-disulfonic acid; pyrene-3-sulfo Acid; 2-toluidinonaphthalene-6-sulfonate; N-phenyl, N-methyl Le 2-aminonaphthalene-6-sulfonate; ethidium bromide; stebulin; Auromin-0,2- (9'-anthroyl) palmitate; dansylphospha N, N'-dioctadecyloxacarbocyanine; Tidylethanolamine; N , N'-dihexyloxacarbocyanine; merocyanine, 4 (3'pyrenyl) Butyrate; d-3-aminodesoxy-equilenin; 12- (9'anthroyl ) Stearate; 2-methylanthracene; 9-vinylanthracene; 2,2 ' (Vinylene-p-phenylene) bisbenzoxazole; p-bis [2- (4- Methyl-5-phenyl-oxazoyl)] benzene; 6-dimethylamino-1, 2-benzophenazine; retinol; bis (3'-aminopyridinium) 1,1 0-decandyl diiodide; sulfonaphthylhydrazone of helibrienin; Chlorotetracycline; N (7-dimethylamino-4-methyl-2-oxo- 3-chromenyl) maleimide; N- [p- (2-benzimidazolyl) -phenyl ] Maleimide; N- (4-fluoranthyl) maleimide; bis (homovanillin) Acid); Resazarin; 4-chloro-7-nitro-2,1,3-benzoxazidiazo Merocyanine 540; resorufin; rose bengal; and 2,4-diph Enyl-3 (2H) -furanone.   Desirably, the phosphor is about 300 nm or more, preferably about 350 n m, more preferably absorbs light above about 400 nm, usually the wavelength of the absorbed light. It should emit at a wavelength about 10 nm or more above the length. Absorption and emission characteristics of bound dye It should be noted that the properties are different from the unbound dyes. Therefore, the species When the wavelength range and the characteristics of the dye are indicated, it indicates the dye used, and It should not be a dye that is unbound and characterized in any solvent.   Phosphors generally provide multiple emissions by illuminating the phosphor with light. It is chosen because it can be. Therefore, a single label can provide multiple measurable events. Can be served.   Detectable signals are also provided by chemiluminescent and bioluminescent sources. Chemistry The luminescence source is a signal that is electronically excited by a chemical reaction and is subsequently detectable. Compounds that emit light or donate energy to a fluorescent acceptor No. Many groups of compounds are found to provide chemiluminescence under various conditions are doing. A family of compounds is 2,3-dihydro-1,4-phthalazinedione. You. The most common compound is luminol, which is a 5-amino compound. That Other members of the group include 5-amino-6,7,8-trimethoxy- and dimethyl Amino [ca] benz analogs. These compounds are alkaline peracids It is made to luminesce using hydrogen hydride or calcium hypochlorite and a base. Another family of compounds is 2,4,5-triphenylimidazole, which is a parent substance. And has the general name Loffine. Chemiluminescent analogs include para-dimethi And amino- and -methoxy substituents. Chemiluminescence further includes oxalate, Usually oxalyl active esters such as p-nitrophenyl, as well as peroxides, For example, it is obtained under basic conditions using hydrogen peroxide. Alternatively, luciferin Can be used with luciferase or lucigenin to provide bioluminescence.   Spin labeling is an unpaired electron scan detected by electron spin resonance (ESR) spectroscopy. Provided by environmental indicator molecules with pins. Exemplary spin labels include organic Free radicals, transition metal complexes, especially vanadium, copper, iron and manganese Can be Exemplary spin labels also include nitroxide free radicals.   The label may be a target (sample) nucleic acid (one or more) before or after hybridization. ). The so-called "direct labeling" involves the target ( Sample) a detectable label that is directly added to or incorporated into a nucleic acid. to this In contrast, so-called “indirect labels” are hybrids after hybridization. Linked to a duplex. Often, indirect labels are targeted before hybridization. Attached to the binding moiety added to the nucleic acid. Thus, for example, the target nucleic acid It can be biotinylated prior to redidation. After hybridization, Gin conjugated fluorophores bind biotin bearing hybrid duplexes, Provides a label that is easily detected. Labeling nucleic acid, labeled hybridized nucleic acid For a detailed study of methods for detecting biomarkers, see Laboratory Techniques in Biochemis. try and Molecular Biology, Vol.24: Hybridization With Nucleic Acid Probes , P.Tijssen, ed. See Elsevier, N.Y., (1993).   Fluorescent labels are selected and easily added during the in vitro transcription reaction. Favorable fruit In embodiments, fluorescein-labeled UTP and CTP are converted in vitro as described above. It is incorporated into the RNA generated by the transcription reaction.   The label is added directly or via a linker moiety. Generally, a label or phosphorus The site of the car-label attachment is not limited to any particular site. For example, signs Is the desired detection or hybridization Nucleosides, nucleotides or analogs at any position that does not interfere with Is attached. For example, certain Label-ON Reagents (Clontec h, Palo Alto, CA) were scattered throughout the phosphate backbone of the oligonucleotide Labels are provided and end labels at the 3 'and 5' ends. For example, as shown herein As described, the label is added at a position on the ribose ring or ribose is It may be modified and even removed if desired. The base of useful labeling reagents is Repair in a manner that is natural or does not interfere with the purpose for which they are deployed. It will be decorated. Modified bases include 7-deaza A and G, 7-deaza-8 The A and G, and other heterocyclic moieties include, but are not limited to No.   ii) End-labeled nucleic acid   In many applications, the nucleus may not undergo amplification, transcription, or other nucleic acid conversion steps. It is useful to label the acid sample directly. This means that total cytoplasmic RNA Alternatively, extract poly A + RNA (mRNA) and distort the original distribution of mRNA concentration If you want to hybridize this substance without using any intermediate steps, This is especially true for bell monitoring.   In general, end-labeling techniques optimize the size of the nucleic acid to be labeled. End labeling method Furthermore, it reduces the sequence bias that is sometimes associated with polymerase-assisted labeling. End Labeling may be performed using terminal transferase (TdT).   End-labeling can further comprise labeling the oligonucleotide or analog thereof with a target nucleic acid or This can be achieved by ligation to the ends of the probe. Other end labeling methods Is a standard for nucleic acids using, for example, ligase or terminal transferase. Creation of intelligent or unlabeled "tails". Next, the tail-treated nucleic acid is selectively Meet the tail Expose to the labeled moiety. The tail and the portion selectively associated with the tail may be, for example, a nucleic acid. , Peptides or polymers such as hydrocarbons. Two tails and their recognition That have a ligand-substrate relationship, such as Molecules, such as haptens, epitopes, antibodies, enzymes and their substrates, and complements Target nucleic acids and their analogs.   The label associated with the tail or tail recognition moiety includes a detectable moiety. Tail and If the recognition moieties are labeled together, each label associated with each , Has a ligand-substrate relationship. Each label further includes an energy transfer reagent, For example, dyes having different spectroscopic properties are included. Energy transfer pair is desired To obtain the combined spectral characteristics of For example, absorbed by a second dye A first dye that absorbs at a shorter wavelength than is absorbed by a shorter wavelength, Transfer energy to the second dye. Next, the second dye is emitted by the first dye alone. Emits electromagnetic waves at wavelengths longer than the specified wavelength. Energy Transfer Reagents Are Co-pending US Patent Application (Submitted on Dec. 23, 1996, Attorney Trial No. 2013.3.2. (This is a continuation of SSN 08/529, 115 (submitted on September 15, 1995).) , And USSN 07 / 624,114 (submitted December 6, 1990. (It is a CIP of USSN 07 / 362,901 (submitted on June 7, 1990)) USSN 08 / 168,904 (submitted December 15, 1993) Of USSN 08 / 670,118 (submitted June 25, 1996) International Patent Application WO 96/14839, filed in part on September 13, 1996 ) (The contents of which are incorporated herein by reference). It is particularly useful in such two-color labeling methods.   Accordingly, the present invention provides a method for labeling a nucleic acid and a useful reagent therefor. I will provide a. Many of the methods disclosed herein involve end labeling. Business The present invention is generally applicable to chemical and molecular biological techniques as disclosed. It is possible.   In one embodiment, the method provides a nucleic acid, provides a labeled oligonucleotide, And the step of enzymatically linking the oligonucleotide to the nucleic acid. Accordingly Thus, for example, when the nucleic acid is RNA, the labeled ribooligonucleotide is Are ligated using RNA ligase is a single-stranded RNA having a 5 'phosphate group (Or DNA, but the reaction with RNA is more efficient) and RNA (or DNA ) Catalyzes the covalent bonding of another piece to the 3'-OH end. For use of this enzyme Special requirements for The Enzymes, Volume XV, Part B, T4 RNA Ligase, Uhlenbeck  and Greensport, pages 31-58 and 5.66-5.69 in Sambrook et al., Molecular C loning, A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbo r, New York (1982).   Thus, the present invention claims to incorporate labeled nucleotides during nucleic acid polymerization. Rather, a method is provided for adding a label directly to a nucleic acid (eg, extracted RNA). This This is accomplished by adding a short, labeled oligonucleotide to the end of the single-stranded nucleic acid. Achieved. The method labels the sample more completely; A higher percentage of available molecules are labeled.   Mg2+Heat to fragment the RNA randomly. This is generally 5 An RNA fragment with an 'OH group and a phosphorylated 3' end is generated. T4 Polynuk Phosphate groups can be prepared using leotide kinase or similar enzymes using standard protocols. Is added to the 5 'end of the fragment. The pool of 5'-phosphorylated RNA fragments contains RN A ligase + 3'OH group + label at the 5 'end (for example, fluorescein or Is for subsequent labeling with other dyes or streptavidin conjugates Biotin or dioxygenin for subsequent labeling with a labeled antibody) Add short RNA oligonucleotide with one or more labeled bases I do. RiboA labeled at the 5 'end with fluorescein or biotin6(Deo Xyribonucleic acid 6mer poly A) provides a particularly preferred label. Another embodiment In, the linked RNA oligonucleotide has a ribonucleotide near the junction end However, deoxyribonucleotides are further apart. Of course, RNA Oligonu Nucleotides can be longer or shorter and have almost any sequence. obtain. However, ligation reactions are most efficient with an A at the 3 'end of the receptor. Often, having U has the lowest efficiency. The reaction proceeds under standard conditions. Capture The uncommon RNA6-mer can be subjected to a simple size selection step (eg, electrophoresis, NAP column).   The advantage of this approach is that the extracted mRNA can be used directly, and each fragment is labeled once. Should be recognized and sequence dependent, such as when the labeled base is incorporated during the polymerization reaction. Should not be labeled many times.   In another embodiment, the fragmented DNA is end-labeled using different techniques with different enzymes. Can be recognized. Terminal transferase is a deoxynucleotide that can be labeled. Sidotriphosphate (dNTP) is added to the 3'OH end of the single-stranded DNA. one When a modified nucleic acid is used (for example, dideoxynucleotides) (Rephosphate) or, if desired, various bases. D NA can be physically (sheared) or enzymatically (nuclease) or chemically (eg, (Eg, acid hydrolysis). After fragmentation, depending on the method, the 3 'OH end No need to generate. Next, labeled d in the presence of terminal transferase Use NTP or ddNTP And label the DNA fragment.   Various other examples are set forth in the examples set forth herein and the associated drawings. An embodiment will be described.   C) Modification of sample to improve signal-to-noise ratio   Reduce the complexity of the sample, thereby reducing the background signal, Hybridization with high-density probe arrays to improve measurement sensitivity Before, the nucleic acid sample is modified. In one embodiment, the complex for expression monitoring methods Sex reduction is achieved by selective degradation of background mRNA. this is, Sample mRNA (eg, poly A+RNA) by using the pro DNA that specifically hybridizes using the region where the probe hybridizes. Achieved by hybridizing with a pool of gonucleotides . In a preferred embodiment, the pool of oligonucleotides is found on a high density array. Consisting of the same probe oligonucleotides as   The pool of oligonucleotides contains a large number of double-stranded (hybrid duplex) nucleic acids. Is hybridized with the sample mRNA. The hybridized sample is then Treatment with RNase A, a nuclease that specifically digests single-stranded RNA. The RNase is then purified using a protease and / or a commercially available RNase inhibitor. Suppressorase A, and then the double-stranded nucleic acid is separated from the digested single-stranded RNA. This separation is Can be accomplished in a number of ways well known to those skilled in the art, such as electrophoresis and Gradient centrifugation includes, but is not limited to. However, preferred In an embodiment, the DNA attached to the beads, thereby forming a nucleic acid affinity column A pool of oligonucleotides is provided. After digestion with RNase A, Denature the duplex (eg, by heating or by increasing the amount of salt) By washing the hybridized mRNA in elution buffer, the hybrid The loose DNA is easily removed.   Undissociated probes that hybridize to probes in high-density arrays or other solid supports The fragmented mRNA fragment is then coupled to an RNA linker, preferably using RNA ligase. End-labeled with an attached fluorophore. This technique works with probes in the array. Nucleic acids that do not correspond to are eliminated and therefore contribute to the background signal This results in a labeled sample RNA pool that is not available for use.   Another way to reduce sample complexity is to target areas where high-density array probes are directed. Deoxyoligonucleotides that hybridize to adjacent regions on either side And hybridizing the mRNA using Processing by RNase H The principle is to selectively digest double-stranded (hybrid double-stranded) Previously bound by the leotide probe, it binds to the target of the high electron density array probe. A pool of single-stranded mRNA corresponding to the corresponding short region (eg, 20mer); Longer mRNA sequences corresponding to the region between the targets of the You. The short RNA fragment is then separated from the long fragment (eg, by electrophoresis) and If necessary, label as described above and then hybridize using a high-density probe array. Prepare for redidation.   In the third approach, reducing the complexity of the sample is accomplished by using a specific (preselected) mRNA message. Includes selective removal of sage. In particular, probes in high electron density arrays Highly expressed mRNA messages that are not differentially probed are preferably excluded. Left. This approach involves a preselection message close to the 3 '(poly A) end. Using an oligonucleotide probe that specifically hybridizes with+ and a step of hybridizing the mRNA. Probe is advanced It is selected to provide specificity and low cross-reactivity. High by RNase H Processing of the hybridized message / probe complex digests the double-stranded region and leaves Message from Poly A+Is effectively removed. Next, poly A+RNA specifically Retention or amplification methods (eg, oligo dT columns or (dT) n magnetic beads) ), The sample is processed. Such a method is that they are no longer poly A+With the tail Do not keep or amplify selected message (s) because they are not relevant . These highly expressed messages are effectively removed from the sample and A sample is provided that exhibits reduced mRNA. IV. Hybridization array design   A) Probe composition   Those skilled in the art will recognize that a vast number of array designs are suitable for practicing the present invention. one General difference screening arrays can be used, for example, in random, accidental selection, or Includes a set of loops. Alternatively, a general difference screening array may include specific preselected lengths. Includes all possible oligonucleotides. Conversely, other expression monitoring The array is typically specific for the nucleic acid (s) whose expression is to be detected. Includes multiple probes that hybridize. In a preferred embodiment, the array has one Contains one or more control probes.   1) Test probe   In its simplest embodiment, the high density array is 5 bases or more in length, preferably A "test probe" (probe probe) of 10 bases or more, and some 40 bases or more Lignonucleotides). In some embodiments, the probe The tubes are less than 50 bases in length. In some cases, these oligonucleotides About 5 to about 45 or 5 to about 50 nucleotides in length, more preferably about 10 to about 4 It is 0 nucleotides in length, most preferably in the range of about 15 to about 40 nucleotides. In other particularly preferred embodiments, the probe is 20 or 25 nucleotides in length It is. Preselection expression monitoring arrays use these probe oligonucleotides. Ptides are associated with specific subsequences of expression of the gene for which they are designed for detection. It has a complementary sequence. Therefore, the test probe is the target nucleic acid to be detected. It can specifically hybridize.   High-density oligonucleotide arrays designed for general difference screening In b, the probe oligonucleotide is hybridized with a specific preselected subsequence of the gene. There is no need to be selected to redize. On the contrary, favorable general differences Screening arrays are probe arrays whose sequences are random, arbitrary or accidental. Gonucleotides. Alternatively, the probe oligonucleotide is Length (eg, all possible 4 mer, all possible 5 mer, possible All 6mers, all possible 7mers, all possible 8me rs, all 9mers possible, all 10mers possible, possible All possible, such as all 11 mers and all possible 12 mers Nucleotides.   A random oligonucleotide array is a pool of nucleotide sequences of a certain length. Is random (ie, blind, unbiased) from the set of all possible arrays of that length. An array that does not significantly deviate from the pool of nucleotide sequences selected in You.   An arbitrary or accidental nucleotide array of probe oligonucleotides Oligonucleotide is selected without confirming and / or preselecting the target nucleic acid Array. Arbitrary or accidental nucleotide arrays should be close or random Even for the sake of, but not However, there is no guarantee that they meet random statistical definitions.   The array may comprise a probe composition as described herein, and / or a probe. Some nucleotids based on non-redundancy and / or coding sequence bias Reflects the node selection. However, in a preferred embodiment, such "deflection" Probe sets are still not selected to be specific for any particular gene. No.   An array containing all possible oligonucleotides of a particular length will have the sequence Containing oligonucleotides having sequences corresponding to substantially all permutations of 2 shows an array. Therefore, the probe oligonucleotide of the present invention is preferably Is up to 4 bases (A, G, C, T) or (A, G, C, U) or these bases An array with all possible nucleotides of length X to contain the derivatives of , Substantially 4XDifferent nucleic acids (eg 16 different nucleic acids for a 2mer, 3 64 different nucleic acids for the mer, 65536 different nuclei for the 8mer Acid). Some minor sequences may be due to synthesis issues, inadvertent truncation, etc. From the pool of all possible nucleotides of a particular length It is thought that it becomes. Thus, all possible nucleotides of length X are Included arrays indicate arrays that have substantially possible nucleotides of length X. Is understood. Virtually all possible nucleotides of length X are different 90% or more, typically 95% or more, preferably 98% or more, more preferably 99% or more, and most preferably 99.9% or less Including the above.   The probe oligonucleotide described above further comprises a constant domain. Steady state Is a nucleotide site common to virtually all probe oligonucleotides. Array. Particularly preferred constant domains are those oligonucleotides closest to the substrate. Located at the end of the probe (Ie, attached to the linker / anchor molecule). The constant region is virtually Sequences can be included. However, in one embodiment, the constant region is at the site of the restriction site. Or a sequence or subsequence complementary to the antisense strand (restriction endonucleus). Nucleic acid sequence recognized by the enzyme.   The constant domains are newly synthesized on the array. Alternatively, the constant regions are separate Prepared by technique and bound intact to the array. The constant domains are synthesized separately The intact domain is then a concern since intact constant subsequences are then combined into a high density array. Can be virtually any length. Some constant domains are 3 nucleotides in length. To about 500 nucleotides, more typically about 3 nucleotides to about 100 nucleotides. Reotide, most typically in the range of 3 nucleotides to about 50 nucleotides. In certain embodiments, the constant domain is from 3 nucleotides to about 45 nucleotides in length , More preferably 3 nucleotides to about 25 nucleotides, most preferably 3 nucleotides to It is in the range of about 15 or even 10 nucleotides. In other embodiments, New constant regions range in length from about 5 nucleotides to about 15 nucleotides.   In addition to the test probe that binds the target nucleic acid (s), a high-density array May contain multiple control probes. The control probes were the three shown here. 1) Normalized control; 2) Expression level control; and 3) Mismatch H control.   2) Normalized control   The normalization control is completely compatible with the labeled reference oligonucleotide added to the nucleic acid sample. Oligonucleotide probes that are complementary. After hybridization The signals obtained from the normalization controls are the hybridization conditions, label strength, Change between arrays for "read" efficiency and signal for complete hybridization Let Controls for mutations of other factors are provided. In a preferred embodiment, the The signal read from all other probes (eg, fluorescence intensity) Separated by the signal (eg, fluorescence intensity) from the probe, Normalize the setting.   Virtually any probe serves as a normalization control. However, hive It has been recognized that the residation efficiency varies with base composition and probe length. You. The preferred normalization probe is the average length of other probes present in the array. But they cover a wide range of lengths. Can be selected. The normalization control (s) may also include other controls in the array. Selected to reflect the (average) base composition of the lobes, but preferred In embodiments, only one or a few normalized probes are used, To any target-specific probe. Are also selected not to match.   Normalization probes can be located anywhere in the array or at multiple locations throughout the array. May be present to control spatial variations in hybridization efficiency. Favorable fruit In embodiments, the normalization control is located at a corner or edge of the array, as well as in the middle.   3) Expression level control   Expression level controls are those that specifically hybridize to constitutively expressed genes in a biological sample. Probe. The expression level control measures the overall health and metabolic activity of the cells. Designed to control. Of the covariance between the expression level control and the expression level of the target nucleic acid Experiments show that a measured change or mutation in the expression level of a gene Indicates whether it is due to a change or a general variation in cell health. Therefore For example, poor or critical cell health In the absence of the analyte, the expression levels of both the active target gene and the constitutively expressed gene It is expected to decrease. The reverse is also true. Therefore, expression level control and target Both expression levels of the gene may decrease or increase together If so, the change is associated with a change in the metabolic activity of the cell as a whole, It is not involved in the differential expression of offspring. Conversely, the expression level of the target gene and expression level control If the bells do not change simultaneously, a change in the expression level of the target gene will And does not contribute to the overall variation of the metabolic activity of the cell.   Virtually all constitutively expressed genes provide suitable targets for expression level controls. Typically, expression level control probes are constitutively expressed "housekeeping" Gene and a sequence complementary to the subsequence of the gene, for example, the β-actin gene , Transferrin receptor gene, GAPDH gene and the like. It is not limited to.   4) Mismatch control   The mismatch control is used as an expression level control for the probe for the target gene. Provided for or against a normalized control. One or more mismatch controls Except for the presence of the above mismatched base, the corresponding test or control probe The same oligonucleotide probe. Mismatched bases, otherwise The probe must not be complementary to the corresponding base in the specifically hybridized target sequence. Is the base chosen. One or more mismatches are appropriately high Under hybridization conditions (eg, stringent conditions), the test or control probe Predicted to hybridize to the target sequence, but mismatched probes Selected to not hybridize (or to a significantly lesser extent) It is. Preferred Small mismatch probes contain a central mismatch. So, for example, professional If the probe is a 20 mer, the corresponding mismatch probe will be at position 6-14. Any single base mismatch (eg, one G, C or Except that T is replaced with one A).   For “general” (eg, random, arbitrary, accidental, etc.) arrays, the target nucleic acid (single Or multiple) are unknown, so perfect match and mismatch probes are determined a priori. Cannot be fixed, designed or selected. In this case, the probes are preferably provided as pairs. Where each pair of probes differs in one or more preselected nucleotides. You. Therefore, it is not known a priori which of the pair is a perfect match. No, but one probe specifically hybridizes to a specific target sequence In some cases, the other probe in the pair acts as a mismatch control for its target sequence. You can see that Perfect match and mismatch probes need to be provided as pairs Large population of probes that are not, but differ from each other by certain preselected nucleotides It is understood that it can be provided as (e.g., 3, 4, 5, or more).   Mistakes in both expression monitoring and general difference screening arrays Match probes are nonspecific for nucleic acids in a sample other than the target to which the probe is complementary. Controls for target binding or cross-hybridization are provided. Therefore, A mismatch probe indicates whether the hybridization is specific. For example When a complementary target is present, a perfect match probe will consistently Should be brighter than In addition, if all central mismatches exist, Mutations can be detected using a match probe. Finally, perfect matches and misma The intensity difference between the probe and the probe (I (PM) -I (MM)) is Good measurement of quality concentration Providing is also a discovery of the present invention.   5) Sample preparation / amplification / quantification control   The high density array may further include a sample preparation / amplification control probe. They are Selected because they do not normally occur in the nucleic acid of the particular biological sample being assayed. A probe that is complementary to a subsequence of the control gene. Appropriate sample preparation / amplification controls As a probe, for example, if the sample is an organism from a eukaryote, Probes for offspring (eg, Bio B).   RNA is directed to a sample preparation / amplification control probe prior to processing Spike with a quantity of nucleic acid. Next, hybridization of sample preparation / amplification control probe The quantification of the application is determined by the processing steps (eg, PCR, reverse transcription, in vitro transcription, etc.). ) Provides a measure of the change in nucleic acid abundance caused by   Quantitative controls are similar. Typically, they are published before hybridization. A known amount is combined with the sample nucleic acid (s). They provide a quantitative reference, To determine the standard curve for quantifying the amount of hybridization (concentration) It seems to tie.   B) Probe selection and optimization   i) General difference screening array   a) Unexpected probe selection   As explained above, probe probes for general difference screening arrays Ligonucleotide selection can be random, arbitrary, accidental composition bias, or Includes all possible oligonucleotides of fixed length. Therefore, probe selection Cannot be assumed in essence. However, in some embodiments, certain Oligonucleotides are excluded from the array or from analysis. For example, palindrome structure A probe containing a sequence or a long one that is all A, C, G, T, etc. Probes containing a continuation are excluded. Excluded probes are identical for a single array Multiple hybridizations with the sample and / or different cores of the array Can be identified by hybridizing the pea with the same sample. For the same sample Shows unacceptable mutations (mutations above a certain threshold) Probes are excluded (in array construction or in a single analysis). Plow The level of mutation at which the probe is excluded is a function of the desired sensitivity of the assay. More sensitive The more the test is desired, the lower the exclusion threshold that is set. In a preferred embodiment, Mutation of hybridization intensity is more than twice background, relative mutation If is greater than 50%, the probe is excluded.   Alternatively, such exclusion refers to differences between the test nucleic acid sample and the reference nucleic acid sample. Differentially hybridizes when compared to the difference between the control nucleic acid sample and itself. Unique to the selective identification of sequences that This is further explained in section IX (B) below. In detail.   b) Use of codon degeneracy   In another embodiment, species-specific codon usage is used to combine all possible sequences with Increasing the number of probe oligonucleotides required to hybridize Rather, longer (and therefore more specific and stable) probes may be utilized. amino acid Codons are conserved in the first and second positions of those codons, while the third position is high. Redundant at times. In addition, each species or organism encodes any particular amino acid Also prefer certain codons. Preference for certain amino acids in certain species The low codon is the most frequently used codon for the species. Codon preference Is well known to those skilled in the art. These are the nucleotide sequences of a particular organism or species Is easily determined by a simple frequency analysis.   Similarly, the di-, tri-, and tetranucleotide frequency bias of a particular organism or species may be used. Oligonucleotides used in “composition biased” general difference screening arrays The choice of otide probe can be weighed.   In one preferred embodiment, the first two nucleotides of each codon are fixed. But the third nucleotide is changed (using 4-way wobble, or Probe oligonucleotide (using nosin or other non-specific hybridizing bases) Reotide is prepared. In a preferred embodiment, each codon of the probe is one of the following: Have general formula       3'-X1-XTwo-I-5 ' (Wherein I is inosine or 4-way fluctuation, X1And XTwoIs for a specific species A, G, C, T / U selected according to preferred codon usage). did Thus, for example, a 16me that substantially hybridizes to all nucleic acids of a particular species An array of r can be prepared, where the probe has the formula:     Support-I1-XTwoXThreeIFour-XFiveX6I7-X8X9ITen-X11X12I13-X14X1 Five I16-3 ' And 4TenWith only three different probe oligonucleotides. Pros Table 1 shows the appropriate codons for the protein.   Table 1. Preferred for general coding sequence 16mer probe oligonucleotide New sequence (from amino acid codon (gene code) standard table)  The affinity of the probe is determined by additional inosine (or 4-, 3- or 2-way fluctuations). Or other common bases) with the 3 'and 5' oligonucleotide probes. Inclusion at the end further enhances. These codon usage deflection probes Can be used together with ligase identification to further enhance obtainable sequence information . Thus, for example, hybridization with an array comprising the 16mer described above Further comprises one or more linkable fixed-length N When including ligation with oligonucleotides, each Successful ligation provides 16 + N nucleotide sequence information.   ii) Expression monitoring array   In a preferred embodiment, the oligonucleotides in the expression monitoring high density array are Probe is minimally non-specific under the specific hybridization conditions used. Using binding or cross-hybridization, the nucleic acid target to which they are directed It is selected to bind specifically. The high density array of the present invention has 1,000,000 Characteristic length that binds to a specific nucleic acid sequence because it contains extra probes of different Can be provided. Thus, for example, high density Array contains all possible 20mer sequences complementary to IL-2 mRNA I can do it.   However, there are 20-mer subsequences that are not unique to IL-2 mRNA You. Probes directed to these subsequences can be used in other regions of the sample genome. It is expected to cross-hybridize with the products of their complementary sequences. Similarly, Other probes can be readily prepared under hybridization conditions (eg, secondary structures). Hybridization or interaction with substrates or other probes) It does not mean that Therefore, in a preferred embodiment, such inadequacy Probes showing high specificity or hybridization efficiency were confirmed and Hybridizing within the density array itself (eg, during array fabrication) or Not included in post-test data analysis.   Further, in a preferred embodiment, an expression monitoring array is used to generate several hundred bases. The presence and expression (transcription) levels of genes of opposite length or longer can be ascertained. Hot For most applications, determine the presence, absence, or expression levels of thousands to 100,000 genes. It is useful to recognize. A Due to the limited number of oligonucleotides per ray, in a preferred embodiment Contains only a limited set of genes specific to each gene whose expression is to be detected. desirable.   a) Hybridization and cross-hybridization data   Therefore, in one embodiment, the present invention provides a method for detecting a particular gene. A method is provided for optimizing a set of probes. Generally, the method involves transcription by the target gene. Multiple of one or more specific lengths that are complementary to a subsequence of the mRNA to be Providing a high density array containing the probes of the invention. In one embodiment, the high Density array contains all probes of a specific length that are complementary to a specific mRNA I can do it. The high density array of probes is then hybridized with their target nucleic acid alone. Followed by high-complexity, high-concentration nucleic acid assays that do not contain a target complementary to the probe. Hybridize with the fee. Thus, for example, if the target nucleic acid is RNA, The lobes are first hybridized with their target nucleic acid alone, and then the cDNA library RNA (eg, reverse transcribed poly A+Hybridization using mRNA) Soybean, in which case the sense of the hybridized RNA is opposite to that of the target nucleic acid (Ensure that high complexity samples do not contain the target for the probe To make it). Show strong hybridization signals with their targets High complexity samples show low or no cross-hybridization Lobes are a preferred probe for use in the high density arrays of the present invention.   High-density arrays additionally contain a mismatch control for each probe tested I do. In a preferred embodiment, the mismatch control contains a central mismatch. Mi Both the match control and the target probe have high levels of hybridization (eg, If you hive with a mismatch Redidation is approximately equal to hybridization with the corresponding test probe Test probe is preferably a high-density array. Not used for   In a particularly preferred embodiment, the optimal probe is selected according to the following method. First, as described above, a number of oligonucleotides complementary to a subsequence of the target nucleic acid. An array is provided that contains the peptide probes. Oligonucleotide probes are It can be single length or a series of different lengths. The high-density array is specific mRN A may contain all probes of a specific length complementary to A or It may contain probes selected from various regions. For each target-specific probe In this regard, the array further comprises a mismatch control probe, preferably a central mismatch. Contains control probe.   Oligonucleotide arrays are sub-arrays complementary to oligonucleotide probes. Hybridized with a sample containing a target nucleic acid having a sequence, and with each probe The difference in hybridization intensity between the mismatch control is determined. Step The difference between the lobe and its mismatch control is the threshold hybridization intensity (eg, For example, preferably at least 10% of the background signal intensity, more preferably Is selected, only those probes that exceed 20% or more, and most preferably 50% or more) are selected. . Therefore, it is a probe that shows a stronger signal than those mismatch controls. Injury is selected.   The probe optimization procedure can optionally include a second round of selection. Smell of choice Oligonucleotide probes are expected to contain a sequence complementary to the probe Hybridization is performed using a nucleic acid sample that is not used. So, for example, a probe Is complementary to the RNA sense strand, a sample of the antisense RNA is provided . Of course, it is known that the specific gene is lacking or does not express the specific gene. Other samples may also be provided, such as samples from known organisms or cell lines. You.   Both the probe and its mismatch control are below the threshold (eg, background Less than about 5 times, preferably about 2 times or less, and more preferably about 1 time, Below, and most preferably about half or less). Only those that are selected. In this method, probes showing the least non-specific binding are selected Is done. Finally, in a preferred embodiment, both target N probes with the highest hybridization intensity for the offspring, where n is The desired number of probes for the target gene) is selected for incorporation into the array Subsequence data analysis, or if already present in the array, Selected for. Of course, those skilled in the art will recognize that both selection criteria Understand that it is used alone.   b) Heuristic rules   Hybridization and cross-hybridization obtained as described above Hybridization and cross-hybridization Intensity versus various probe properties, such as the number of A, C in an 8-base window, A graph can be created for palindrome structural strength and the like. Next, their characteristics and hive With respect to the correlation between re-digestion or cross-hybridization intensity, Examine the graph. Above that, hybridization is always inadequate Or, set a threshold at which cross-hybridization is always very strong. If every probe meets one of the criteria, it is excluded from the probe set. , And therefore are not placed on the chip. This is called a heuristic rule.   A set of rules q developed for a 20mer probe in this way Is shown below:   Hybridization rules:   1) The number of A is less than 9.   2) The number of T is less than 10 and greater than 0.   3) The maximum run of A, G or T is less than 4 bases in one row.   4) The maximum run of any two bases is less than 11 bases.   5) The palindrome structure score is less than 6.   6) The cluster score is less than 6.   7) The number of A + T is less than 14.   8) The number of A + G is less than 15.   Regarding Rule 4, less than 11 bases are required for a maximum run of any two bases That at least three different bases are within any 12 contiguous nucleotides Guarantee that it will happen. The palindrome score indicates that the oligonucleotide is self-complementary. If folding at the point of maximization is the maximum number of complementary bases. Accordingly Thus, for example, a 20-mer that is completely self-complementary has a palindrome structure score of 10. The colony score is the maximum number of identical 3-mer bases in a given sequence. Therefore, For example, a run of five identical bases gives a cluster score of 3 (bases 1-3, bases 2-4 and And bases 3 to 5).   If any probe meets these criteria (1-8), then the probe It was not a member of a small group of probes placed on the chip. For example, a hypothetical Let the lobe be 5'-AGCTTTTTTTCATGCATCTAT-3 ' And it has 4 or more base runs (ie 6 runs), so the chip Not synthesized above.   The cross-hybridization rules developed for the 20mer are shown below :   1) The number of C is less than 8.   2) The number of C in an arbitrary window of 8 bases is less than 4.   Therefore, any probe can be used for hybridization rules (1-8) or exchange. If the difference hybridization rules (1-2) are met, the probe They were not members of a small group of probes placed on top. These rules are exchanged for cooperation. Multiple probes that show differential or low hybridization Exclude and perform a moderate task of excluding weakly hybridizing probes. Done.   These heuristic rules are implemented by manual calculations or they are In software as described in Section XII.   c) Neural net   In another embodiment, the neural net is trained to provide an array of probes or other And cross-hybridization based on probe properties Can be predicted. In that case, an arbitrary number of "best" Pick a probe. One such neural network is a 20mer probe Developed for choosing This neural net has a predictive strength and a measured strength. And a moderate (0.7) correlation between Shows a better model for hybridization. This neural net Are provided in Example 6.   d) ANOVA model   A mutational analysis (ANOVA) model was built to build on one of the constitutive base pairs Simulate strength. This is the stacking energy of bases with continuous melting energy. Is based on the theory that Probe using ANOVA model Sequences and hybridizations A correlation between the hybridization and cross-hybridization intensity was found. The input is The probe sequence was decomposed into continuous base pairs. Create a model and hybridize Dication was predictive of cross-hybridization in another model. output Was the hybridization or cross-hybridization intensity.   At 14 possible 2 base combinations and at 19 where the combination is found, There were 304 (19 * 16) possible inputs composed of them. For example, The columns aggctga ... have "ag" in the first position, "gg" in the second position, The third position has “gc”, the fourth position has “ct”, and so on.   The resulting model assigns a component of the output intensity to each possible input, Thus, to estimate the intensity for a given array, each of the 19 components Simply add the strength of   e) Deletion (removal) of similar probes   One of the causes of the pool signal in the expression chip is other than the gene being monitored Genes have sequences very similar to some of the sequences being monitored. You. The easiest way to solve this is to remove probes that are more similar than one gene. Is to leave. Thus, in a preferred embodiment, a transcriptional It is desirable to remove (reduce) the probes that hybridize to the product.   The simplest method of reduction is to use all known genes for the organism being monitored. To align the proposed probes with For example, the remains of an organism The probe for gene 1 and gene 2 of an organism are shown below: Has eight matching bases in this column, but in the following column The matching base is 20:   There are also more complex algorithms that allow detection of insertion or deletion mismatches. This Such sequence alignment algorithms are well known to those skilled in the art, and include, for example, BLAST or Is a FASTA or other gene matching program as described in the definition section above. Program, but is not limited thereto.   Very similar if the organism has many different genes that are very similar It is difficult to set a probe to measure the concentration of only one gene. On the spot If not, cut off any dissimilar probes and probe sets for genes of that family. May be set to the probe.   f) Reduction of synthesis cycle   The cost of reducing chip masks is almost linearly related to the number of synthesis cycles. You. In the normal set of genes, the number of cycles over which every probe is dedicated to construction The distribution approximates a Gaussian distribution. For this reason, mask costs are generally Discarding about 3% results in a 15% reduction. In a preferred embodiment, Cycle Reduction is selected for the preparation of high-density oligonucleotide arrays of interest Probes that require more synthesis cycles than the maximum number of synthesis cycles Is included. A typical synthesis of a probe involves the ordered To follow the pattern (acgtacgtacgt ...), it is necessary to construct the probe. Counting the number of synthesis steps is easy. The list shown in Table 1 shows the synthesis cycle that requires a probe. An exemplary code for counting the number of periods is provided. Table 1. Typical code for counting the number of synthesis cycles required for chemical synthesis of probesg) Combination of selection methods Heuristic rules, neural nets and annova models A method is provided for reducing or reducing the number of probes for monitoring current. These methods do not always produce the same result or produce completely independent results. It is beneficial to combine the methods as they occur. For example, one or more (for example, three If two of the methods indicate that the probe does not seem to give good results, , Probes are reduced or reduced. Next, synthesis cycle reduction is performed, Is reduced.   FIG. 11 monitors gene expression after the number of probes is reduced or reduced. 2 shows a flow of a process of increasing the number of probes to perform In one embodiment, the user The user should place nucleic acid probes on the chip to monitor the expression of each gene. The number of lobes can be specified. As mentioned above, professionals who do not seem to produce good results It is beneficial to reduce the number of moves. However, the number of probes is substantially Can be reduced below the desired number.   In step 402, the number of probes for monitoring multiple genes is determined. Rule method, neural net, annova model, synthetic period reduction, or any other Or a combination thereof. The gene is selected in step 404. Selected.   The remaining probes for monitoring the selected gene have the desired number of probes of 8 0% or more (may change or may be limited by the user) Is determined. If yes, the computer system proceeds to step 408. Proceeds to the next gene, which generally returns to step 404.   The remaining probes for monitoring the selected gene have the desired number of probes of 8 If the value does not reach 0% or more, the remaining More than 40% of the desired number of probes (may vary, Sometimes limited) It is determined whether or not to do so. If yes, at step 412, after the reduction, "I" is appended to the gene name to indicate that the probe was incomplete .   In step 414, the number of probes is reduced by loosening the constraints that removed the probes. Is increased. . For example, the heuristic rule threshold is increased by one. Therefore If the probes were previously removed and they had four A's in one row, the rule would be The rule is relaxed to five A's per line.   Next, at step 416, the remaining probes for monitoring the selected gene are A determination is made whether it is greater than or equal to 80% of the desired number of probes. In the case of Jesus In step 412, the rule is relaxed by adding “r” after the gene name. Shows that a number of synthetic probes for the gene have been generated.   In step 420, one or two probes are used to monitor the selected gene. A check is made to see if it only conflicts with one other gene. If yes, at step 422, the entire set of probes complementary to the gene (or target sequence) So that only the rest of the probe is exactly complementary to the selected gene. , Is reduced.   Next, at step 424, the remaining probes for monitoring the selected gene are A determination is made whether it is greater than or equal to 80% of the desired number of probes. In the case of Jesus Means that in step 426, "s" is appended after the gene name, and only a few genes Indicates that the expression was the same as that of the selection gene.   In step 428, the probe for monitoring the selected gene Is not reduced at all. Next, in step 430, to monitor the selected gene The remaining number of probes It is determined whether or not it is 80% or more. If yes, at step 432, "F" is added to the end of the gene name, so that the probe is completely complementary to the gene. Of the probe.   If 80% of the desired number of probes is still not present, step 434 Is reported. An arbitrary number of error handling procedures are undertaken. For example, the user Error message and the probe for the gene is not saved. Alternatively, the user is prompted to enter a new desired number of probes. V. Synthesis of high-density arrays   Using a minimum number of synthetic steps, oligonucleotides, peptides and other poly Methods for forming high-density arrays of mer sequences are known. Oligonucleotide-like Body arrays include light-directed chemical coupling, and mechanical-directed coupling, However, it is synthesized on a solid substrate by various methods including but not limited to (Pirr ung et al., US Pat. No. 5,143,854 (further PCT published WO 90 / 15070) and Fodor et al., PCT Publication Nos. WO 92/10092 and WO.   93/09668) (these are, for example, peptides using light-directed synthesis technology). Discloses a method for producing large arrays of oligonucleotides and other molecules (See also Fodor et al., Science, 251,767-77 (1991)). Polymer array These techniques for synthesis are described in VLSIPS.TMCurrently called the law. VLSI PSTMUsing an approach, heteroarrays of polymers can be replicated at multiple reaction sites. Via different couplings to different heteroarrays (US 07/7 96,243 and 07 / 980,523).   No. 5,143,854 and PCT Publication WO 90/1507 mentioned above. 0 and VLSI as described in 92/10092 PSTMMethod development is in the area of combinatorial synthesis and combinatorial library screening. It is considered to be a pioneering technology. More recently, patent application 08/08 No. 2,937 (submitted June 25, 1993) describes a partial or complete sequence of a target nucleic acid. To check or confirm and contain specific oligonucleotide sequences Of oligonucleotide probes that can be used to detect the presence of a growing nucleic acid Is described.   In short, light-directed combinatorial synthesis of oligonucleotide arrays on a glass surface Proceeds using automated amide phosphate chemistry and chip making techniques. In one specific run The glass surface has functional groups, such as hydroxy, which are blocked by photolabile protecting groups. Derived with silane reagents containing sil or amine groups. Through photo flat mask When photolysis is used to selectively expose functional groups, this results in the next incoming 5'-light retention. The reaction with the protected nucleoside amide phosphate is facilitated. Amidophosphate is illuminated (And therefore exposed by removal of the photolabile blocking group) Respond. Thus, amide phosphates are selectively exposed from previous steps. Just append to These steps allow the desired array of sequences to be synthesized on a solid surface. Until it is done. Different oligonucleotides at different positions on the array The combination synthesis of analogs depends on the illumination pattern during the synthesis and the order of addition of coupling reagents. Determined by the introduction.   Oligonucleotide analogues with polyamide backbone are VLSIPSTMUsed in the law Amides because the monomers do not attach to each other through phosphate linkages It is generally inappropriate to carry out the synthetic steps using phosphate chemistry. Instead In addition, peptide synthesis methods are used (eg, Pirrung et al., US Pat. No. 143,854).   Peptide nucleic acids are described, for example, in Biosearch, Inc. (Bedford, MA) Which includes the polyamide backbone and the bases found in natural nucleosides . Peptide nucleic acids can bind to nucleic acids with high specificity, Nucleotide analogs ".   In addition to the above, used to generate arrays of oligonucleotides on a single substrate Another method that may be employed is described in co-pending application Ser. No. 07 / 980,523 (Jan. Submitted on January 20) and 07 / 796,243 (submitted on November 22, 1991), As well as PCT publication WO 93/09668. Open to these applications In the method shown, the reagent flows (1) through a channel defined over the intended area. Or (2) "spotting" the intended area to the substrate Supplied. However, other approaches, as well as spotting and flow A combination of the pairings is used. In each case, the activation region with the substrate is a monomer As the solution is supplied to the various reaction sites, it is mechanically separated from other areas.   A typical "flow channel" method applied to the compounds and libraries of the invention is Generally described as follows. Different polymer sequences allow the appropriate reagents to flow Or by forming flow channels in the surface of the substrate on which the appropriate reagents are placed. And synthesized at selected regions of the substrate or solid support. For example, monomer “A” is selected. Assume that the first group of the selected region is attached to the substrate. If necessary, select All or part of the surface of all or some of the substrate can be, for example, All substrates by flowing through parts or several, or with appropriate reagents Are activated for binding by washing. Channel blow on the surface of the substrate After arranging the reagents, the reagent having monomer A is transferred to all or some of the channels. Flow through Or put there. The channel brings the liquid into contact with the first selected area, thereby The monomer A on the substrate is directly or indirectly (through space) in the first selection region. Join.   Thereafter, the monomer B is converted to a second selected region, some of which are included in the first selected region. Coupled to The second selection area is the channel block on the substrate surface in the liquid. During translation, rotation or displacement of a metal, or during deposition of a chemical or photocurable resin layer, Contact the second flow channel. Activate at least the second region, if necessary Perform the steps in order to: Thereafter, the monomer B is passed through the second flow channel or And bind monomer B in a second choice. In this particular example, The sequences that are bound to the substrate at this stage of the resulting processing include, for example, A, B and And AB. The process is repeated until the sequence of the desired length is known at a known location on the substrate. To form a simple array.   After the substrate has been activated, monomer A is flowed through several channels and Nomer B flows through another channel and monomer C flows through yet another channel. Is washed away. In this way, the channel block must be moved, or Before the substrate has to be washed and / or reactivated, many or all The reaction zone reacts with the monomer. Simultaneous use of many or all available reaction zones The number of washing and activation steps can be minimized.   An alternative way to form channels or otherwise protect part of the surface of the substrate Those skilled in the art will recognize that there is a law. For example, according to some embodiments, the protection core Coating, for example a hydrophilic or hydrophobic coating (depending on the nature of the solvent), Should be protected, sometimes in combination with substances that promote wetting by the reactant solution in other areas Used for the substrate part. In this way, the flowable solution further reduces their designed flow It is prevented from passing outside the path.   According to other embodiments, electronic or optical as widely used in the semiconductor industry Channels are formed by depositing the curable resin. With such a substance For example, polymethyl methacrylate (PMMA) and its derivatives, and electronic Such as poly (olefin sulfone) (Chapter 10 of Ghandi, VLSI Fabrication Principles, Wiley (1983) Has been disclosed). According to these embodiments, resist is deposited and selectively exposed. Exposed and etched, leaving part of the substrate exposed for coupling . Deposit resist, remove resist selectively, and monomer coupling These steps are repeated to produce the desired sequence of the polymer at the desired location.   The "spotting" method of preparing the compounds and libraries of the present invention involves a flow It can be performed in a manner similar to the channel method. For example, monomer A or a binding substance, Or a dimer or trimer or tetramer, etc., or a fully synthetic substance Supplied to the first group of the reaction zone and can bind thereto. Monomer B is Is supplied to and reacts with the second group of the activation reaction zone. The above flow chart Unlike the tunneling embodiment, the reactants are deposited in relatively small amounts directly in the selected area (Rather than flowing). In some steps, of course, The substrate surface is sprayed or otherwise coated with a solution. Preferred embodiment Now, the dispenser moves from area to area and the amount of monomer required at each stop Deposit. A typical dispenser uses a monomer solution as a substrate and robot. To control the position of the micropipette with respect to the substrate Icropipette is mentioned. In other embodiments, the dispenser is Various reagents are simultaneously supplied to the reaction zone. A series of test tubes, manifolds, arrays of pipettes, and the like. VI. Hybridization   Nucleic acid hybridization simply involves the probe and its complementary target being complementary. Under conditions that can form a stable hybrid duplex by base pairing, the denatured probe and And providing the target nucleic acid. Nucleic acids that do not form hybrid duplexes After washing, typically detected by detection of an attached detectable label. Leave the hybridized nucleic acid. Nucleic acids contain nucleic acids by raising the temperature or By reducing the salt concentration of the buffer solution used or when adding chemicals. Or it is generally recognized that it is denatured by increasing the pH. Low stringency conditions (Eg, at low temperatures and / or high salt and / or high target concentrations) Hybrid duplexes (eg, DNA: DNA, RNA: RNA or RNA: DNA ) Is produced even if the annealed sequences are not perfectly complementary. Accordingly Thus, the specificity of hybridization is reduced with low stringency. Conversely, high austerity (Eg, high temperature or low salt concentration), the lower the mismatch, the higher the hybridization Works well.   Hybridization conditions are chosen to provide any degree of stringency. The skilled person will understand that In a preferred embodiment, the hybridization is Run at low temperature, in this case in 6xSSPE-T from about 40 ° C to about 50 ° C (0.0 05% Triton X-100) ensures hybridization and then Perform a wash with high stringency (eg, 1 × SSPE-T at 37 ° C.) to Remove the hybrid hybrid duplex. Desired level of hybridization specificity Until stringency is achieved, with increasing stringency (e.g., 0.25 x SS at 37 ° C to 50 ° C). (Lower concentration of PE-T) Perform cleaning. Stringency can be attributed to the addition of drugs such as formamide. More likely. Hybridization specificity is determined by hybridization of the test probe. Various controls (eg, expression level controls, normalization controls, (E.g., mismatch control). obtain.   Generally, between hybridization specificity (stringency) and signal strength There is a trade-off. Thus, in a preferred embodiment, the cleaning is consistent And provides a signal intensity of about 10% or more of the background intensity Performed in the highest stringency. Thus, in a preferred embodiment, the hybridizing The array is washed sequentially with a high stringency solution and read between each wash. This Analysis of the resulting data set indicates that beyond The pattern changes so appreciably that the particular oligonucleotide probe of interest Wash stringency is provided which provides an appropriate signal for   In a preferred embodiment, hybridization to reduce non-specific binding Detergent (eg, C-TAB) or blocking reagent (eg, sperm DNA, cot) -1 DNA) reduces the background signal. You. In a particularly preferred embodiment, the hybridization is from about 0.1 to about 0.5. Performed in the presence of 5 mg / ml DNA (eg, herring sperm DNA). Yes The use of blocking agents for hybridization is well known to those skilled in the art (eg, For example, Chapter 8 in P. Tijssen, see above).   The stability of the duplex formed between RNA or DNA generally indicates that R NA: RNA> RNA: DNA> DNA: DNA. Long probes are marked Good duplex stability, but poorer discrimination of mismatches than short probes Minutes (mismatch identification Is the measurement hybrid between the perfect match probe and the single base mismatch probe. Indicate the ratio of the signal of the hybridization.) Shorter probe (eg 8mer) makes a mistake It distinguishes matches very well, but has low overall duplex stability.   For example, using known oligonucleotide analogs to form between the target and the probe. Thermal stability of the resulting duplex (Tm) Changes duplex stability and mismatch Another is optimized. TmOne useful aspect of the alteration is that adenine-thymine (AT) Heavy chains have lower T than guanine-cytosine (GC) duplexesmFrom the fact that This occurs, in part, because the AT duplex has two hydrogen bonds per base pair. On the other hand, the GC duplex has three hydrogen bonds per base pair. Base For hetero-oligonucleotide arrays with uneven distribution, each oligonucleotide Simultaneous optimization of hybridization to nucleotide probes is In general, can not. Thus, in some embodiments, a GC duplex is selected. It is desirable to selectively destabilize and / or increase the stability of the AT duplex. No. This is because, for example, guanine residues in the probes of the array forming a GC duplex. For replacing AT with hypoxanthine, or forming an AT duplex By replacing the adenine residue in Ammonium chloride tetramethyl salt (TMAC1 or other alkyl By using ammonium chloride).   Duplex stability conferred by using oligonucleotide analog probes The gender alteration is, for example, hybridized with the target oligonucleotide in time. By tracking the fluorescence signal intensity of different oligonucleotide analog arrays Is confirmed. Data are collected under specific hybridization conditions, for example at room temperature. Enable optimization (To apply to simplify diagnostics in the future).   Another method of demonstrating alterations in duplex stability is hybridization over time. By tracking the signal intensity generated during the installation. DNA targets and DNA Conventional experiments using chips have shown that signal intensity increases with time and stability is high. Duplexes are faster and produce higher signal strength than less stable duplexes. Everything After a certain period of time, the signal becomes plateau or " Reaches "saturation". These data are used to optimize hybridization and at specific temperatures. Enables the determination of the highest conditions.   Methods for optimizing hybridization conditions are well known to those skilled in the art (eg, For example, Laboratory Techniques in Biochemistry and Molecular Biology, Vol. Two 4: Hybridization With Nucleic Acid Probes, P. Tijssen, ed. Elsevier, N. Y. , (1993)). VII. Detection method   The method of detection will depend on the label chosen and will be known to those skilled in the art. Therefore For example, when using a colorimetric label, simple visualization of the label is sufficient. radiation When using radiolabeled probes, detection of radioactivity (eg, photographic film or solid Using a state detector) is sufficient.   As explained above, since the sensitivity is very high and simple, the fluorescent label preferable. Using standard techniques, determine where the interaction between the target sequence and the reagent takes place. Determine. For example, if the target sequence is labeled and different oligonucleotide probes Oligonucleotide interacts with target (sample nucleic acid) when exposed to array Only the position shows a significant signal. In addition to using labels, other methods The trix can be scanned to determine where the interaction occurs. Interaction spectrum Are, of course, the interactions that take place in each of a number of conditions. Can be determined in a temporary manner by repeated scanning of. However, individual interactions Instead of examining each separately, multiple sequence interactions can be determined simultaneously on the matrix. Can be determined.   B. Scanning system   In a preferred embodiment, the hybridized array has an excitation wavelength of a particular fluorescent label. And the resulting fluorescence at the emission wavelength is detected. In particular In a preferred embodiment, the excitation light source is a laser suitable for exciting the fluorescent label.   Detection of the fluorescent signal is preferably performed using a confocal microscope, more preferably at full height. Automated computer-controlled steps to automatically scan density arrays Use a focusing microscope. A microscope was used for each oligonucleotide probe on the array. Automatically records the fluorescence signal generated by hybridization. An optical converter (eg, a photomultiplier) attached to a motion data acquisition system , Solid state array, ccd camera, etc.). Such an automated system U.S. Pat. No. 5,143,854; PCT Application No. 2092/10092; U.S. pending S. S. N. 08 / 195,889 (submitted February 10, 1994) ) Is described in detail. Laser with confocal microscope for signal detection -With illumination, better than about 100 μm, more preferably better than about 50 μm It can be detected with good resolution, most preferably better than about 25 μm.   Using an automatic detection device, the correlation of specific position labels The sequence with the specificity of action is converted to its presence on the target. Therefore, the location information Are converted directly to the database to show what sequence interactions have occurred. For example, in nucleic acid hybridization applications, a substrate matrix and a target molecule Interaction between The sequence used can be enumerated directly from the position information. A preferred detection system is PC T Publication WO 90/15070 and U.S. Pat. S. S. N. 07 / 624,120 Have been. The detection described there is a fluorescence detector, but the detector is It can be replaced by a spectroscopic or other detector. The scanning system is A moving detector, a fixed detector with a movable substrate, or a combination thereof may be used. Alternatively, the signal can be passed directly to the detector using a mirror or other device (eg, For example, U. S. S. N. 07/624, 120).   Detection methods typically incorporate some signal processing, The signal at the fixed matrix position is a true signal or a pseudo signal. Determine if there is. For example, the signal from the region that actually has a positive signal is Spreads and provides positive signals to adjacent regions that do not actually have a positive signal Tend. This is, for example, that the scanning system is high enough to separate the two regions. It occurs where the pixel density is not properly identified at a high pixel density resolution. Therefore, The signal in the spatial domain is used to determine the location and the actual extent of the positive signal. Evaluated pixel by pixel. The true signal is theoretically uniform at each pixel location Indicates the signal. Therefore, the number of pixels with actual signal strength The treatment by plating should have a distinct and uniform signal intensity. Sig Regions with slightly wider variance in null intensity are specifically estimated and the scanning system Program to scan that location more carefully.   More sophisticated signal processing techniques provide an initial check for the presence of a positive signal. (E.g., U.S.A. S. S. N. 07 / 624,120 and the following See discussion in section XII).   VIII. Ligation enhancing signal detection   A) General ligation reaction   Using ligation, perfectly complementary hybrids, especially mismatches, are probed. One or more salts when there is cloning near the 5 'end of the oligonucleotide Different base pairs can be distinguished. When ligation is used for signal detection, The stability of the lid duplex is increased and the hybridization specificity (especially Probe oligonucleotides (e.g., for 5-12 mer) have been improved Optionally, additional sequence information is provided.   The various components for using the ligation reaction in combination with the general difference array are shown in FIG. 3a. In its simplest embodiment, the probe oligonucleotide / ligation The reaction system includes an array of oligonucleotide probes. As mentioned above, Ligonucleotide probes are randomly selected, randomly selected, and compositionally biased. May encompass all possible oligonucleotides of a particular length. Oligonucleotide Otide probes can be attached to virtually all probe oligonucleotides on the array. Optionally, a "constant" region (see FIG. 13a) that has substantially the same sequence. May be included.   If the probe has a constant region, it is further preferably, randomly selected All possible oligonucleotides of a particular length Includes a “variable region” (see FIG. 13 a) that can encompass leotide. Steady and variable The sample nucleus that hybridizes to the oligonucleotide probe if the region is present The acid typically hybridizes at least with the variable region and, optionally, the constant region. Redisize.   The probe oligonucleotide / ligation system is further complementary to the constant region Optionally comprises a nucleic acid. This complement may be a subsequence of the sample nucleic acid or a separate oligonucleotide. Gonucleotide. For the constant region When the complement is a separate oligonucleotide, hybridization with the constant region The section provides a connection site (see FIG. 13a, connection site A). Constant region and hive The redissolved complement is optionally converted to a constant region by use of a cross-linking reagent (eg, psoralen). Permanently bridged with the area. Sample nucleic acid and / or ligatable oligonucleotide Is optionally labeled. If both are labeled, the labels may be the same but different Is also good.   The probe oligonucleotide / ligation reaction system is optionally linked to the free end of the variable region. Includes ligable oligonucleotides that can be ligated (see FIG. 13a, ligated site B) ). Linkable oligonucleotides are single oligonucleotides of a known nucleotide sequence. Reotide, a collection of nucleotides of known sequence, or all possible A pool of lignonucleotides.   These different components of the probe oligonucleotide / ligation reaction system can be prepared in different ways. To increase the stability of the hybrid duplex and / or Specificization (especially short probe oligonucleotides, eg 5-12 (for the mer) and / or provide sequence information. Probe The various uses of the lignonucleotide / ligation reaction system are described in detail below.   FIG. 13a illustrates the linking component in the solid phase, but with a similar approach and configuration. The minute can be used in the solution phase. It is understood that the order of the constant and variable regions can be varied. Sa In addition, the probe oligonucleotide may have multiple constant regions and / or multiple variable Region. In addition, FIG. 13a shows that the 3 'end attached to the solid support Showing the probe oligonucleotide, but with the probe inverted and the 5 'end It can be attached through the edge.   Probe oligonucleotides with or without variable regions The sequence or subsequence of the probe is And / or opening of the polymerization with the ligated oligonucleotide and / or the sample nucleic acid It is understood that it can act as a primer site for initiation.   B) Ligation to identify mismatches at the probe end, target end, or both ends reaction   In one embodiment, a simple ligation reaction is performed at the end or end of the probe oligonucleotide. Mismatches near the edges were identified (see FIG. 13b). Typically, includes sample nucleic acid The resulting nucleic acid fragments are longer than the probe oligonucleotides in the array. Therefore, When hybridized, the target nucleic acid typically has an overhang. array Comprises a probe oligonucleotide attached via its 3 'end, The hybridized target (sample) nucleic acid provides a 3 'overhang. This implementation In embodiments, the target nucleic acid is not necessarily labeled (see, eg, FIG. 13b).   Target-oligonucleotide combining an array of oligonucleotides with a target nucleic acid Upon formation of the hybrid complex, the target-oligonucleotide hybrid complex The body can be ligase and labeled ligation oligonucleotide, or labeled ligation Contacted with a pool of active probes. Hybridizer of sample nucleic acid and ligable probe Although the isolation can be performed sequentially, in a preferred embodiment, the hybridization is performed. The lysis and ligation are performed simultaneously (ie, target, ligatable oligonucleotide). All the tides and conjugates are added together). The pool uses specific preselected probes All possible or of a specific length (eg, 3 mer to 12 mer) (See, for example, FIG. 13b).   Oligonucleotide probes on labeled ligation-probe probes The ligation reaction to the phosphorylated 5 'end of the oligonucleotide mainly depends on the target: oligonucleotide hive. Lid occurs with correct base pairing in the 5 'terminal nucleus of the oligonucleotide probe And the presence of appropriate 3 'overhangs of the target nucleic acid Occurs in the presence of ligase when serving as a template for ligation and ligation ( See FIG. 12). After the ligation reaction, remove the target nucleic acid and the labeled unligated probe. Under suitable conditions (eg above 40 ° C. to 50 ° C. or else under high stringency conditions) In (bottom), the substrate is washed (multiple times if necessary).   Then, a fluorescent image of the hybridization pattern (eg, a quantitative fluorescent image) Image) is obtained as described in section VII (B) above. Labeled oligonucleotide Otide probes, i.e., oligonucleotide probes complementary to the target nucleic acid, were identified. It is. The presence, absence and / or intensity of the hybridization signal Information on the presence and level of nucleic acid sequence or subsequence in the nucleic acid sample as described above I will provide a.   Catalyzes the formation of phosphodiester bonds at the site of single-strand breaks in double-stranded DNA Using any enzyme, a perfectly complementary hybrid and one or more base pairs The discrimination between different ones can be enhanced. Such ligases include T4DN A ligase, ligase isolated from E. coli, and other bacteria and bacteria Ligases isolated from ophages, including but not limited to. Re The concentration of the gauze depends on the particular ligase used, the concentration of the target and the buffer conditions. But typically ranges from about 50 units / ml to about 5,000 units / ml. You. In addition, an array of target: oligonucleotide hybridization complexes The time of contact with the ligase varies. Typically, ligase treatment can take minutes to minutes. Time range Time, implement. A method for performing ligase identification is described in USSN 08 / 533,582 ( (October 18, 1995) and Jackson et al. , (1996) Nature Bio technology, 14: 1685-1619.   The above method is mainly based on the 5'-end of the surface-bound probe oligonucleotide or its Identify mismatches in the vicinity, and identify mismatches at or near the 5 'end of the labeled (sample) nucleic acid. Switches are hardly distinguished (see FIG. 13b).   In another embodiment, ligation is used to eliminate mismatches at or near the end of the sample nucleic acid. Can be identified (FIG. 13c). In this case, the probe oligonucleotide is a constant region and And variable regions (eg, variable regions can be considered as shown in FIG. 13c). May include all 8mers). A constant oligonucleotide (constant region or its The sequence is complementary to the constant region and is cross-linked at that position (eg, Covalent bond). Remaining probe oligonucleotide (eg, variable region or its Subsequences and, optionally, subsequences of the constant region) are those to which the nucleic acid sample has hybridized. Form the resulting 5 'overhang. Terminal of sample oligonucleotide or its attachment If there is no nearby mismatch, the ligation will determine the sample oligonucleotide. Always linked to oligonucleotide. Free nucleic acids are washed out and subsequently detected Leave the bound hybridized sample oligonucleotide.   In yet another embodiment, the probe orientation is achieved using a double linkage (shown in FIG. 13d). Can identify mismatches at or near both ends of the gonucleotide and target nucleic acid . In this approach, each of the probe oligonucleotides is linked to VIII (A) Includes constant and variable regions as described. Surface-bound oligonucleotide The probe has a constant sequence complementary to the constant region of the oligonucleotide probe. It is always hybridized to an oligonucleotide. Sample (target) nucleic acid is ligase Contacts the hybrid duplex in the presence of The terminal end between the sample nucleic acid and the variable region In the absence of a match, the ligation will work, resulting in a constant oligonucleotide. Causes ligation of the leotide to the sample nucleic acid (see "Primary Ligation" in FIG. 13d). I Thus, the ligation identifies mismatches at the ends of the sample nucleic acid.   Connect the hybridized duplex to a pool of labeled ligable oligonucleotides. Touch. The ligation probe is overproduced by the hybridized sample nucleic acid. Complementary to the hang, the free end of the variable region of the probe oligonucleotide or If there are no mismatches in the vicinity, secondary ligation will involve labeled ligation-capable probes. (See FIG. 13d). Therefore, the secondary ligation is performed with the probe oligonucleotide Discriminate against mismatches near the free end of the tide. Various hybridases The reaction and the ligation reaction are performed sequentially or simultaneously, and in a preferred embodiment, simultaneously. Will be implemented.   Phosphodiester at the site of single-strand breaks in double-stranded DNA as described above Using any enzyme that catalyzes the formation of a bond, one or Can enhance the discrimination between those with different base pairs. Such a rigger Examples of the enzyme include T4 DNA ligase, ligase isolated from E. coli, and ligases thereof. Ligase isolated from other bacteria and bacteriophages, including It is not limited to them. The ligase concentration depends on the specific ligase used and the concentration of the target. And typically varies from about 50 units / ml to about 5,000, depending on It is in the range of units / ml. In addition, target oligonucleotides: oligonucleotides The time at which the array of probe hybrid complexes contacts the ligase varies. Typically, the ligase treatment is performed for a time ranging from minutes to hours. further, The two ligation reactions are performed sequentially or the target oligonucleotide, Always contains oligonucleotides, a pool of labeled ligable probes and a ligase It is readily apparent to those skilled in the art that Become clear.   In this dual ligation method, the primary ligation reaction generally involves the The 5 'end (i.e., the last 3-4 bases) is the variable region of the oligonucleotide probe Only happens if there is a match. Similarly, secondary ligation to add a label to the probe Generally, the primary ligation reaction is successful and the ligation target is compatible with the 5 'end of the probe. It happens efficiently only when it is complementary. Therefore, this method is compatible with both variable regions. Provides specificity at the ends. In addition, this method reduces the variable probe area used. And probe: useful in increasing target specificity and eliminating the need to label the target. It is profit. This type of dual linking method is described in co-pending USSN 08 / 533,5. 82 (submitted October 18, 1995).   In another embodiment, a nucleic acid complementary to the constant region of the probe oligonucleotide After hybridization with otide, the hybrid duplex formed thereby The chains are then permanently crosslinked to prevent denaturation. Sample nucleic acid thus formed When coupled with a modified overhang, it further permanently attaches to the solid support Is done. In this embodiment, the use of a ligatable oligonucleotide is optimal. The sample nucleic acid is itself labeled, thereby allowing detection of the ligated sample nucleic acid. You.   Methods for crosslinking nucleic acids are well known to those skilled in the art. One such method is purple This includes external exposure, ionizing radiation exposure, and contact with chemical crosslinking reagents. It is not limited to them. In a particularly preferred embodiment, cross-linking uses a chemical cross-linking reagent. None due to the formation of covalent bonds Can be thorny. Preferred cross-linking reagents include bifunctional cross-linking reagents. This is accomplished by chemical or photoactivation of the crosslinking reagent with an acid. The reagent is a hive Although applied after lid duplex formation, in a preferred embodiment, the crosslinker is Prior to re-dialysis, the probe or the complementary nucleic acid (with the constant region) must first be added. It is.   Crosslinking reagent covalently crosslinks tester nucleic acid with hybridized driver nucleic acid Any bifunctional molecule. Generally, the crosslinking reagent is a tester or driver Monovalently added to a nucleic acid and covalently binds to the corresponding hybridized nucleic acid upon photoexcitation This is a bifunctional photoreagent that leaves a secondary photochemically reactive residue. Cross-linking molecules are also chemically Non-light on the probe or tester nucleic acid by a reaction, such as alkylation, condensation or addition Chemically bound and then photochemically bound to the corresponding hybridized nucleic acid It is a mixed chemical and photochemical bifunctional reagent. Catalytic after hybridization Alternatively, bifunctional chemical cross-linking molecules activated by high temperatures or high temperatures may also be used.   Examples of bifunctional photoreagents include fluorocoumarin, benzodipyrone and bisazi Such as bisazide ethidium bromide. Chemical and photochemical bonding Examples of mixed bifunctional reagents having both moieties include haloalkyl fluoro bears. Phosphorus, haloalkylbenzodipyrone, haloalkylcoumarin and various azidonus Creoside triphosphate is mentioned.   Particularly preferred crosslinking agents include linear fluorocoumarin (psoralen), for example, 8 -Methoxysoraline, 5-methoxysoraline and 4,5 ', 8-trimethylsora Phosphorus and the like. Other suitable crosslinking agents include cis-benzodiprone and And trans-benzodipyrone. Commercially known as Sorlon Crosslinking agents are also suitable. A detailed description of the crosslinking of hybridized nucleic acids can be found in WO85 / Please refer to 02628.   The enhanced discrimination method described above, which involves the use of ligation reactions, involves the use of fully complementary hybrids and 1 In all cases where improved discrimination between one or more different base pairs is helpful Can be used. In addition, such methods provide more accurate determination of sequence (eg, neonatal cytology). Sequencing, expression monitoring, mutation monitoring or target nucleic acid It can be used for resequencing (ie, such a method can be used in a second sequencing procedure). Can be used in conjunction with the method to provide a separate demonstration). The target is: oligonucleo Array of Tide Hybrid Complexes Treated with Ligase and Labeled Ligatable Probes Hybridization signal on the high-density oligonucleotide array The purpose of the present invention is to explain a method for improvement, and the present invention is not limited thereto.   B) Ligation to add sequence information   i) Extension of sequence information from single ligation   Using the above ligation reaction, the sequence information obtained for the hybridized Can increase. Each probe oligonucleotide on a high-density oligonucleotide array It is understood that the nucleotide sequence of the nucleotide is known. Specific hive with sample nucleic acid The rehydration is performed when the hybridized sample nucleic acid is used for hybridization. It has a sequence or subsequence complementary to the oligonucleotide. Therefore The hybridization is carried out by the nucleic acid present in the hybridized sample (eg, Sequence information that can be used to identify the gene transcript). Generally, gain The sequence information provided is governed by the length of the probe oligonucleotide. But Therefore, when the probe oligonucleotide is 8 mer, the arrangement of 8 nucleotides Column information is obtained.   However, using the above ligation discrimination reaction to provide additional sequence information I can do it. In this embodiment, all possible linkable oligonucleotides of a given length are Rather than a reotide, the array and sample nucleic acids are located at one or more locations. Nucleotides are hybridizable to a known ligatable oligonucleotide that is known. It is. Thus, hybridization and ligation of labeled oligonucleotides If the hybridization is successful, the hybridized sample nucleic acid It will have nucleotides complementary to the other ligatable oligonucleotides.   Thus, for example, if the probe oligonucleotide is 8mer and specific If a 6-mer ligation probe is used, the resulting hybridisation Provides sequence information with a value of 14 nucleotides.   In this situation, when using different ligatable oligonucleotides, various ligation It is desirable to distinguish between oligonucleotides. This is a concatenation of each different species Achieved by serially linking with possible probes and then reading the array obtain. Alternatively, label the various ligatable oligonucleotides with different detection labels. To allow simultaneous ligation and subsequent detection of various different labels.   ii) To query sequences adjacent to restriction sites in complex (target) sample nucleic acids Use of Commonly Connected Gene Chips   Using a common difference array, fingerprint or pre-determine composite DNA clones The composite pattern of gene expression from the source can be monitored. For fingerprint collection, Sequencing nucleic acid sequences (eg, 8 bp sequences) flanking the constant restriction enzyme sites You.   When collecting fingerprints, the restriction to cut the target at a certain frequency depending on the length of the recognition sequence Enzymes are used. Therefore, restriction digestion is nearly uniform along genomic DNA. Generates nucleic acid fragments that distribute. For example, H A 4-cutter, such as sp92 II, cleaves the target approximately once every few hundred base pairs, Method 6—Cutter, eg, SacI, is labeled once every few thousands (4,000) base pairs. Disconnect the target. When using restriction fragments, the individual fragments are typically -Lapping, average length of several thousand base pairs. 6-Cutter for fingerprint collection -Using restriction enzymes, 2000-3000 fragments x 4000 bases / fragment = 800 10,000 to 12 million base pairs / target can be tested. This is due to the 80 Routinely classify between 100,000 and 12 million base pair targets to determine expression differences, or Expression was monitored (see, eg, FIG. 14c), thereby limiting each restriction of the sample nucleic acid. A characteristic expression "fingerprint" or abundance fingerprint for the digest may be provided. Therefore The fingerprinting method involves quasi-sampling a population of nucleic acids in a substantially uniform and reproducible manner. Profiles and / or abundance differences for target nucleic acids sampled as described above Is provided.   In general, the method includes determining whether the probe oligonucleotide has a constant region and Including providing a high density general difference screening array that encompasses the variable regions No. However, in this case, the last few bases of the constant region (anchor sequence) Is selected to be complementary to the 5 'end of the restriction recognition site (e.g., Fig. 14a and 14b), the complementary anchor sequence is shortened by an appropriate number of bases. Variable territory Regions are randomly selected as described above, selected by accident, and compositionally biased. However, in preferred embodiments, the variable region is of a specific length (eg, All 3mer, all possible 4mer, ... all possible 12mer ), And more preferably all possible 8mer nucleic acids. Have.   A sample nucleic acid is prepared by fragmentation using a restriction enzyme. At the 5 'end Preferred restriction enzymes having only 0, 1 or 2 bases Provides more specificity of ligation (i.e., SacI leaves just 5'C However, Hsp92 II leaves no recognition site base at the 5 'end). However Restriction enzymes that leave more bases at the 5 'end are used. Some restriction yeast Elements can be used simultaneously if they all leave the same recognition base at the 5 'end. You. For example, Aat II, SacI, SphI, HhaI, Bsp1286I , ApaI, KpnI, BanII all leave exactly C at the 5 'end. To form these compatible enzymes. Restriction enzymes and their characteristic recognition / cleavage sites Are well known to traders (eg, Clone Tech catalogue, Clonetech La boratories Inc. , Palo Alto, Ca).   The digestion target is then placed under standard conditions (e.g., in the presence of complement with the constant region). For example, at 30 ° C., o / n, 800 U T4 ligase, T4 ligase buffer) Hybridize and ligate with high density array. Hybridization is a fact Above, classify (define and / or localize) the sample nucleic acid. Sample nucleic acid position Is determined by the sequence of bases adjacent to the restriction site at the 5 'end. Hybridi Zation data can be used directly for expression monitoring methods, as described above, or Alternatively, the method can be performed on one or more sample nucleic acids for general difference screening. You can do it.   In the preferred embodiment, one of two formats is used. Pho In mat I, the linking fragment (eg, sample nucleic acid, optionally complement to constant region) Due to its attachment to complement (through the use of psoralen) (eg, through cross-linking) Fixed in place in the density array. The complementary strand to the fragment is denatured and the diluted base (E.g., 1N NaOH) is washed off the array. Next, these frames The bridge fragment is the first hybridisation with one or more nucleic acid samples. Used as a probe in a solution. Next, the same array or a separate array Hybridization between different nucleic acids hybridized occasionally or sequentially By comparing patterns, differential nucleic acid abundance (eg, differential gene expression) Can be monitored.   In the second format (Format II), especially when the sample nucleic acid is deoxynucleic acid If a sample, the DNA is restriction digested as described above, and then Hybridization / ligation directly. The site where the intensity difference occurs The difference in abundance is shown. The arrangement obtained from the positions of the probe and recognition site sequences in the array By designing primers specific to the nucleic acid based on the column information, An abundant (eg, differentially expressed) nucleic acid is cloned. 8mer ( For the variable region) and the 6 base restriction enzyme, this would include the 14mer primer sequence. Occurs. For short genomes, clones were isolated using 14mer primers. obtain. Long genomes require primer probes (variable regions) longer than 8 mer Because it increases, it becomes easier to handle.   Restriction enzyme digested sample nucleic acids are preferably obtained by fingerprinting and format I At I, it is labeled and linked to the high density array (see above and FIG. 14d). Four In the case of the Matt I assay, the ligated target sequence is preferably not labeled, but instead Hybridization in the second hybridization with a high-density array of labeled sample nucleic acids Serves as a redidation probe.   Do not ligate sites that have not been cleaved by a given restriction enzyme to the high-density array Sample nuclei prior to restriction digestion with alkaline phosphatase to ensure Treat the acid.   iii) Analysis of differentially displayed fragments on the general difference array   The principle that supports differential labeling is to use anchor primers of the following formula: Set of random primers from a population of primary strand cDNA transcribed from RNA To generate an amplified (eg, PCR) fragment:   (T)nVA, (T)nVG, (T)nVC and (T)nVT Wherein V is A, G or C, and n ranges from about 6 to about 30, preferably from about 8 to It is in the range of about 20, more preferably about 10 to about 16, with n = 14 being most preferred. New). Depending on which random and anchor primers are selected Different sets of cDNA transcripts are represented in a particular set of nucleic acid fragments. These amplified fragments Is the general screen to which they hybridize based on the sequence at the 5 'end of the fragment. Analyzed by classifying the fragments on the leaning oligonucleotide array You.   The method is illustrated in FIGS. Anchor according to standard law Reverse transcription of poly (A) mRNA using a modified poly (t) primer DNA is synthesized (FIG. 16a). The primary stranded DNA has an engineering restriction site and a 3 'end. An upstream ply containing one or more degenerate bases at the ends (N = A, C, G, T) The mer is used to act as a template for amplification (eg, by PCR). Next In addition, upstream primers, anchor primers and random primers (eg, Car primer (T)14VA, (T)14VG, (T)14VC, (T)14VT, and And random primers such as a SacI site: 5'-CATGAGCTCNN). To perform a random primer-treated PCR. The resulting amplified fragment is Digest with restriction endonucleases corresponding to the engineered restriction sites. As a result raw The same sample nucleic acid is then hybridized to a general difference screening array as described above. Soy.   The method is preferably performed on two or more nucleic acid samples, whereby Enables use of the general difference screening method of the present invention Become. In one embodiment, the probe oligonucleotide, if present, is It includes constant sites that are complementary to the remaining restriction sites on the nucleic acid. The rest of the analysis is Proceed in the same way.   The method can simultaneously analyze even thousands or more "bands" (nucleic acids) . In addition, sequence information is provided for differentially abundant nucleic acids. For example, cutting If is with SacI, a 9 base tail (CATGAGCTC) is provided, The array is a variable region encompassing the complementary 9 base constant region and all possible 9 mer And probe oligonucleotides having a region. This is for each hybrid Provides 17 nucleotides of sequence information about the solution (9 mer constant +8 m er variable).   iv) Extraction of additional sequence information from restriction selection nucleic acid hybridization Use of concatenation   Use ligation in combination with restriction digestion to quasi-sample nucleic acids at nearly uniform intervals At the same time, additional sequence information can be provided using a ligation reaction. In this embodiment, the A nucleus whose lobe oligonucleotide is complementary to the sense or antisense strand of the restriction site. A high-density array containing an acid sequence is provided (see, eg, FIG. 14). Sample nucleic acid Is digested randomly with DNase or specifically with restriction endonucleases ( For example, Sau3A). Next, hybridize with the digested oligonucleotide high-density array. To Only nucleic acids with termini complementary to the constant region are Join. Therefore, restriction fragments are preferentially selected.   The array can also be of a specific length (eg, 6 mer) in the presence of ligase Use a pool of ligatable oligonucleotides that includes all oligonucleotides To produce complementary ligatable oligonucleotides. Oligonucleotide Connect to the end. This increases in length by the length of the ligatable oligonucleotide. A probe oligonucleotide complementary to a nucleic acid known to be present in a nucleic acid sample Cause   Next, the DNA is removed from the array and the nucleic acid as described above is Perform a general difference screening of the samples. Differentially expressed in various samples If a probe corresponding to the nucleic acid is identified, the sample can be identified using a known probe sequence. Nucleic acids that are differentially expressed in can be identified.   In one embodiment, this is a constant region plus a known variable region and additional nucleotides. Generates four primer oligonucleotides containing (A, G, C or T) at one end By doing so. Next, digest the genomic clone with secondary restriction enzymes. And ligate with the adapter sequence. 4-primer oligonucleotide and adapter -Using the sequence as a primer, the genomic sequence is amplified from the genomic clone ( For example, using PCR). Next, cDNA amplification was performed using the PCR amplification sequence. Probe the library (eg, with a Southern blot) to obtain the entire cDNA of interest. obtain.   For example, in one embodiment, a 10-mer high-density array has a 10-mer array. Gonucleotides (ie, 4Ten= 1048576 nucleic acids) , And at the start of each oligonucleotide, the first four bases are the recognition sites for the restriction enzyme. A constant sequence (e.g., 3'-T) that is complementary to a sequence (e.g., Sau3A + 1 base T). AGT-5 ').   Large genomic clones or simplified cDNA libraries (eg, total mRNA CDNA libraries containing only 5 'or 3' ends), e.g. Complete digestion with the Butter enzyme (indicated herein by Sau3A) 5 'overhang sequence ( For Sau3A, the overhang is GATC) Is generated. Recognition sites exist about every 500 bp.   Concept of ligable oligonucleotide having a DNA fragment of a specific length (for example, 6 mer) Use a 10mer chip in all combinations obtained and in the presence of T4 DNA ligase When hybridized, the linkable oligonucleotide is a probe oligonucleotide. Linked on nucleotides.   Next, the DNA is removed from the chip and the general difference screen for nucleic acid samples is Perform leaning. This is because nucleic acids present at different levels in the test Allows for the identification of probe oligonucleotides that hybridize.   This example from the probe in the array (5mer constant region base + 10mer) Add one base (A, G, C or T) to the end based on the 14 bp sequence This produces four 16 base primers. These primers and The genomic sequence can be amplified using the adapter sequence as a primer. Next increase Using the width sequence to probe the cDNA library, Obtain cDNA. IX. Signal evaluation   A) Signal evaluation for expression monitoring   The method of evaluating the hybridization results is based on the specific probe nucleic acid used and Those skilled in the art will understand that they will vary with the nature of the controls provided. Simplest implementation In this embodiment, a simple quantification of the fluorescence intensity of each probe is established. This is a high density array Measure the probe signal intensity at each position on the (Eg, where the label is a fluorescent label, (A) detecting the amount (intensity) of fluorescence generated by fixed excitation illumination at each position on (a). "Test The absolute intensity of the array that hybridizes with nucleic acids from the "" sample and the "control" sample Comparison with the resulting intensity indicates the relative presence of nucleic acids that hybridize to each probe. Provides a measure of quantity.   However, the hybridization signal The intensity varies with the efficiency of the sample, the amount of label on the sample nucleic acid, and the amount of a particular nucleic acid in the sample. Those skilled in the art will understand. Typically, at very low levels (eg, <1 pM) The nucleic acids present show a very weak signal. At some low levels, Gunnar becomes virtually indistinguishable from the background. Hybridization When evaluating data, the threshold intensity value is essentially distinct from the background. Since there is no signal, the signal is chosen lower than the uncounted value.   If you want to detect nucleic acids expressed at lower levels, a lower threshold is chosen . Conversely, if only high expression levels are evaluated, a higher threshold level is selected Is done. In a preferred embodiment, the appropriate threshold is less than the average background signal. It is about 10% higher.   In addition, if appropriate controls are prepared, hybridization conditions, cell health More detailed analysis to control mutations such as non-specific binding is obtained. So the example For example, in a preferred embodiment, a normalized control as described above for IV (A) (2) is used. And hybridization An array is provided. These normalization controls correspond to those added to the sample at known concentrations. A probe complementary to the control sequence. Insufficient overall hybridization conditions In some cases, a normalization control may have a smaller signal to reflect reduced hybridization. Show Conversely, if hybridization conditions are good, the normalization control Provides a higher signal reflecting the improved hybridization. Accordingly To correct the signal obtained from other probes in the array relative to the normalization control. Normalization is sensitive to variations in array synthesis or hybridization conditions. To provide control. Typically, measurement signals from other probes in the array Normalization is achieved by dividing the nulls by the average signal generated by the normalization control. I can do it. Normalization further includes correction for variations due to sample preparation and amplification. Such normalization involves converting the signal measurements into sample preparation / amplification control probes (eg, By dividing by the average signal from the BioB probe). The result Multiply the resulting value by a constant value to get the result.   As noted above, high-density arrays provide a mismatch control or generic difference screen. In the case of a training array, one or more preselected nucleotides are different. It can include a pair of consecutive oligonucleotide probes. Preferred expression monitoring Ray has a central miss for all probes in the array (except for the normalization control). There is a match. After washing under stringent conditions, complete to hybridize with probe If a match is expected but no mismatch is expected, then the system from the mismatch control Signals are mainly due to non-specific binding or non-specific binding in the sample of nucleic acids that hybridize to the mismatch. Is expected to reflect existence. For expression monitoring analysis, probe the problem And the corresponding mismatch control both show a high signal, or the mismatch is Its corresponding If the signal is higher than the test probes, signal from those probes Are preferably ignored. Target-specific probes and their corresponding mismatch controls The difference in hybridization signal intensity between Another measurement. Thus, in a preferred embodiment, the mismatch probe Subtracting the signal from the signal from its corresponding test probe yields the test probe Measurement of the signal due to the specific binding of Similarly, as shown below, In target difference screening, the difference between probe pairs is calculated.   Next, the signal intensity of each probe that specifically binds to the nucleic acid is measured, By normalizing to a normalization control, specific sequence field concentrations can be determined. Step If the signal from the lobe is larger than the mismatch, the mismatch is subtracted . Ignore signal if mismatch strength is greater than or equal to its corresponding test probe Is done. Next, the number of positive signals (absolute or higher threshold), Intensity (absolute or higher selection threshold) or a combination of both metrics (eg, (Meaning average), the expression level of a specific gene can be scored.   Normalization controls often require useful quantification of hybridization signals Not doing so is a surprising finding of the present invention. Therefore, IV (B) (i i) As described above in section (a), the optimal probe was identified by two step selection methods. Average hybridization signal generated by the selected optimal probe Provides good quantitation of the concentration of hybridized nucleic acid.   B) Signal evaluation for generic difference screening   Generic difference screening in essentially the same manner as expression monitoring described above Perform signal evaluation on However, Data is evaluated per probe rather than per gene.   In a preferred embodiment, for each probe oligonucleotide, The signal intensity difference between pairs (K) members is calculated as follows:         Xijk1-Xijk2 (Where X is the hybridization intensity of the probe and i is J (in this case, sample 1 or 2), j indicates the replication for each sample (each nucleic acid For Example 7, where there are two replicates for the sample, j is 1 or 2), and K is The number of probe pair IDs (1... 34, 320 in the case of the seventh embodiment), where 1 is Probe member, while 2 indicates the other member of the probe pair).   The difference between the signal intensities for each probe pair between replicates for each material is then calculated. Put out. Thus, for each probe, for example, sample 1 (eg, a normal cell line) Between Replication 1 and Replication 2 of Sample 2 and between Replication 1 and Replication 2 of Sample 2 (eg, tumor cell line) Is calculated for k-1 to total number of probes as follows:       (X11k1-X11k2)-(X12k1-X12k2)   Replicas are normalized to each other for all probe pairs as follows (ie, positive After normalization, the average ratio is about 1):   Regarding sample 1, (X11k1-X11k2) / (X12k1-X12k2)   Regarding sample 2, (X21k1-X21k2)-(X22k1-X22k2)   Finally, the difference between Sample 1 and Sample 2 averaged over the two replicates is calculated. this The values, after normalization between the two samples, are:   ((X21k1+ X22k2) / 2)-((X11k1+ X12k2) / 2) , Which is based on the average ratio of   [(X21k1+ X22k2) / 2] / [(X11k1+ X12k2) / 2] This data is plotted as a function of probe number (ID), Probes with differentially hybridized nucleic acids can be easily identified (eg, 16c).   However, the data is filtered to reduce the background signal. In this case, after normalization between replicates (above), calculate the ratio as follows:   (X11k1-X11k2) / (X12k1-X12k2) Is greater than 1,   Ratio = (X11k1-X11k2) / (X12k1-X12k2)otherwise,   Ratio = (X12k1-X12k2) / (X11k1-X11k2) (Reverse)   The ratio of replicates 1 and 2 of sample 2 for each oligonucleotide pair difference was similar. , But based on the following absolute values:   (X21k1-X21k2) / (X22k1-X22k2)as well as   (X22k1-X22k2) / (X21k1-X21k2).   Finally, as described above, two replicates were performed on each oligonucleotide pair for differences. The ratio of the averaged sample 1 to sample 2 after normalization in the same manner as described above is different from that in FIG. Similarly, but calculated on the basis of the following absolute values:   [(X21k1+ X22k2) / 2] / [(X11k1+ X12k2) / 2] and   [(X11k1+ X12k2) / 2] / [(X21k1+ X22k2) / 2].   Oligonucleotides that exhibit maximum differential hybridization between two samples Pairs are confirmed by classifying the observed hybridization ratios and difference values. I can see. Oligonucleotides showing the largest change (increase or decrease) are plotted as (See, for example, FIG. 17c). X. Identification of genes whose expression changes   As described above, probe oligonucleotides encompassing high density arrays The nucleotide sequence of the tide is known. Of the probe showing the largest hybridization difference Using sequences (and families of such differences), comparisons can be made by any of a number of means. Differentially expressed genes in the sample can be identified.   Thus, for example, using the sequence of a differentially hybridized probe, Database (eg, BLAST of fragments against all known sequences). Or by relevant scrutiny). Alternatively, use a family of probes that vary by a similar amount. Some sequence reconstructions can also be achieved. Complementary (or nearly Database scrutiny of known genes containing complementary sequences is not difficult. Confirm differentially expressed sequences, as it is generally easier than sequence reconstruction Is a preferred method.   In another embodiment, the differential hybridization pattern is between test samples. Indicates that there is a significant difference in the overall expression profile (s), To identify probes specific to the differences. These probes differ from the sample It can be used as a specific affinity reagent to extract the moiety. This is for some people Can be accomplished by law:   In one approach, those that hybridize with the probe that shows the largest difference between samples Quality is microextracted from the high density array. For example, a hybridized nucleic acid Removed using a small capillary. Alternatively, use a photolabile linker on the chip The immobilized probe is released by selective irradiation on the desired part of the high-density array. It is.   In another approach, the sequences of all probes on a high-density array are known The latter, since differentially hybridizing probes have been identified. Differentially hybridizes in test sample using probe as affinity reagent Nucleic acids can be extracted. Once shown Once the differentially hybridizing probe is identified in the array, the probe (single or multiple) Can be synthesized on beads (or other support) and hybridized with the sample (For this step, it is not necessarily fragmented-full length clone is desirable) . The material to be extracted is cloned and / or cloned according to methods known to those skilled in the art. Or sequencing to obtain the desired information about the differentially expressed species (eg, Screen clones with labeled oligonucleotides for proper insertion Confirm it with the object and / or randomly select and sequence).   Yet another approach is to augment using the sequence of the hybridization probe. Generate width primers (eg, reverse transcription and / or PCR primers). Next, the differentially expressed sequence was amplified and used as a probe to reverse transcriptase as described above. Specific sequences added during the cDNA process (eg, poly A-based primers) Or additional 3 ‘sequence) in combination with a sequence-specific primer determined from the array. Use to probe a genomic or cDNA library. Proper cloning and To train skilled workers through sequencing techniques and numerous cloning exercises. Full instructions for use are given below: Berger and Kimmel, Guide to Mo lecular Cloning Techniques, Methods in Enzymology volume 152 Academic Pr ess, Inc., San Diego, CA; Sambrook et al., (1989) Molecular Cloning-A Lab oratory Manual (2nd ed.) Vol. 1-3; and Current Protocols in Molecular Biolo gy, F.M. Ausubel et al., eds., Current Protocols, a join tventure between  Greene Publishing Associates, Inc. and John Wiley & Sons, Inc., (1994 S upplement) (Ausubel). Product information from manufacturers of biological reagents and laboratory equipment is also publicly available. Provides useful information for biological methods of knowledge. As such a manufacturer And the following companies: SIGMA chemical company (Saint Louis, MO), R & D s ystems (Minneapolis, MN), Pharmacia LKB Biotechnology (Piscataway, NJ), CL ONTECH Laboratories, Inc., (Palo Alto, CA), Chem Genes Corp. , Aldrich C chemical Company (Milwaukee, WI), Glen Research, Inc., GIBCO BRL Life Tech nologies, Inc. (Gaithersberg, MD), Fluka Chemica-Biochemika Anslytika (Fl uka Chemie AG, Buchs, Switzerland), Invitrogen, San Diego, CA and Applied.  Sources known to Biosystems (Foster City, CA), as well as many other skilled practitioners.   In short, it is important to know which genes to monitor using the above method. With no prior assumptions and no prior knowledge of the sequence, The gene can be identified. Once identified (and must be previously sequenced) If the gene is sequenced), co-pending application 08 / 529,115. (Submitted September 15, 1995) and PCT / US96 / 14839 High density designed to detect and quantify specific genes in the same way Novel sequences may be included in the array. Therefore, the two approaches are complementary One is to probe extensively for differences in the expression of possibly unknown genes. Or the gene selected as important or at least partially Used to more specifically monitor pre-sequenced genes You. XI. Kits for expression monitoring and generic difference screening   In another embodiment, the invention provides expression monitoring and / or generic difference screening. Provide a kit for leaning. As a kit, one or more of the present invention High-density oligonucleotide array But not limited to, one or more containers containing Generic Preferred kits for differential screening include at least two high density Array included. The kit may further be used to label one or more nucleic acid samples. One or more labels. In addition, the kit may include one or more ligatures. Includes possible oligonucleotides. In some embodiments, the kit comprises different ligations Pool of possible oligonucleotides, preferably all possible oligonucleotides of a particular length Pool of nucleotides (eg all possible 6-mers) or specific ligation A set of functional oligonucleotides. Kit can be used with any other variety Agents, labels, utensils (eg, trays, microscope filters, syringes, etc.), buffers, To perform the hybridization and ligation reactions described herein. Those skilled in the art will understand that they include useful ones. Further, kits are described herein. Selection of the described probes and / or analysis of the hybridization data Software that is provided on a recording medium (eg, optical or magnetic disk). No. In addition, kits can be used with various methods of the invention (eg, the species described herein). Use of the kit in various expression monitoring or generic difference screening procedures). Contains instructional materials that teach how to use. XII. Computer execution expression monitoring   The method for monitoring gene expression of the present invention is performed using a computer. . Computers typically run hybridizations from substrates or chips. Analysis of the intensity of the gene and thus monitoring the expression of one or more genes. For incorporating nucleic acids or screening for differences in nucleic acid abundance. Execute a software program containing pewter code. The present invention is described below. Are described for illustrative purposes only, and The invention is not limited to them.   FIG. 6 shows the components used to execute the software of the embodiment of the present invention. 1 shows an example of a computer system. As shown in the figure, the computer system 1 00 is a monitor 102, a screen 104, a cabinet 106, a keyboard 108 and a mouse 110. The mouse 110 has one or more buttons, For example, it has a mouse button 112. Cabinet 106 implements the present invention Software program incorporating computer code, along with the present invention CD-ROM drive used for storing and retrieving data etc. Live, 114, system memory and hard drive (both shown in FIG. 7) To accommodate. CD-ROM 116 is an exemplary computer readable storage medium. Is shown as a floppy disk, tape, flash memory, Other computer readable storage, including system memory and hard drive A medium may also be used. Cabinet 106 further includes well-known computer structures. Component parts (not shown), such as central processing unit, system memory, hard disk Etc. are accommodated.   FIG. 7 shows the components used to execute the software of the embodiment of the present invention. 1 shows a system block diagram of a computer system 100. FIG. As in FIG. The monitor system 100 includes a monitor 102 and a keyboard 108. Con The computer system 100 further includes subsystems, such as a central processing unit 120. , System memory 122, I / O controller 124, display adapter 126, removable disk 128 (eg, CD-ROM drive), fixed Disk 130 (for example, hard disk), network interface 13 2 and a speaker 134. Other computers suitable for use with the present invention Motor system is an additional Or it may contain fewer subsystems. For example, another computer system The system may have more than one processor 120 (ie, a multiprocessor system) or cache. It may contain shremearm.   Arrows such as 136 indicate the system bus architecture of the computer system 100. Represents a texture. However, these arrows only connect the subsystems. Describe any interconnection mechanisms that are useful for For example, local buses Used to connect the processor and system memory and display adapter It is. The computer system 100 shown in FIG. It is just one example of a suitable computer system. Suitable for use with the present invention Other configurations of the subsystem will be readily apparent to those skilled in the art.   FIG. 8 is a flowchart of a process of monitoring gene expression. Main construction The process is preferably a perfect match and mix that is covalently attached to the surface of the substrate or chip. The hybridization intensities of the pairs of match probes are compared. Most preferred Means that nucleic acid probes are about 60 or more different nucleic acid probes per cm 2 of substrate. It has a high density. The flowchart is a sequence of steps for clarity. It does not indicate that the steps must be performed in any particular order. The present invention Many processes can be reordered, combined and deleted without deviating from Those of ordinary skill in the art will readily recognize.   First, a nucleic acid probe complementary to the target sequence (or gene) is selected. this These probes are perfect match probes. Not perfectly complementary to the target sequence Another set of intended probes is identified. These probes are mismatched In the lobe, each mismatch probe has a perfect match probe and at least one The nucleotides contain different mismatches. Therefore, the misma from which it was obtained The match probe and the perfect match probe form a pair of probes. Said above Thus, the nucleotide mismatch is preferably located near the center of the mismatch probe. Exists.   The probe length of a perfect match probe is typically highly hybridized with the target sequence. Are selected to show affinities. For example, nucleic acid probes are all 20 m er. However, variable length probes are not It can be synthesized on a substrate for any number of reasons.   The target sequence is typically fragmented, labeled and the nucleic acid probe Exposed to a substrate that includes Next, the hybridization intensity of the nucleic acid probe Is measured and input to the computer system. The computer system Is the same system that directs plate hybridization, or it is completely different System. Of course, any computer for use with the present invention The system can be used for gene name, gene sequence, probe sequence, probe on substrate It should have other available details of the experiment, including location etc.   Referring to FIG. 8, after hybridization, the computer system Hybridization of multiple pairs of perfect match and mismatch probes in step 202 Receives the input of the intensity. Hybridization strength depends on the nucleic acid probe and target Shows the hybridization affinity between nucleic acids (corresponding to genes). Each pair is A perfect match probe completely complementary to a portion of the target nucleic acid, and at least one Include mismatch probes that differ from perfect match probes by nucleotides.   In step 204, the computer system checks each pair for an exact match and a mismatch match. Compare the hybridization intensity of the lobes. Remains If the gene is expressed, the hybridization intensity of the pair of perfectly matched probes (Or affinity) must be high enough to be recognized by the corresponding mismatched probe is there. Generally, the hybridization intensities of probe pairs are substantially identical. If it does, it indicates that the gene is not expressed. However, confirmation is not It is not based on a single pair of lobes, and the determination of whether a gene is Based on the analysis of the probe. The hybridization intensity of the probe pair Exemplary steps for comparison are described in more detail in connection with FIG.   Hybridization strength of perfect match and mismatch probe , The system indicates the expression of the gene at step 206. For example, a gene Being present (expressed), marginal or absent (not expressed) The system shows to the user.   FIG. 9 uses a decision matrix to determine whether a gene is expressed. 2 shows a flowchart of the process. In step 252, the computer system: Receive raw scan data of N pairs of perfect match and mismatch probes. preferable In embodiments, the hybridization intensity is determined by hybridization with the probe on the substrate. 5 is a photon count from a labeled fluorescein-labeled target. To make it easier to understand First, the hybridization intensity of the perfect match probe was set to "IpmAnd mistake The hybridization intensity of the match probemm".   The hybridization intensity of the pair of probes is searched in step 254. Engineering At about 256, the background signal intensity is compared to the paired hybridization intensity. Subtract from each. Background subtraction is also performed on all raw scan data simultaneously. Can also be implemented.   In step 258, the hybridization intensity of the probe pair And a ratio threshold (R). The difference between the paired hybridization intensities (Ipm-Imm ) Is greater than or equal to the difference threshold, and the quotient (Ipm / Imm) Is greater than or equal to the ratio threshold. The difference threshold is typically singular or Is user-defined to ensure accurate expression monitoring of multiple genes Value. In one embodiment, the difference threshold is 20, and the ratio threshold is 1.2.   Ipm-Imm> = D and Ipm/ ImmIf> = R, the NPOS value is determined in step 260 Is increased by In general, NPOS is a sign that a gene is likely to be expressed. It is a value indicating the number of pairs of probes having hybridization intensity. NPOS Is used to determine gene expression.   In step 262, Imm-Ipm> = D and Imm/ IpmDetermine if> = R You. If this expression is correct, the NNEG value is increased at step 264. generally, NNEG is a hybridization strength that indicates that the gene is unlikely to be expressed. This is a value indicating the number of pairs of probes having degrees. NNEG, like NPOS, Used to determine gene expression.   Hybridization strength indicating that the gene is expressed or not expressed For each pair indicating degree, the log ratio (LR) and intensity difference value (IDIF) are determined at step 266. Is calculated by LR is the quotient of paired hybridization intensities (Ipm/ Imm) Pair Calculated by number. IDIF is the difference in hybridization intensity of pairs (Ipm -Imm). The next pair of hybridization intensities at step 268 If there are, they are retrieved at step 254.   In step 272, the gene is expressed using a decision matrix. Indicates whether or not to The decision matrix is N, NPOS, NNEG and L R (Multiple LR) values are used. Perform the following four substitutions:   P1 = NPOS / NNEG   P2 = NPOS / N   P3 = (10 * SUM (LR)) / (NPOS + NNEG) These P values are then used to determine whether the gene is expressed.   For purposes of explanation, P values are grouped into ranges. When P1 is 2.1 or more, A is appropriate. When P1 is less than 2.1 or 1.8 or more, B is appropriate. is there. Otherwise, C is correct. Therefore, P1 has three ranges A, B And C. This is done to make it easier for the reader to understand the invention. .   Therefore, all P values fall into the following ranges:   A = (P1> = 2.1)   B = (2.1> P1> = 1.8)   C = (P1 <1.8)   X = (P2> = 0.35)   Y = (0.35> P2> = 0.20)   Z = (P2 <0.20)   Q = (P3> = 1.5)   R = (1.5> P3> = 1.1)   S = (P3 <1.1) Once the P-values fall into the above Boolean range, gene expression is determined .   Gene expression is indicated as present (expression), threshold, or absent (non-expression) . If the following gene expression is appropriate, the gene is Indicated to be expressed: A and (X or Y) and (Q or R). In other words, P If 1> = 2.1, P2> = 0.20 and P3> = 1.1, the gene is expressed Is indicated. In addition, a gene is considered to be expressed if the following expression is appropriate: Done: B and X and Q.   For the foregoing description, a summary of the gene expression indicators is provided below:   Presence A and (X or Y) and (Q or R)                 B and X and I   Limit values A and X and S                 B and X and R                 B and Y and (Q or R)   Absent in all other cases (eg, any combination of C)   Upon output to the user, in step 274, the presence is "P" and the limit is "M". Absence is indicated as "A".   Once all probe pairs have been processed, indicating expression of the gene, at step 275, 1 The average of zero LR is computed. In addition, NPOS and NNEG The average of the IDIF values for the probe with increased is calculated. These values are It can be used for quantitative comparison of experiments with other experiments.   The quantitative measurement is performed at step 276. For example, the latest experiment is a past experiment (for example, (For example, the value calculated in step 270). In addition, experiments can be performed on biological Intensity of RNA (eg, from bacteria) present in the target sample Is compared to In this way, the accuracy of the gene expression index or call is established, and the threshold is set. The modifications may be made or any number of the modifications described above may be performed.   For clarity, FIG. 9 has been described for a single gene. However The method is useful for large numbers of genes in biological samples. Can be used. Therefore, any consideration of single gene analysis suggests that the method It does not necessarily indicate that it cannot be extended to process the child.   10A and 10B compare baseline scan data and experimental scan data. This shows the flow of a method for determining the expression of a gene. For example, the baseline run The surveillance data is from a biological sample in which the gene is known to be expressed. Therefore, comparing this scan data to different biological samples, the gene expression Determine whether or not it will be Furthermore, it is important that the expression of one or more genes be To determine how it changes over time.   At step 302, the computer system maps N pairs of complete maps from the baseline. And raw scan data of the mismatch probe. Complete from baseline The hybridization intensity of the match probepm" The hybridization intensity of the mismatched probemm". Process At 304, the background signal intensity is raised to the high of the pair of baseline scan data. Subtract from each of the hybridization intensities.   At step 306, the computer system completes the N pairs from the experimental biological sample. Receive raw scan data for match and mismatch probes. Complete map from experiment The hybridization intensity of the probepm" The hybridization intensity of the probemm". At step 308, The background signal intensity is determined by the hybridization intensity of the pair of experimental scan data. Subtract from each of the degrees.   Hybridization of the I and J pairs is normalized at step 310. For example , IV (A), as discussed in section IV, hybridization intensity of I and J pairs At the hybridization intensity of the control Divide.   In step 312, the hybridization intensity of the I and J paired probes is Value (DDIF) and the ratio threshold (RDIF). A pair (Jpm−Jmm) And others Pair (Ipm-Imm) Is greater than or equal to the difference threshold Or some pair (Jpm−Jmm) And another pair (Ipm-Imm) Hybridization It is determined whether the quotient of the solution strengths is greater than or equal to the ratio threshold. The difference threshold is typically Users determined to produce accurate expression monitoring of several or multiple genes This is a defined value.   (Jpm−Jmm)-(Ipm-Imm)> = DDIF and (Jpm−Jmm) / (Ipm− ImmIf)> = RDIF, the NINC value is increased in step 314. generally , NINC may have gene expression greater (or increased) than the baseline sample This is a value that indicates what the experimental pair of probes that do indicates. NINC is , Gene expression is greater (or increased) in experimental samples compared to baseline samples It is used to determine whether it is small, small (or reduced) or unchanged.   In step 316, (Jpm−Jmm)-(Ipm-Imm)> = DDIF and (Jpm−Jmm ) / (Ipm-Imm)> = RDIF. This expression is appropriate In some cases, the NDEC value is increased. In general, NDEC is based on gene expression. An experimental pair of probes that show less (or less) Value. NDEC is an experimental method in which gene expression is compared to baseline samples. The charge was large (or increased), small (or reduced), or unchanged It is used to determine whether   Hybridization showing that the gene is expressed more or less than the experimental sample NPOS, NNEG for each pair showing the And LR values are calculated for each pair of probes. These values are above for FIG. It is calculated in the same way as discussed above. The subscript “B” or “E” indicates that the value Added to each value to indicate whether it represents a baseline or experimental sample, respectively did. If there is a next pair of hybridization intensities at step 322, Are processed in the same manner as illustrated.   Referring now to FIG. 10B, the absolute decision calculation is performed at step 324 with the baseline. Performed on both in- and experimental samples. Absolute decision calculations are based In each of the sample and the experimental sample, the gene is expressed, It is an index of how. Thus, in a preferred embodiment, this step is performed for each of the samples. For each, the steps 272 and 274 from FIG. 9 need to be performed. While this is running, There is an indication of gene expression for each of the samples obtained independently.   At step 326, the gene expression between the two samples is determined using a decision matrix. Determine differences. This decision matrix is calculated by the N, NPO calculated above. SB, NPOSE, NNEGB, NNEGE, NINC, NDEC, LRB and Use the LRE value. The decision matrix is such that NINC is greater than NDEC Different calculations are performed depending on whether or not. The calculation is shown below.   If NINC> = NDEC, the following four P values are determined:   P1 = NINC / NDEC   P2 = NINC / N   P3 = ((NPOSE-NPOSB)-(NNEGE-NNEGB)) / N   P4 = 10 * SUM (LRE-LRB) / N These P values are then used to determine the difference in gene expression between the two samples. Set.   For purposes of explanation, P values are categorized into ranges, as was done above. But Thus, all P values fall into ranges according to:   A = (P1> = 2.7)   B = (2.7> P1> = 1.8)   C = (P1 <1.8)   X = (P2> = 0.24)   Y = (0.24> P2> = 0.16)   Z = (P2 <0.160)   M = (P3> = 0.17)   N = (0.17> P3> = 0.10)   O = (P3 <0.10)   Q = (P4> = 1.3)   R = (1.3> P4> = 0.9)   S = (P4 <0.9) Once the P-values fall into the Boolean range above, the gene expression between the two samples The current difference is determined.   If NINC> = NDEC, the gene expression change is increased, marginal increased or Shown as unchanged. A summary of the gene expression indicators is provided below: A and (X or Y) and (Q or R) and (M or N or O)       A and (X or Y) and (Q or R or S) and (M or N)       B and (X or Y) and (Q or R) and (M or N)       A and X and (Q or R or S) and (M or N or O) Marginal A or Y or S or O Increase B and (X or Y) and (Q or R) and O           B and (X or Y) and S and (M or N)           C and (X or Y) and (Q or R) and (M or N) No change All other cases (eg any Z combination)   On output to user, increase is "I", marginal increase is "MI" and change None is indicated as "NC".   When NINC <NDEC, the following four P values are determined.   P1 = NDEC / NINC   P2 = NDEC / N   P3 = ((NNEGE−NNEGB) − (NPOSE−NPOSB)) / N   P4 = 10 * SUM (LRE-LRB) / N These P values are then used to determine the difference in gene expression between the two samples.   P values fall into the same range as in other cases where NINC> = NDEC. I Thus, the P values in this case indicate the same range and are not repeated for brevity . However, the range generally depends on the gene between the two samples as shown below. Shows different changes in expression.   If NINC <NDEC, the change in gene expression is reduced, marginally reduced or altered. Indicated as unmodified. A summary of the gene expression indicators is provided below: Reduction A and (X or Y) and (Q or R) and (M or N or O)       A and (X or Y) and (Q or R or S) and (M or N)       B and (X or Y) and (Q or R) and (M or N)       A and X and (Q or R or S) and (M or N or O) Marginal A or Y or S or O Reduction B and (X or Y) and (Q or R) and O           B and (X or Y) and S and (M or N)           C and (X or Y) and (Q or R) and (M or N) No change All other cases (eg any Z combination)   For output to the user, reduction is "D", marginal increase is "MD" and change None is indicated as "NC".   The above establishes the relative differences between gene expression between the baseline and experimental samples It was shown that it could be. The gene is shown to be expressed in both samples (eg, 324), if the following expression is appropriate, I, MI, D or MD (ie, (No NC) Another test that changes the call to NC may be performed:   Average (IDIFB)> = 200   Average (IDIFE)> = 200   1.4> = average (IDIFE) / average (IDIFB)> = 0.7 Therefore, if the gene is expressed in both samples, it will increase or decrease (whether marginal or not) ) Is called when the average intensity difference for each sample is relatively large or If they are the same, then they are changed to unchanged calls. IDIFB and ID IFE is calculated by dividing the sum of all IDIFs for each sample by N.   At step 328, a value for the quantitative difference evaluation is calculated. For each of the pairs ( (Jpm−Jmm)-(Ipm-Imm)). Furthermore, Jpm−JmmThe average of and Ipm -ImmCalculate the average quotient of. These values are used to compare the results with other experiments in step 330. Used for comparison. Example   The following examples further illustrate the invention, but the invention is not limited thereto.Embodiment 1 FIG. To measure mRNA levels for a small number of murine cytokines First-generation oligonucleotide arrays designed   A) Preparation of labeled RNA   1) From each of the preselected genes   14 genes (IL-2, IL-3, Il-4, IL-6, I1-10, I L-12p40, GM-CSF, IFN-γ, TNF-α, CTLA8, β-A Cutin, GAPDH, IL-11 receptor and (BioB) were each pBluesc Rip II KS (+) phagemid (Stratagene, LaJolla, California) , USA). The orientation of the insert was determined by T3 RNA polymerase. Transcripts and T7 polymerase was made to produce antisense.   Labeled ribonucleotides in an in vitro transcription (IVT) reaction. Biotin-or Fluorescein labeled UTP and CTP (1: 3 labeled: unlabeled) + unlabeled A TP and GTP were replaced with T7 RNA polymerase (Epicentre Technologies, Madiso n, Wisconsin, USA). Melton et al., Nucleic In a manner similar to that described in Acids Research, 12: 7035-7056 (1984). In vitro transcription was performed using the cleavage template. A typical in vitro transcription reaction is 5 μg D NA template, Ambion's Maxiscript in vitro Transcription Kit (Ambion Inc., H uston, Texas, USA), GTP (3 mM), AT P (1.5 mM) and CTP and fluorescein treated UTP (3 mM total, UTP: F1-UTP 3: 1) or UTP and fluorescein-treated CTP (total The body used 2 mM, CTP: F1-CTP 3: 1). Run in Ambion buffer The reactions performed contained 20 mM DTT and RNase inhibitor. The reaction is about 1 . Run for 5 to about 8 hours.   After the reaction, size-selective membrane (Microcon-100) or Pharmacia MicroSpin S Remove the incorporated nucleotide triphosphate using a -200 column Was. The total molarity of the RNA was based on the measured absorbance at 260 nm. RN After quantification of the amount of A, 40 mM RTris-acetic acid pH 8.1, 100 mM potassium acetate By heating in 30 mM magnesium acetate at 94 ° C. for 30-40 minutes. RNA was randomly fragmented to an average length of about 50-100 bases. Fragmentation is RN A Closely spaced probe molecules reduce the potential for interference from secondary structure Minimize the effects of multiple interactions.   2) From cDNA library   Two murine cell lines: T10, used as target gene in this test Does not express genes (excluding IL-10, actin and GAPDH) Is a known B-cell plasmacytoma, and 2D6, a target gene in this test. IL-12 growth-dependent, known to express most of the genes used Sex T cell line (Th1(Type) produced labeled RNA. Therefore, T10 RNA from cell lines can be spied using known amounts of RNA from specific target genes. Provided a good total RNA baseline mixture suitable for screening. In contrast, Thus, mRNA from the 2D6 cell line has a typical endogenous transcript amount of R from the target gene. A good positive control providing NA was provided.   i) T10 murine B cell line   By selecting in the presence of IL-11, an IL-6 dependent mouse Miplasma cell tumor cells T1165 (Nordan et al., (1986), Science 233: 566-5). 69), a T10 cell line (B cell) was obtained. Prepare a directional cDNA library To obtain total cellular RNA using RNAStat60 (Tel-TestB) Was isolated from T10 cells, and the PolyAttract kit (Promega, Madison, Wis.) Was used. sconsin, USA)+RNA was selected. 5-methyl in both reactions Rudeoxycytidine 5 'triphosphate (Pharmacia LKB, Piscataway, New J ersey, USA) in place of DCTP, except for Toole et al., (1984) Natu. re, 312: 342-347, primary and secondary strand cDNA were synthesized.   To measure cDNA frequency, the T10 library was plated and the DNA To a nitrocellulose filter,32P-labeled β-actin, GAPDH and And probed with IL-10 probe. Actin is 1: 3000, GAPDH is 1: 1000 and IL-10 were displayed at a frequency of 1: 35000. As described above Labeling from NotI and SfiI digested cDNA library in vitro transcription reaction Sense and antisense T10 RNA samples were synthesized.   ii) 2D6 murine helper T cell line   The 2D6 cell line is a murine IL-12-dependent T cell developed by Fijiwara et al. Is a stock. Cells were incubated with 10% heat-inactivated fetal calf serum (JRH Biosciences) , 0.05 mM P-mercaptoethanol and recombinant murine IL-12 (1 00 units / mL, Genetics Institute, Cambridge, Massachusetts, USA) And cultured in RPM11640 medium. Cells are induced for cytokine induction Preincubated overnight in IL-12 free medium and then resuspended (106 Cells / ml). 5 nM calcium ionophore A23187 (Sigma Chemical C o., St. Louis Missouri, USA) and 1 00nM 4-phorbol-12-myristate 13-acetate (Sigma) After incubation for 0, 2, 6, and 24 hours in a medium containing Cells were harvested and washed once with phosphate buffered saline prior to RNA isolation.   In a similar manner to T10, α-ZipLox, Not available from Gibco BRL Directed cloning of 2D6 cDNA using the I-SalI arm As a result, labeled 2D6 mRNA was produced. Transfer linearized pZ11 library to T7 And transcribed to generate sense RNA as described above.   iii) RNA preparation   For substances produced directly from cellular RNA, cytoplasmic RNA is t al., (1980) Meth. Enzym., 65: 718-749. A)+RNA was isolated using an oligo dT selection step (PolyAtract, Promega). Eberwine et al., (1992) Proc. Natl. Acad. Sci. USA, 89: 3010-3014 (Van Geld er et al., (1990) Science 87: 1663-1667). And amplified the RNA. Incorporates T7 RNA polymerase promoter site CDNA synthesis kit (Life Technologies) containing oligo dT prime Used to convert 1 μg of poly (A) + RNA to double-stranded cDNA. Secondary chain synthesis Thereafter, the reaction mixture was extracted with phenol / chloroform, and subjected to a membrane filtration step (microcon -100, Amicon, Inc., Beverly Massachusetts, USA). Was isolated. Labeling cRN directly from cDNA using the IVT step as described above A was prepared. The total molarity of the labeled cRNA was determined from the absorbance at 260 nm. , An average RNA size of 1000 ribonucleotides was assumed. 1OD is RNA Equivalent to 40 μg, 1 μg of cellular mRNA is composed of 3 pmol of RNA molecules. Say RNA concentration was calculated using conventional conversion.   In addition, without any intermediate cDNA or RNA synthesis steps, cellular mR NA was directly labeled. Poly (A) as above+Fragment the RNA The 5 'end is kinased and T4 RNA ligase (Epicentre Technologies ) In the presence of a biotinylated oligoribonucleotide (5'-biotin-AAAAA) AA-3 '). Alternatively, biotin (Schleich er & Schuell) by UV-induced cross-linking with a psoralen derivative A was directly labeled.   B) High density array preparation   High density of 20mer oligonucleotide probes using VLSIPS technology Arrays were generated. The high-density array is compatible with the oligonucleotide probes listed in Table 2. Including Central mismatch control probe provided for each gene-specific probe Containing more than 16,000 different oligonucleotide probes. A high density array results.   Table 2. High density array design. Central single base mismatch for all probes There was a mismatch control with   High density arrays were synthesized on flat glass slides.   C) Array hybridization and scanning   RNA transcribed from cDNA is converted to a high-density oligonucleotide probe array ( Hybridized with low stringency (s) and washed under higher stringency conditions . The hybridization solution was 0.9 M NaCl, 60 mM NaH.TwoP OFour, 6 mM EDTA and 0.005% Triton X-100. Adjusted to H7.6 (indicated as 6xSSPE-T). In addition, the solution is . 5 mg / ml unlabeled degraded herring sperm DNA (Sigma Chemical Co., St. Louis) , Missouri, USA). Prior to hybridization, transfer the RNA sample Heat to 9 ° C for 10 minutes in the hybridization solution and leave on ice for 5 minutes Equilibrated to room temperature before placing in the hybridization flow cell. Hive After redidation, the solution was removed and the array was placed on a 6 × SSPE-T at 22 ° C. for 7 minutes. After washing for 5 minutes, the plate was washed with 0.5 × SSPE-T at 40 ° C. for 15 minutes. Biotin marker In the case of using the RNA, the hybridized RNA was converted to streptavidin-phyco Read with erythrin complex (Molecular Probes, Inc., Eugene, Oregon, USA) Before staining. Hybridized arrays were prepared at 2 μg / m in 6 × SSPE-T. The cells were stained with 1 streptavidin-phycoerythrin at 40 ° C for 5 minutes.   Scanning confocal microscope (Molecular Dynamics, Sunnyvale, modified for the purpose) , California, USA). Scanner is Argon Using an on-laser as an excitation source, a 530 nm bandpass filter (fluorescent Through a 560 nm long-pass filter (Phycoerythrin) Luminescence was detected with a photomultiplier tube.   Nucleic acids in sense or antisense orientation were used for hybridization experiments. By reversing the order of the photochemical steps and incorporating complementary nucleotides, Using a set of photolithographic masks, arrays in either orientation (reverse complement of each other) Produced.   D) Quantitative analysis of hybridization pattern and intensity   For quantitative analysis of hybridization results, perfect match probes (PM) Count the cases that are brighter than the corresponding mismatched probe (MM) and count each probe family (immediately). That is, the difference (PM-MM) for the probe collection for each gene) was averaged, and The values are then similarly synthesized using unspiked samples (where applicable). And comparing with values obtained in parallel experiments on the array. Mean of difference Indicates that the signals from random cross-hybridization are equal and, on average, PM and And MM probes, while specific hybridization is He is more involved in the law of Buddha. By averaging the pairwise differences, Real signals add constitutively, while involvement from cross-hybridization is negated Tend to be.   The magnitude of the average change in the difference (PM-MM) value was determined by the results of the spike experiment, as well as Signal observed for internal standard bacterial RNA spiked into each sample at known amounts Was interpreted by comparing. The analysis is based on the algorithms and software described herein. Executed using software .   E) Optimization of probe selection   To optimize the probe selection for each target gene, Using a mixture of labeled RNAs transcribed from The density array was hybridized. Laser illumination connected to data acquisition system Scanning a high-density array using a scanning confocal fluorescence microscope provides a high-density array. The fluorescence intensity at each position on the ray was measured.   Probes were then selected for further data in a two-step procedure. First, count Therefore, the intensity difference between a probe and its corresponding mismatched probe is Must cross the world (in this case, 50 counts or about half the background) Did not. This is due to poorly hybridized probes and mismatch controls. Eliminates probes that hybridize at an intensity comparable to a perfect match .   High density arrays, in principle, labels that contain no sequences on the high density array And hybridized with the RNA sample. In this case, an oligo complementary to the sense RNA A nucleotide probe was selected. Therefore, the antisense RNA population It could not have hybridized to any probe on the ray. Plow Or its mismatch is above threshold (100 counts above background) , It was not included in further analysis.   Next, the signal for a particular gene is signaled to the selected protocol for each gene. Were counted as the mean difference (perfect match-mismatch control).   E) Results: High-density arrays provide specific and sensitive detection of target nucleic acids. Offer   As explained above, the initial array contains 12 murine mRNAs, ie, 9 Tokine, 1 cytokine receptor, 2 constitutively expressed genes (5-actin and Ceraldehyde 3-phosphate dehydrogenase) -1 rat cytokine and One bacterial gene (E. coli biotin synthase, BioB) that serves as a quantitative reference It contained over 16,000 complementary probes. These relatively simple arrays In an early experiment using DNA, short in situ synthetic oligonucleotides were With sufficient sensitivity and specificity to quantitatively detect RNA in the It was intended to determine if it could be made to soy. These arrays Are RNA that are intentionally very verbose and more than necessary to determine expression levels. It contained hundreds of oligonucleotides. This is due to the hybridization of a large number of probes. A minimal probe that examines the ligation behavior and covers substantially more genes Implemented to develop general sequence rules for a priori selection of groupings.   Oligonucleotide arrays provide a process for each of the monitored RNA. The harvest of the pair of beads was contained. Each probe pair is preferably part of a specific message 20-me that is complementary to the permutation (shown as a perfect match or PM probe) r, and the same partner except for a single base difference at the center. Each pair The mismatch (MM) probe is an internal pair for hybridization specificity. It served as Teru. Analysis of PM / MM pairs was performed using cross-hybridization signal. Enhance low intensity hybridization patterns from rare RNAs in the presence of Sensitivity and accurate recognition.   For array hybridization experiments, individual clones were used as described above. From a cloned cDNA library or directly A labeled RNA target sample was prepared from cellular mRNA. In vitro transcription (IVT) Incorporate fluorescently labeled ribonucleotides into the reaction to reduce RNA to 30-100 bases flat. Targeting for array hybridization by fragmenting to uniform size RNA was prepared. Self-contained flow cells (volume -2) for a range of 30 minutes to 22 hours (00 μl), the sample was hybridized to the array. Array fluorescence imaging This was accomplished using a scanning confocal microscope (Molecular Dynamics). All that B. In less than 15 minutes, 11.25 μm (100 × 100 μm (~ 80x that of extra sampling) Rapid and quantitative measurements of each of the reactions were obtained.   1) Specificity of hybridization   In order to evaluate the specificity of hybridization, IL-2, IL-3, IL-4, IL-6, actin, GAPDH and BioB Or IL-10, IL-12p40, GM-CSF, IFN-γ, TNF-α, Hybridization using 50pM RNA sense strand of mCTLA8 and BioB did. Hybridized arrays tested by minimal cross-hybridization It showed a strong specific signal for each of the target nucleic acids.   2) Detection of gene expression level in composite target sample   How good individual RNA targets are in the presence of the whole mammalian cell message population A spike experiment was performed to determine what could be detected. Known amounts of individual Representative cDNA library generated from murine B cell line T10 with RNA target Spiked in labeled RNA obtained from T10 cell line is a cytokine Is monitored and only IL-10 is expressed at detectable levels, Was selected.   The RNA mixture is spiked once with the selected target gene and then immediately hybridized. Because the dithering provides an artificial increase in readings for the remaining mixture Next, the spiked sample is processed through a series of procedures to obtain library RNA and additional RNA. And reduced the difference between. Therefore, a “spike” was added to the sample and Heated to ° C. for annealing. Next, freeze the sample, thaw and boil for 5 minutes And cooled on ice to room temperature, after which hybridization was performed .   FIG. 2A shows 13 target RNAs in the total RNA pool at 1: 3,000 (200- (Equivalent to 300 copies / cell). RNA frequency is determined by individual R It was shown as NA mole amount / total RNA mole. FIG. 2B shows interleukin-2 and And interleukin-3 (IL-2 and IL-3) RNA-specific probes FIG. 2C shows an array of small portions (the rectangular area in FIG. 2A), and FIG. The same region is shown in the absence of the target. The hybridization signal is Specific and brighter as shown by comparison between spiked and unspiked images Rows (corresponding to PM probes) and darker rows (corresponding to MM probes) alternate Perfect match (PM) hybridization as indicated by the pattern Was well distinguished from the mismatch (MM). Different perfect match hybridis Mutations observed between hybridization signals are highly reproducible and Reflects the array dependency of the option. In cases 2-3, exchange with other members of the composite RNA population Due to differential hybridization, perfect match (PM) probes (MM) was not significantly brighter than the opponent. The pattern is highly reproducible This, and because detection does not rely on only a single probe per RNA. Rare cross-hybridizations of this type are low levels of RNA. In addition, highly sensitive and accurate detection was possible.   Similarly, low frequency of poorly hybridized, e.g., due to RNA or probe secondary structure Presence of solicitation, polymorphisms or database sequence errors should not interfere with detection. No. Observed pattern of hybridization and cross-hybridization Analysis of the oligonucleotides with the best sensitivity and specificity described herein. General principles for the selection of nucleotide probes are formed.   3) Relationship between target concentration and hybridization signal   Perform a second set of spike experiments and hybridize for direct quantification of RNA levels. The range of concentrations at which the ligation signal was used was determined. FIG. Tocaine RNA is expressed at levels ranging from 1: 300 to 1: 300,000 in B cells. (T10) in 0.05 mg / ml labeled RNA from cDNA library Spiked together. 1: A frequency of 300,000 with less than 2-3 copies / cell Of the existing mRNA. In a volume of 200 μl in 10 μg of total RNA , 1: 300,000 is about 0.5 picomoles of specific RNA and 0.1 Mutmol (~ 6x107Molecule or about 30 picograms).   Hybridization was performed in parallel at 40 ° C. for 15-16 hours. 1 The presence of each of the 0 cytokine RNAs is at least minimally above background Was detected reproducibly. Furthermore, the hybridization intensity was 1:30 It was linearly related to RNA target concentration between 0000 and 1: 3000 (FIG. 3). 1 : 3000 to 1: 300, the probe site hybridized for 15 hours Signal started at a high concentration in the middle of Increased by a factor of 4-5. The linear reaction range is the hybridization time To achieve high concentration I can get it. Combines short and long hybridizations Let's say 10FourRNA concentration over the double range can be quantitatively covered.   Blind spike experiments were performed to determine the high levels of abundant concentrations in the complex RNA population. A number of related RNAs were simultaneously detected and tested for their ability to reduce. Murine B cell cDNA 0.05 mg / ml sense RNA transcribed from the library + different concentrations A set of four samples was prepared containing each combination of the ten cytokine RNAs. . Individual cytokine RNAs were spiked at one of the following levels: 0, 1: 300,000, 1: 30,000, 1: 3000 or 1: 300. Samples + unspiked reference samples were hybridized to separate arrays for 15 hours at 40 ° C. I did it. Hybridization patterns and non-spiked reference samples Determine the presence or absence of the RNA target by how it differs from The concentration was detected. The concentration of each of the ten cytokines in the four blinded samples was correct There were no false positives or false negatives measured.   One particularly notable example: IL-10 creates a cDNA library Expressed in mouse B cells used to It was known to be present in the library at a frequency of 2,000. Not known In one of the above, an additional amount of IL-10 RNA (for a frequency of 1: 300,000, Was spiked into the sample. 10-20% more than the inherent level Even if large was indicated. The amount of spiked IL-10 RNA was accurately measured. This These results were similarly prepared on arrays where subtle changes in expression were also synthesized. Shows that high sensitivity can be obtained by performing parallel experiments using samples .Embodiment 2. FIG. Measure cytokine mRNA as a function of time after stimulation T cell induction experiment   Next, using the high-density array of the present invention, mice at different times after biochemical stimulation were The cytokine mRNA in mi T cells was monitored. Rat T helper Cells from cell line (2D6) were phorbol ester 4-phorbol-12-mi Treated with Restate 13-acetate (PMA) and calcium ionophore Was. Next, poly (A)+MRNA was isolated at 0, 2, 6, and 24 hours after stimulation . The isolated mRNA (about 1 μg) was converted to a double-stranded cDNA synthesis step followed by in vitro transcription. It was converted to labeled antisense RNA using a method combining the transcription reaction. this RNA synthesis and labeling methods make the entire mRNA population distinctly unbiased and reproducible Amplify by a factor of 20-50 in a manner (Table 2).   Next, labeled antisense T cell RNA from the four time points was Hybridized with Ray for 2-22 hours. 4 other cytokine mRNAs (IL-3, IL-10, GM-CSF and TNFα) A large increase in gamma-interferon mRNA levels was observed. As shown in FIG. Thus, cytokine messages were not induced with the same kinetics. 1:13 Changes in cytokine mRNA levels of less than 000 indicate that γ-interferon Was clearly detected, along with the very large changes observed for.   These results highlight the large experimental dynamic range values inherent in the method. C Quantitative assessment of RNA levels from hybridization results is straightforward, additional Control hybridization, sample manipulation, amplification, cloning or sequencing Without a bug. The method is more efficient. Latest protocols, instruments and analysis Using the software, a single user can access as many as 30 times a day with a single scanner. Number arrays can be read and analyzed.Example 3. Contains 65,000 probes for more than 100 murine genes High density array   FIG. 5 shows 65,0 after hybridization with the entire murine B cell RNA population. Contains over 100 different oligonucleotide probes (50 μm feature size) 1 shows an array to perform. Arrays of this complexity require 7.5 lim in less than 15 minutes Read at resolution. The array consists of the twelve cells shown on the simpler array above. Rat gene, 35U. S. C. §102 () additional murine gene, three bacterial remains Genes and probes for 118 genes, including one phage gene Have. There are about 300 probe pairs / gene, and the probes are described herein. Selected using the selected selection rules. 60 of the sequence at the 3 'end of the translation region of each gene A probe was selected from 0 bases. All of the 21 murine RNAs were about 1: 3 At levels ranging from 00000 to 1: 100, there is a distinct was detected.   Labeled RNA samples from T cell induction experiments (FIG. 4) were used for these more complex 118 Hybridizes with the gene array, and is common to both chip types. And similar results were obtained. In addition to those shown in FIG. 4, more than 20 other genes For, a change in expression was clearly observed.   Fewer pairs of probes per gene for reliable detection of RNA To determine if the hybridization is sufficient The results were analyzed using 10 different subpopulations of 20 probes / gene. That is, the array analyzed data containing only 20 pairs of probes per gene. . Twenty pairs of 10 subpopulations were selected from about 300 probes per gene on the array. Was. Initial probe selection reduces the algorithm, using probe selection, as described above. And executed. Next, from the remaining probes in the selection and reduction, 10 out of 20 pairs Subjects were randomly selected. Labeled RNA in murine B cell RNA population: Spiking at 25,000, 1: 50,000 and 1: 100,000 levels Was. The change in hybridization signal for spiked RNA is more The small probe set was consistently detected at all three levels. As expected In addition, the hybridization intensity is poor when the average of a large number of probes is taken. It is not crowded. This analysis shows that low levels of 20 probe pairs per gene Is sufficient to measure expression changes in Probe detection and improved experimental procedures are required for routine detection of RNA at the bell. Indicates that it is preferable. Such improvements include ongoing, slightly longer oligos. Than associated with the use of nucleotide probes (eg, 25mer probes) Examples include, but are not limited to, high stringency hybridization.Embodiment 4. FIG. Scale up to thousands of genes   25-mer oligonucleotide probes for about 1650 different human genes Each of a set of four high-density arrays containing the probes correspond to a total of 6620 genes. Probes were provided. About 20 probes were found for each gene. A The feature size on the lay was 50μ. This high-density array is essentially Successfully hybridizes to a cDNA library using a similar protocol. Was. Oligonucleotide probes for all known expressed sequence tags (ESTs) A similar set of high density arrays containing probes is under preparation.Embodiment 5 FIG. For simultaneous monitoring of 10 out of thousands of RNAs Direct scale up   In addition to being sensitive, specific and quantitative, the protocols described herein Is essentially parallel and easy for monitoring large numbers of mRNAs. Can be calculated in proportion to The number of RNAs that differ from the monitoring Significantly by reducing the number of probes and increasing the number of probes per array. Can be great. For example, using the above technique, 1.6 cmTwo(20x20μm synthesis Arrays containing as many as 400,000 probes in an area of Created and read. Using 20 probe pairs / gene, the probe redundancy 10,000 genes are monitored on a single array while retaining key benefits It is. A set of four such arrays is stored in a public database as an expression sequence tag ( (ESTS) covers more than 40,000 human genes, and new ESTs Incorporate them as they become available. Due to the combination of chemical synthesis, Arrays of this complexity require as many steps as the simpler ones used here In the same amount of time. Fewer probes and higher density per gene With arrays, all sequenced human genes on a single or a few small chips Can be monitored simultaneously.   Quantitative monitoring of expression levels for many genes reveals gene function To explore the causes and mechanisms of disease and to identify potential therapeutic and diagnostic targets Prove that it is useful for discovery. As the body of genomic information grows, A highly parallel approach of the type described here will help elucidate the underlying physiology of the cell. To provide an effective and direct method of using sequence information.Embodiment 6 FIG. Probe selection using neural networks   Probes based on the base sequence of the probe or other probe characteristics Predict lobe hybridization and cross-hybridization intensity To train a neural network. Next, using a neural network, Any number of the "best" probes can be plucked. Training a neural network Doing this produces a moderate (0.7) correlation between the predicted and measured intensities. Better for cross-hybridization than for hybridization Become a model.   A) Input / output mapping   Training a neural network and hybridizing a 20mer probe Characteristics were identified. 20-mer probe mapped to 80-bit input vector Then, the first 4 bits indicate the base at the first position of the probe, and the next 4 bits The base at the second position was represented. Therefore, the four bases are coded as Was: A: 1000 C: 0100 G: 0010 T: 0001   The neural network has two outputs: hybridization intensity and crossover Hybridization intensity was generated. The output is 95% of the output from the actual experiment Is 0. ~ 1. Was scaled linearly to fit within the range.   B) Neural network architecture   A neural net has 80 input neurons, one with 20 neurons. Backpropagation net with hidden layer and output layer with two neurons It was a work. The sigmoid transfer function was used: (s (x) = 1 / (1 + exp (−1)* x))) This is a non-linear (S-shaped) style, where 0-1 input values are evaluated on a fixed basis. .   C) Neural network training   Neural Works Professional 2.5 for backpropagation networks (N eural Works Professional is Neural Ware, Pitts burgh Pennsylvania, USA) , Trained the network. The training group has about 8000 probes and related hybrids. It consisted of the solubilization and cross-hybridization intensity.   D) Neural net weight   Neural net weight is presented in two matrices: 81 x 20 mat Rix (Table 3) (weight 1) and 2x20 matrix (Table 4) (weight 2).Table 3. Neural net weight (81x20 matrix) (weight 1) Table 4. 2nd neural net metric matrix (2x21) (weight 2)   E) Code for executing the net   The code for executing the neural network is shown in Table 5 below (neural n. c) and Table 6 (lin alg.c). Table 5. Neural network execution code (neural n.c.) Table 6.Neural network code (lin alg.c) Embodiment 7 FIG. Generic difference screening   The mask used for the synthesis of the light-directing polymer is inserted into the generic difference screen. High density including any (accidental) probe oligonucleotides for Degree array was generated. The resulting array has more than 34,000 pairs of 25me r Contains any probe oligonucleotide. The oligonucleotides in each pair are , The single nucleotide at position 13 was different.   After hybridization, linearization, staining and scanning as described above, (Including information on probe identity and hybridization intensity) Made.   Two oligonucleotides containing each probe pair K (K is in the range 1-34,320) The difference in intensity between the leotides was calculated. Further, the orientation of the pair K with respect to the replica j of the sample i is The intensity difference between the gonucleotides was calculated as follows:       Xijk1-Xijk2 (Where X is the hybridization intensity and i is any of the samples Indicates the sample 1 or 2), and j indicates one of the duplicates (in this case, duplicate 1 or each sample) , And K represents a probe pair (in this case, 1 ... 34,320). ) Where 1 indicates one member of the probe pair and 2 indicates the other member of the probe pair. Shown).   16a and 16b and 16c show duplicates 1 and 2 of sample 1 for each probe. 16 (FIG. 16a, normal cell line) and between replication 1 and replication 2 of sample 2 (FIG. 16b). , Tumor cell lines). Therefore, FIG. 16A shows K-1 to 34 on the vertical axis. , 320 and K on the horizontal axis (X11k1-X11k2)-(X12k1-X12k2) Plot the values of. Two replicates, for all probe pairs, (X11k1-XN11 k2 ) / (X12k1-X12k2) Is normalized based on the average ratio (ie, after normalization) , The average ratio is about 1). Similarly, FIG. 15b shows (X21k1-X21k2) / (X22k1 -X22k2) Based on the average ratio of (X) after normalization between the two replicates.21k1-X21k2 )-(X22k1-X22k2) Is plotted. FIG. 16c averages the two replicas The difference between Samples 1 and 2 is plotted. This value is [(X21k1+ X22k2) / 2 ] / [(X11k1+ X12k2) / 2] after normalization between the two samples based on the average ratio ((X21k1+ X22k2) / 2)-((X11k1+ X12k2) / 2) .   Figures 17a, 17b and 17c show the filtered data. FIG. Hybridization of replicas 1 and 2 of sample 1 with respect to differences in oligonucleotide pairs 5 shows the relative change in the intensity of the magnetic field. After normalizing between replicas (see above), calculate the ratio as follows: Issue: (X11k1-X11k2) / (X12k1-X12k2) Is> 1 Is the ratio = (X11k1-X11k2) / (X12k1-X12k2) Or ratio = ( X12k1-X12k2) / (X11k1-X11k2) (Reverse). Similar to FIG. 17a Method, filtered and plotted for the difference between each pair of oligonucleotides. FIG. 17b shows the ratio of replicas 1 and 2 of sample 2 to be performed. The ratio is calculated from FIG. 17a Is the same as (X21k1-X21k2) / (X22k1-X22k2) And (X22k1-Xtwenty two k2 ) / (X21k1-X21k2) Based on absolute value. FIG. 17c shows each oligonucleotide. Shown is the ratio of Sample 1 and Sample 2 averaging the two replicates for the difference in otide pairs. ratio Is calculated as in FIG. 17a, but as in FIG. 16c, the normalized [ (X21k1+ X22k2) / 2] / [(X11k1+ X12k2) / 2] and [(X11k1+ X12 k2 ) / 2] / [(X21k1+ X22k2) / 2].   Oligonucleotides exhibiting maximum differential hybridization between two samples Pairs are classified by classifying the observed hybridization ratios and difference values. Can be identified. Oligonucleotides showing the largest change (increase or decrease) This can easily be seen from the ratio plots of Fig. 2 and (Fig. 17c). These differences are I don't think it exists in the round noise. Confirmed oligonucleotide pairing ESTs with gene or suspicious sequence tags based on the sequence Genes are cloned and characterized by searching in the base, eg GENBANK Determine whether it has been done. If the search is negative, Prepared from mRNA, cDNA directly or from a cDNA library to cDN A or a portion of the cDNA is obtained.   From FIGS. 16a and 16b, several pairs of oligonucleotides correspond to the same sample. It is observed that there is a large difference between the two replicates. This is a given organization Due to the differential expression in These oligonucleotide pairs are: Detects highly highly expressed genes and therefore replicates these pairs. Deviation is low Larger than the oligonucleotide pair that binds the nucleotide expressed in the bell (immediately The standard deviation of the mean is proportional to the mean). Because the relative change between the two samples That is why it is a good indicator for detecting differential expression between two samples (FIG. 17c). . Absolute and relative differences to determine which oligonucleotide pair is the largest Evaluate the combination of measurements.   Increasing the number of related oligonucleotide pairs (increased redundancy) and two-color hybridization Use of the solution / detection diagram is expected to help reduce background mutations . This increases the sensitivity of detecting small differences and reduces noise and false positive appearances. This 25-mer array used in the examples of Example 1 is a subset of all possible 25-mers. Therefore, increasing the total number of oligonucleotide pairs increases the available sequence space. The ability to detect changes in genes of unknown sequence Greatly increase.Embodiment 8 FIG. Nucleic acid end labeling   Several RNA transcripts from mouse cells as well as complete mRNA samples were2+ Fragmented in the presence of Reagent labeled at the 5 'end with fluorescein or biotin Bo A. (Deoxyribonucleic acid 6-mer poly A) and then RNA ligase under standard conditions The fragments were ligated with the fragmented RNA using zeolites.   Labeling seems to be effective, and was obtained using labeled RNA as a probe. The hybridization pattern uses RNA labeled in the in vitro transcription step. It was similar to that obtained.Embodiment 9 FIG. Quantification of labeling efficiency   Specific full-length unfragmented RNA species were spiked at different concentrations into the total mRNA pool. After labeling, the ends were labeled, and the labeling efficiency was quantified. Next, adjust as described above. High density of target oligonucleotides produced Hybridization with the array allows the relative number of spiked RNAs in the pool to be The concentration was measured. This allows specific RNA species to be detected at low concentrations in the mRNA pool. Can evaluate the ability to issue.Embodiment 10 FIG. PCR labeling of nucleic acids Polymerase chain reaction (PCR)   A 20 μl PCR reaction performed with 10% biotin-dUTP was performed, and each PCR was performed. The amount of product was estimated by gel analysis. Approximately 250 fmol of each PCR product was pooled . Pre-rotation at 3000 × g, then 200 μl HTwo3000 washed with O xg for an additional minute, and add a Pharmacia S300 Sephacryl column (model number 27-5130-01). Put pooled PCR product and 3000x g for 2 minutes.   The contents of the column were drained and the eluate was vacuum dried at high speed.   DNase fragmentation   Use the dried PCR pool as a NEN Dupont end labeling kit (Model No. NEL824) 13 μl of HTwoResuspended in O. 2.5 μl CoClTwoAnd 12.5μ One TdT buffer was added. Using 10 mM Tris, pH 8, Gibco B RL DNase 1 was diluted to 0.25 units / μl. 1 μl of diluted DNase Add to PCR product pool, incubate at 37 ° C for 6 minutes, Denatured for minutes and cooled to 4 ° C. The total volume was 29 μl.   Terminal transferase (TdT) label   Add 2 μl of TdT enzyme (NEN kit 2 units / μl strand) to the fragmented PCR pool. And then add 4 μl of NEN kit biotin-ddATP. Was. The final volume was 35 μl, which was incubated at 37 ° C. for 1.5 hours.   Hybridization   35 μl of the labeled target was broken down into two 17.5 aliquots, one of which was (Gene chip containing sense strand sequence and its equivalent), non-coding (Antisense) chip. 182.5 μl of 2.5 M TMACl (Sigm a, 5M stock solution diluted 1: 2 with 10 mM Tris, pH8) Added. Triton X-100 was added to a final concentration of 0.001%. In one experiment, 4 μl of 100 nM control oligonucleotide was referred to as the staining step. Rather, it was added to the solution.   The mixture was denatured at 95 ° C. for 5 minutes, applied directly to the chip cartridge, The mixture was hybridized by mixing at 60 ° C. for 60 minutes.   Dyeing and washing   Flow used in gene chip system (Affymetrix, Inc., Santa Clara, CA) Remove the hybridization solution from the cell and add 6xSSPE / 0.001 The chamber was washed three times with% Triton X-100 to remove TMACl.   A phycoerythrin staining solution was prepared as follows: 190 μl of 6 × SSP E / 0,001% Triton X-100 + 10 μl of 20 mg / ml acetyl BSA + 0.4 μl of stock phycoerythrin (Molecular Probes Model S8 66) +4 μl fluorescein control oligo 100 nM stock.   The dyeing solution was added to the flow cell while mixing at room temperature for 5 minutes. Flow stain solution The cells were removed and washed three times manually with wash buffer.   At 35 ° C., using 6 × SSPE / 0.001% Triton X-100, To the hybridization station (GeneChip System, Affymetrix, I nc.,). Use 9 fresh washing solutions per drain and scan Performed in this buffer . In this experiment, the target sequence was correctly identified.Embodiment 11 FIG. End-labeled PCR products   The PCR product was fragmented and labeled with TdT from Boehringer Mannheim : After PCR amplification, react 5 μl of 50 μl PCR reaction solution on 1% agarose gel The total yield of the amplification reaction was estimated. To fragment the DNA, the remaining 45 μl of the solution was added to DNase I (HTwoDilute in O and final concentration 5 units DNase I / DNA μg) and reacted at 31 ° C. for 15 minutes. Next, DN The enzyme was inactivated by heating at 95 ° C. for 10 minutes. Then, terminal transfer The fragmented DNA solution was kept at 4 ° C. until the cellulase reaction was ready.   The terminal transferase reaction mixture contains the fragmented PCR sample, 20 μL 5x terminal transferase reaction buffer, 6 μl of 25 mM CoClTwo (Final concentration 1.5 mM), 1 μl of fluorescent dideoxynucleotide triphosphate (DdNTP final concentration 10 μM) and 2 μL of Boehringer Mannheim terminator Transferase (TdT, final concentration 50 units / reaction), To a final volume of 100 μl.   The reaction was incubated at 37 ° C. for 30 minutes. Thereafter, the total reaction volume was reduced to 1.7. Transfer to 5 ml test tube, add 5xSSPE, 0.05% Triton and add 500 μl And hybridized and scanned as usual.   The protocol for the 50 μL PCR reaction solution is GeneChipTMHIVPRT test (Af fymetrix, Sunnyvale, CA).Embodiment 12 FIG. CAIP improves base calling   In one fragment end labeling experiment, bovine intestinal alkaline phosphatase ( CAIP) during DNAse fragmentation to generate base calls on the GeneChip system. Outgoing accuracy was improved (see FIG. 18).   CIAP is compatible with any conventional amplification, as well as polymerase and Useful for degrading any nucleotides that were not incorporated in response. This Degradation in subsequent reactions such as tail formation and labeling reactions Prevents ingestion of codes.Embodiment 13 FIG. End labeling after hybridization   After hybridization, an end labeling experiment was performed. In the GeneChip system After hybridization between the target and the probe array, as shown in FIG. Target was labeled using a terminal transferase (designated TdTase). .   The post-hybridization label was obtained by using the probe array (chip) as shown in FIGS. It has been shown that good results can be obtained by calling and reacting as shown in FIG. .   FIG. 21 shows the results of a DNase titration experiment. Various titration experiments were performed as described in Table 7 below. Shown inTable 7. Hybridization end label calling accuracy. Accuracy is ratio = next calculated strength Maximum of 1.2 for degrees. Calculated strength = A in tile set subtracted from adjustment strength , C, G or T. Adjusted intensity = raw intensity of PCR-raw intensity without PCR.   These results indicate that base calling accuracy can be stronger with target fragment length. You.   Other experiments indicate that one unit of DNase is particularly useful for obtaining ideal fragment lengths. It was shown.Embodiment 14 FIG. End labeling with poly T (tailing)   Using a method similar to that described in Example 13, the poly-A analog (labeled or unlabeled) As shown in FIG. 22, the nucleic acid tailed by the labeling) Labeling.Embodiment 15 FIG. Synthesis of fluorescent triphosphate labels   0.5 μmol (50 μL of 10 mM solution in 0.5 ml Eppendorf tube) Liquid) amino-derivatized nucleotide triphosphate, 3'amino-3'deoxythymidine triphosphate (1) or 2'-amino- To 2'-deoxyuridine triphosphate (2), add 25 [mu] L in methanol. 11 M aqueous solution of sodium borate, pH 7, 87 μL methanol and 88 μL L (10 μmol, 20 wquiv) of 5-carboxyfluorescein-XN A 100 mM solution of the HS ester was added. Rotate the mixture briefly, in the dark Leave at room temperature for 15 hours. Next, the sample is purified by ion-exchange HPLC. The fluorescein-treated derivative, Formula 3 or 4, was obtained in about 78-84% yield.   Experiments have shown that these molecules are the basis for terminal transferase (TdT). Suggests that it is not quality. However, these molecules are polymerases, for example For example, it is considered to be a substrate for Klenow fragment.Embodiment 10 FIG. Of as-triazine-3,5 [2H, 4H] -dione Synthesis   The analog as-triazine-3,5 [2H, 4H] -dione ("6-azapyri Midine ") nucleotides (see FIG. 23a) were obtained from Petrie et al., Bioconj. Chem. Synthesized by a method similar to that used in 2: 411 (1991).   Other useful labeling reagents, including 5-bromo-U / dUTO or ddUTP (Eg, Lopez-Canovas, L. et al., Arch. Med. Res. 25: 189-1). 92 (1994); Li, X., et al., Cytometry 20: 172-180 (1995); et al ., J. Pathl. 148: 61ff. (1986); Traincard, et al., Ann. Immunol. 1340: 399 -405 (1983); and Figures 23a and 23b).   Nucleotide analogs corresponding to all of the above structures (especially those of FIG. 23b) The details of the synthesis of are described in the literature. To add a linker to the base, Knowledge techniques are applied. The linker-modified nucleotide is then replaced with a triphosphate amine. And finally apply the dye or hapten using a commercially available activated derivative. To wear.   Other suitable labels include non-ribose or non-2 'deoxyribose containing Structure (some of which are shown in Figure 23c), as well as sugar modified nucleotides Body (eg, FIG. 23d).   Using the guidelines provided herein, methods for synthesizing reagents useful in the practice of the present invention and Methods for labeling and labeling (enzymatic or other methods) will be apparent to those of skill in the art (eg, For example, Chemistry of Nucleosides and Nucleotides 3, Townsend, L.B. ed., Pl enum Press, New York, catchpt. 4, Gordon, S.M. The Synthesis and Chemistry of Imidazole and Benzamidizole Nucleosides and Nucleotides (1994); Gen Ch em.Chemistry of Nucleosides and Nucleotides Three, Townsend, L.B. ed., Plen um Press, New York (1994); can be made by me thods simliar to those set forth in Chemistry of Nucleotides 3, Townsend , L.B. ed., Plenum Press, New York, at chpt. 4, Gordon, S.M. The Synthesis  and Chemistry of Imidazole and Benzamidizole Nucleosides and Nucleotide s (1994); Lopez-Canovas, L .; et al., Arch. Med. Res 25: 189-192 (1994); Li, X. , Et al., Cytometry 20: 172-180 (1995); et al., J. Amer. Pathol. 1 48:61 ff. (1986); Traincard, et al. , Ann. Immunol. 1340: 399-405 (1983) reference).Embodiment 11 FIG. Biotin-chem Link (Boehringer-Mannheim)   The labeling density is estimated to be 1 biotin / 10 bases. Biotin-chem Li Coordination of nk adenosine and guanosine with N7, non-covalent binding, in 20 μl Heating 1 μg of RNA or DNA + 1 μl of BCL to 85 ° C. for 30 minutes Include.   RNA labeling experiments (4 sets of 4 pooled RNA transcripts)   Very poor labeling and / or hybridization (5 pM I can't. 20 pM is very weak). Non-embedded mark using microcon-100s Removal of knowledge could result in sample loss after labeling. Cut RNA after labeling Shredded. This does not seem to be a problem (BM tech he lp).   BCL labeling of dsDNA   Low signal, background over all chips. Cannot be identified.   High Speed Tag (Vector Labs) (RNA)   1 biotin / 10 to 20 bases. Five reactions were performed:   a) RNA1 + RNA2 + RNA3 (5 pmol each, 5.2 μg in total) +25 μl high-speed tag reagent;   b) RNA1 + RNA2 + RNA3 (9 pmol each, 9.4 total) μg) +25 μl high-speed tag reagent;   c) RNA1 + RNA2 + RNA3 (18 pmol each, 19 μg in total) + 40 μl high speed tag reagent;   d) RNA4 + RNA5 + RNA6 (10 pmol each, 8.7 μg in total) +25 μl fast tag reagent;   e) RNA7 + RNA8 + RNA9 (10 pmol each, 11.4 μg in total) ) +25 μl high speed tag reagent.   The SS was bound to the RNA using a heating method. Result: Labeled by IVT method Hybridization signal 20 times lower than the same target.Embodiment 12 FIG. RNA ligase / bio-a6 end labeling   This experiment generally involves the following steps: a) fragmenting the RNA; b) RN A fragment is 5 'phosphorylated with polynucleotide kinase / ATP; and c) RN The A 'ligase was used to ligate the 5' end of the RNA to the 3 'end of BioA6. This This is represented by the following equation:   5 'biotin-AAAAAAA-OH3' + 5'P-RNA-OH3 '= 5'b ioAAAAAA-RNA3 '   Conventionally, using this method, total cellular mRNA is labeled, and this is labeled with an unpackaged chip ( High density oligonucleotide arrays) (on 2x3 slides) and hive in 10 μl Redidized. Not mixing is a significant problem and Reduced strength. For in vitro transcription (IVT), labeled RN under these conditions A produced a 10-fold higher signal than the bio-A6 / RNA ligase labeled target .   In other experiments, three different ratios of bio-A6: RNA were used:   1) 1 × bioA6 = 0.5 nmol biotin-A6 / 1 μgR NA;   2) 2xbioA6; and     3) 4xbioA6.   After labeling, the sample was rotated by Microcon-EZ and Microcon-3 to Was removed and diluted from the buffer components.   Bio-A hybridized with a chip (high-density oligonucleotide array) 6-labeled targets are almost identical to hybridized in vitro transcription (IVT) -labeled targets. A seizure strength was produced.   Staining was performed for 15 minutes using a normal concentration of PE. Significantly higher signal or back No ground was observed at 4 times bioA6 / 1 μg RNA.   For these experiments, BioA6: (5 'biotin-AAAAARNA ) Ordered from Genset.Embodiment 13 FIG. Preparation of gene-specific transcripts Preparation of template DNA   Vector linearization:   Has T3 and T7 RNA polymerase promoter sites flanking the insert If the gene has not already been cloned in the vector See R amplification.   At the 3 'end of the insert for sense transcripts or 5 for antisense. The vector is linearized with an enzyme that cuts at the 'end. Check the inserted sequence, RE is internal Prove that it has not been cut off. In a preferred embodiment, a 3 'protruding end is created. No restriction sites were selected.   After linearization, an aliquot of the sample was run on the gel (beside the uncut vector), Complete digestion was demonstrated.   Samples are optionally with proteinase K (100-200 ug / ml) After treatment at 50 ° C for 20 minutes to 1 hour, the enzyme or residual RNase Used for the preparatory protocol).   The linearized DNA was extracted by phenol / chloroform extraction and ethanol precipitation or Purified DNA by four microcon-100 concentration / re-dilutions (see below).   PCR amplification   Cloni wherein the desired region of the gene already has an RNA polymerase promoter Amplification is only preferred if it is within a carrying vector.   Starting with genomic DNA (or cDNA), 5 'T3 / T7 RNA polymerase Using a PCR primer having a zeo promoter sequence and a 3 'gene-specific sequence Thus, the ORF (or the region of the gene shown on the chip) was amplified.   The following 5 'sequences worked well (19-21 gene specific bases added to 3' end Was done). 5'-GAATTGTAATACGACTCACTATAGGGAGG-[+ 1 9-21 gene specific base] -3 ' The 5 'end is composed of:   a) Not part of the user-selected six 5 'flanking base-promoter sequence. But required for maximum IVT efficiency   b) 17 bases of the core T7 RNA polymerase promoter sequence   c) The first 6 bases to be transcribed (the sequence of +1 to +6 affects efficiency)   Other PCR primers would then have a T3 RNA polymerase primer at the 5 'end. Contains a motor sequence. 5'-AGATGCAAT where the following sequence worked well TAACCCTCACTAAAGGGGAGA-(+ 19-21 gene-specific bases ) -3 ' The 5 'end is composed of:   a) Six 5 'flanking bases (sequence may vary from this example)   b) 17 bases of the core T3 RNA polymerase promoter sequence   c) +1 to +6 transcribed bases   Amplify desired sequence using standard PCR conditions. For the first 5 cycles, The annealing temperature best suited for the gene-specific portion (typically 55-5 8 ° C.), then annealing at 70 ° C. for 25 cycles. PCR on agarose gel Check the product (3-5 ul of 100 μl rxn). You do n’t have to be at this stage No.   Optional proteinase K treatment:   1 ul of proteinase K (20 mg / ml) (Ambion) was added to the remaining PCR reaction. The solution was added and incubated at 50-60 ° C for 20 minutes to 1 hour. This is usually Not required, but the in vitro transcription (IVT) product is included in the control IV If the T product has the full length, this step can be performed before Microcon-100 and IVT. Is added to   Microcon 50/100 purification   Other purification methods are under test. Ethanol precipitation replaced with Microcon-50 purification Can be done. CAUTION: Microcon may leak. Maintain all spills That.   Add 380 μl RNase-free water to the PCR product and use the instructions (Amicon Concentrate using Microcon-100 or Microcon-50 as suggested in You. Repeat the dilution and concentration 2-3 times. Final concentrated sample should be 5-100 μl It is.   In vitro transcription labeling with biotin   To increase the maximum yield, Ambion's T3 (# 1338) or T7 (# 1334) ) Use the Megascript system (their proprietary buffers) Allows higher nucleotide concentrations without inhibiting the polymerase) (kit Read the Ambion instructions and suggestions in the booklet).   Perform IVT as suggested, but (1: 3) biotinylated: unlabeled C Use TP and UTP. T3 and T7 coming with Megascript kit Do not replace 10x nucleotides.   For example, an NTP mix for four IVGT labeling reactions is prepared as follows. RU:   8 μl of Ambion T7 10 × ATP [75 mM]   8 μl of Ambion T7 10 × GTP [75 mM]   6 μl of Ambion T7 10 × CTP [75 mM]   6 μl of Ambion T7 10 × UTP [75 mM]   15 μl of Bio-11-CTP [10 mM] (ENZO # 42818)   15 μl of Bio-16-UTP [10 mM] (ENZO # 42814) For each IVT labeling reaction, add (at room temperature-not on ice):   14.5ul NTP mix   2.0 ul of 10xT7 transfer buffer (Ambion)   *1.5 ul of purified PCR product (1 μg or less)   2.0 ul of 10xT7 enzyme mix (Ambion)*  No more than 1 ug of DNA should be added to the IVT reaction. Higher concentrations of DNA Actually hinders the reaction and lowers the yield. Final rNTP composition:   7.5 mM ATP   7.5 mM GTP   5.625 mM cold UTP / 1.875 mM bio-UTP   5.625 mM cold CTP / 1.875 mM bio-CTP Incubate at 37 ° C for 4-6 hours. For some transcripts Alternatively, if maximum yield is not critical, short incubation times Minutes.   Optionally: DNase 1 treatment   1 μl RNase-free DNase I (provided with Ambion kit) Is added to each reaction and mixed well. Incubate at 37 ° C for 15-20 minutes You.   Optionally-proteinase K treatment   This step involves coupling to the chip and to streptavidin-phycoerythrin. To reduce background caused by non-specific proteins Useful:   RNase-free water is added to the IVT reaction to a final volume of 99 ul.   Add 1 ul of Ambion 20 mg / ml proteinase K.   Incubate at 50 ° C for 20-30 minutes.   Microcon purification   Several other purification methods were tested-many methods remove enough rNTPs No or low yield. Carboxybead-based purification protocol (Archana Nair) is very promising and will soon replace microcon Used for   Note: Set aside an aliquot of the IVT reaction before further purification. If you leave 1%, you can solve the trouble of this process if necessary .   1. Add 400 ul DEPC water to the sample and add Microcon-50 or -100 Concentrate the sample with (as suggested by Ambion). Maintain all effluent fractions.   2. Repeat dilution / concentration 3-4 times. The final volume is 10-100 μl. See comments below.   Check IVT products on gel   Typically, check ~ 0.01-1% of reactants on non-denaturing agarose / TBE gel Is enough. Prior to electrophoresis, the samples were heated to 65 ° C. for 15 minutes. Estimated size A nearby single band is usually observed. If there is sufficient spacing on the gel, Run two or three different dilutions of both purified IVT products on a gel (each -0.01%, 0.1% and 1%). Dilute 1: 10,000 in 1xTBE buffer Stain the gel with Sybr Green II (FMC) (more sensitive than ethidium bromide) .   If an accurate measurement of transcript size is desired, the denatured gel can be biotinylated R Can be processed with NA criteria (obtained from Ambion).   A Quantification of transcript yield by 260 °   Remove 75-150 μg RNA / 1 ug starting DNA template. Quantification of purified transcripts About 1% diluted in a final volume of 60-70 ul (for micro cuvettes) Concentrated samples showed absorbance readings within the correct range (0.1-1 OD). For an accurate pipetting volume (> 1 μl), first make a series of dilutions. Is usually necessary (for example, make a 1/10 dilution of your RNA sample). And then measure the 10% dilution in a final volume of 60-70 ul). Usually the same Ensure blank reading in cuvettes, same buffer where RNA samples are diluted Use liquid / water.   Accurate quantification of pure transcripts is essential for significant spike experiments and Careful removal of extra nucleotides from the IVT reaction260° involved Must be established.   Microcon outflow is A260Need to be maintained and checked with respect to °. Significant If an absorbance of The RNA was further diluted and concentrated until no light intensity was detected at 260 nm. It must be shrunk.   Microcon filtration equipment occasionally leaks, so it is appropriate to maintain all effluent fractions. It is off. If the transcript RNA concentration in the retained / collected sample is much lower than expected Using a new cartridge (and then dilute and concentrate at least 4 times) Fractions can be re-concentrated.Embodiment 14 FIG. Labeling of total mRNA from cells / tissue   Starting material: at least 5x10Five-1x106cell*(0.1 to 5 ug of po High quality poly A from Re ++RNA. More poly A + RNA (up to 5 μg) It is more economical to start with but if the substance is limited, A sufficient amount of labeled RNA target (IVT-labeled) with only 0.1 μg of poly (A) + / 10 μug after amplification).   Double-stranded cDNA synthesis:   This protocol uses the protocol provided by the Gibco BRLOs Superscript Choice System. It is a supplement to the instruction manual. Before proceeding with the Gibco protocol, According to the Gibco BRL ’s Superscript Choice System, but with the kit Instead of oligo (dT) or random primers provided by The T7- (T) 24 sequence (below) for priming DNA synthesis was used. T7 (T)twenty fourPrimer: 5'-GGCCAGTGAATTGTAATACGA CTCACTATAGGGAGGCGG- (T)twenty four-3 '   First-strand synthesis   0.1 μg to 5 μg of poly (A) as directed in the BRL instructions+ RNA and adjusted amount of HTwoUse O and enzyme. An example For example:     3 μl DEPC-water     4.5 μl (1 μg / μl) of mRNA     1 μl (100 pmol μl) of T7- (T)twenty fourPrimer   1. Mix / spin / incubate at 70 ° C for 10 minutes.   2. Cool on ice.   3. Add the following components to the RNA / primer (on ice):       4 μl of 5 × primary strand cDNA buffer       2 μl of 0.1 M DTT       1 μl [10 mM] dNTP mix   4. Incubate at 37 ° C for 2 minutes.   Add 5.4.5 μl Superscript II reverse transcriptase / mix well. (1 ul SSII RT / RNAlug). For <1 ug RNA, 1 Use ul RT.   6. Incubate at 37 ° C for 1 hour. Final reaction composition (20 μl volume):     50 mM Tris-HCl, pH 8.3     75 mM KCl     3 mM MgClTwo     10 mM DTT     500 uM each: dATP, dCTP, dGTP, dTTP     100 pmol of T7- (T)twenty fourPrimer     4.5 ug mRNA     900 units of RT (200 units / mRNA 1 μg)   Second strand synthesis   1. Place first-strand reaction on ice (swift spin down)   2. Addition:       95 μl of DEPC-HTwoO       30 μl of 5 × secondary strand buffer       3 μl [10 mM] dNTP mix       1 μl [10 units / μl] E. coli DNA ligase       4 μl [10 units / μl] E. coli DNA polymerase I       1 μl [2 units / μl] RNase H Final composition (150 μl):     25 mM Tris-HCl, pH 7.5     100 mM KCl     5 mM MgClTwo     10 mM (NHFour)TwoSOFour     0.15 mM b-NAD+     250 uM each: dATP, dCTP, dGTP, dTTP     1.2 mM DTT     65 units / ml DNA ligase     250 units / ml DNA polymerase I     13 units / ml RNase H   3. Mix / spin / incubate for 2 hours at 16 ° C.   Add 4.2 μl [10 units] T4 DNA polymerase.   5. Incubate at 16 ° C for 5 minutes.   6. Add 10 μl of 0.5 M EDTA / store at −20 ° C.   Clean up Phenol / chloroform extraction   Optional: To reduce sample loss during extraction, use the following PLG protocol: reference.   1. Equal volume (162 ul) phenol: chloroform: isoamyl alcohol (25: 24: 1) (10 mM Tris-HCl , PH 8.0 / 1 mM saturated with EDTA-Sigma).   2. Stir at 14000 xg for 5 minutes. Transfer the aqueous phase to a new 1.5 ml test tube Move.   PLG-phenol / chloroform extraction   Phase Lock Gel (PLG)*Is the aqueous phase of the phenol-chloroform extract Form an inert sealed barrier between the organic phases. Solid barrier is better than sample (aqueous phase) Allows complete recovery and minimizes interfacial contamination of the sample. PLGO is 1.5m It is sold as a pre-measurement aliquot in a test tube and allows the user to And phenol-chloroform are added directly.   1. Place Phase Lock Gel (1.5 ml test tube containing PLG I-Light) in a microcentrifuge. Pellet for 20-30 seconds in a heart separator [PLGI-weight also works, but this application We did not specifically test this.   2. Transfer the entire (162 μl) cDNA sample to a PLG tube.   3. Equal volumes (162 μl) of (25: 24: 1) phenol: chloroform: Isoamyl alcohol (10 mM Tris-HCL, pH 8.0 / 1 mM E (Saturated with DTA-Sigma).   4. Mix upside down (no stirring). PLG does not become part of the suspension . Microcentrifuge at full speed (12,000 xg or more) for 2 minutes.   5. Transfer the aqueous upper phase to a new 1.5 ml tube. PLG I is model number p1-175850, 2 for 5Prime-3Prime, Inc., 50. 00 is obtained from the model number p1-188233.   Microcon-50 purification   Other purification methods are being tested. Ethanol sedimentation was performed using Microcon-5. 0 purification. CAUTION: Microcon may leak. Spilled lotus All must be maintained.   1. Add 300 ul of 5 mM Tris, pH 7.5 to the sample.   2. According to the instructions supplied by Amicon, a Microcon-50 column (Microc Spin through an on-50 column, Amicon part number 42416) to concentrate.   3. Repeat the dilution / concentration three to four times, collect and observe the effluent in case of column failure. Put on   Concentrate to a final concentration of 5-10 ul and spin cartridge if possible Be careful not to let it dry. Collect upper layers.   In vitro transcription labeling with biotin   To maximize yield, Ambion's T3 (# 1338) or T7 (# 1334) Use the Megascript system (their proprietary buffers do not inhibit the polymerase) Allows higher nucleotide concentrations).   Perform IVT as suggested, but (1: 3) biotinylated: unlabeled C Use TP and UTP. T3 and T7 coming with Megascript kit Do not replace 10x nucleotides. Before proceeding, Ambion's detailed Read instructions for use and suggestions.   NTP label mix   For the preparation of an NTP mix for four IVT labeling reactions, Combining:   8 μl of Ambion T7 10 × ATP [75 mM]   8 μl of Ambion T7 10 × GTP [75 mM]   6 μl of Amblon T7 10 × CTP [75 mM]   6 μl of Ambion T7 10 × UTP [75 mM]   15 μl of Bio-11-CTP [10 mM] (ENZO # 42818)   15 μl of Bio-16-UTP [10 mM] (ENZO # 42814)   IVT labeling reaction   1. For each reaction, combine at room temperature-not on ice:     14.5 μl NTP label mix     2.0 μl of 10 × T7 transfer buffer (Ambion)     *1.5 μl ds cDNA (0.1-1 μg is optimal; see note below)     2.0 μl of 10 × T7 enzyme mix (Ambion) * Do not add more than 1 ug of cDNA to the IVT reaction. Higher concentration of DN A actually inhibits the reaction and lowers the yield. Final rNTP composition:     7.5 mM ATP     7.5 mM GTP     5.625 mM cold UTP / 1.875 mM bio-UTP     5.625 mM cold CTP / 1.875 mM bio-CTP   2. Incubate at 37 ° C. for 4-6 hours (for some transcripts, Alternatively, if maximum yield is not critical, a short incubation time is sufficient. ).   3. Store unused NTP labeling mix at -20 <0> C.   Clean up Optional DNase 1 treatment   1.1 μl RNase-free DNase I (provided with Ambion kit) ) Is added to each reaction and mixed well.   2. Incubate at 37 ° C for 15-20 minutes.Optional proteinase K treatment   This treatment combines with the chip and with streptavidin-phycoerythrin To reduce background caused by non-specific proteins Useful:   1. Add RNase-free water to the IVT reaction to a final volume of 99 ul .   2. Add 2 ul of Ambion 20 mg / ml proteinase K.   3. Incubate at 50 ° C for 20-30 minutes.   Microcon purification   Several other purification methods were tested-many methods remove enough rNTPs No or low yield. Carboxybead-based purification protocol Coal (Archana Nair) is very promising and is an alternative to microcon purification. It is used immediately.   Note: Set aside an aliquot of the IVT reaction before further purification. If you leave 1%, you can solve the trouble of this process if necessary .   1. Add 400 ul DEPC water to the sample and add Microcon-50 or -100 Concentrate the sample with (as suggested by Ambion). Maintain all effluent fractions.   2. Repeat dilution / concentration 3-4 times. The final volume is 10-100 μl.   3. Microcon filtration equipment leaks occasionally, so it is necessary to maintain all effluent fractions. Is appropriate. If the transcript RNA concentration in the retained / collected sample is much lower than expected To reconcentrate the effluent using a new column, then dilute, Reconcentrate.   Notes on yield   1. 4-5 ug of poly (A) for ds cDNA synthesis+Starting at IV A 20% purified ds cDNA sample was used for T except for the IVT reaction. Remove ~ 75-125 ug of labeled RNA.   2. Dilute in a final volume of 60-70 ul (for micro cuvettes) with water (or TE). Within the correct range (0.1-1 OD) by reading ~ 1% of the concentrated sample An absorbance reading was obtained. For accurate pipetting volume (> 1 μl) First, it is usually necessary to first make a series of diluents. For example, the user Make a 1/10 dilution of the RNA sample, then 10% in a final volume of 60-70 ul Measure the diluent. Ensure a blank reading in the same cuvette and Use the same buffer / water used to dilute the material.   3. Extra care should be taken from the IVT reaction for accurate quantification of labeled RNA. The nucleotides are sufficiently removed and A260Demonstrate not to be involved.   Microcon outflow is A260Need to be maintained and checked with respect to °. Significant If the absorbance at the end of the run is significant, a significant absorbance is detected at 260 nm. The RNA must be subjected to one more dilution and concentration until no longer occurs.   Inspection of unfragmented samples on gel   Before fragmentation, the labeled RNA is electrophoresed and the size distribution of the labeled transcripts is monitored. Sympathize. Samples were heated at 65 ° C. for 15 minutes and electrophoresed on agarose gel / TBE gel By electrophoresis, an almost ideal transcript size range was obtained. Enough space on the gel If present, two or three different types of both unpurified and purified IVT products Process the dilutions on the gel (-0.01%, 0.1% and 1% of each). 1xT Stain gel with Sybr Green II (FMC) at 1: 10,000 dilution in BE buffer (Higher sensitivity than ethidium bromide).   Alternatively, for a more accurate measurement of the size distribution of the RNA population before and after fragmentation Is run through a denaturing gel using a biotinylated RNA molecular weight marker (Ambion). And subject the sample to electrophoresis.Embodiment 15 FIG. Direct labeling of DNA with psoralen-biotin   The psoralen-biotin reagent is now lyophilized and is described in Rad-Free Universal  Oligo Labeling and Hybridization Kit ”(Schleicher & Schuell) And can be obtained separately. If you buy it with the kit, it will actually be cheaper. You can get kit components in minutes and save money. Rad-Free Universal Oligo Lab eling and Hybridization Kit: Model # 483122 (20 nmol psoralen -Containing biotin). Same kit with UV longwave 365nm lamp: # 48 3124.   1. The lyophilized psoralen-biotin reagent was spun down and the following:   a) Fragmented DNA / RNA or oligonucleotides are combined with several reagents (further Concentration is required), 14 ul of DMF or   b) 56ul DMF for limited labeling before fragmentation   Resuspend in Labeling gives similar results before and after fragmentation, but only This is not done in high concentrations of salt (> 20 mM) and should be performed before fragmentation. Easy.   2. RNA / DNA concentration was 0.5 ug / 10 ul (for 10 ug DNA 200 ul), adjust the salt to less than 20 mM. pH is no problem (pH 2.5 ~ 10) Therefore, sterile or DEP to resuspend or dilute RNA / DNA C water can be used. plus Mid DNA must be linearized. When RNA / DNA exists in high salt Is the appropriate size of microcon (microcon 3 works on fragmented material, ~ 70 min / cycle).   3. Boil the sample for 10 minutes and cool rapidly on ice (keep on ice for 5 minutes to 3 hours). [Important-If dsDNA is not separated before labeling, Will be bridged].   4. 1 ul psoralen-biotin per 20 ul DNA / RNA solution in low light Add reagent (resuspended in 56 ul DMF / ug DNA / RNA) Psoralen-biotin was 1 ul). Psoralen-biotin in 14ul If resuspended, dilute the amount required for labeling 1: 3 in DMF (1 ul concentrated Psoralen-biotin + 3 ul DMF).   5. Transfer the solution into the wells of a 96-microwell plate on ice (〜150 u 1 / well).   6. Push a 365 nm UV lamp so that the light source is at a distance of about 2 cm from the sample. Put directly on top of the rate. The sample is irradiated for 1 hour.   7. Transfer the sample to a microcentrifuge tube and add 2 volumes of HTwoO-saturated n-butanol To extract non-uptake psoralen-biotin. Stir / centrifuge 1 minute.   8. Discard the butanol (upper layer). Repeat extraction.   9. Fragment as usual. Denatured if normal before hybridization (10 minutes at 99-100 ° C). * Long UV irradiation does not improve the results. * Addition of more psoralen-biotin per ug of DNA / RNA I don't think the results will improve.Embodiment 16 FIG. Psoralen-biotin labeling experiment RNA labeling by standard protocol   Pool of four different fragmented RNA transcripts labeled with psoralen-biotin   Hybridization results with chip (5 pM each). The PB labeled target is It showed about 55-fold lower intensity than the IVT (bio-U + C) labeled target.   Before vs. post-fragmentation labeling   No significant difference was observed in the hybridization intensity.   Psoralen-biotin to RNA ratio   Hybridization on the chip even when labeled with a value 4 times higher than the ratio of PB: RNA There was no significant effect on the treatment intensity.   Labeling reaction time / UV lamp intensity   One to three hour labeling, or 15-20 mW / cm at 365 nmTwo(Affy run P) vs. 5-7 mW / cmTwo(S & S lamp) No significance was found in intensity .   Psoralen-biotin   Psoralen: a planar, tricyclic compound.   Psoralen-biotin: a psoralen conjugated to biotin via a 14 atom linker arm Laren.   High affinity for nucleic acids.   Inserts in DNA / RNA.   When irradiated with long-wave UV light, they become covalently bonded.Embodiment 17 FIG. Terminal transferase end labeling protocol   This protocol was tested and optimized using only the PRT 440S chip. .   DNase fragmentation   This is sufficient for four labeling reactions:   4 pmol of HIV PCR target (3.17 ug of 1.2 kb insert)                                     Xul   DNase (BRL) Xul (1 unit / ug)   Bovine alkaline phosphatase, 1 unit / ul (BRL)                               2.5ul (2.5 units / rx)   2.5 ul of diluted CAP buffer (BRL)   MgClTwo                        Xul (1.25 mM) HTwoO is good and 100ul   15 minutes at 37 ° C   10 minutes at 95 ° C   Keep at 4 ° C.   TdT sign   F-N6-ddATP, F-ddATP, F-ddCTP and F-ddUTP Are comparatively labeled in the reaction. We decided to use F-N6-ddATP Was.   Fragment DNA sample 25ul (1pmol)   5xTdT buffer (Boehringer) 20ul (1x)   25 mM CoClTwo(Boehringer) 10ul (2.5mM)   F-N6-ddATP (1 mM) 1 ul (10 uM)   TdT (25U / ul) (Boehringer) 1ul (25U / rx)   HTwoO 43ul   30 minutes at 37 ° C   5 minutes at 95 ° C   Keep at 4 ° C.   PRT 440S hybridization (Rela station)   Labeled sample 100ul   10xSSPE; 300ul of 0.1% Triton X-100   5 ul of control (100 nM) 213 oligo   HTwoO 195ul   30 minutes hybridization at 45 ° C.   6 × SSPE, 0.005% Triton X-100, washing at 20 ° C .; 4 cycles / 10 drain filling.   Scan tip at 530 nm. Pixel size 11.25um.Embodiment 18 FIG. Other labeling methods Ligation test   Biotin of A6 RNA oligonucleotide at 5 'end by RNA ligase Can directly label the RNA. Cre, a bacterial gene, is converted to T7RN Transcription was performed using A polymerase to generate antisense RNA. Cut RNA Fragmentation, kinase treatment with oligonucleotide kinase, and 5 'phosphorylation Generated a terminated end. Biotin A6 RNA was then ligated with T4 RNA . 5 pm of ligated RNA was inherited along with the labeled Cre and tested on the expression chip .   Direct labeling of 3 'RNA using poly A polymerase   Poly A polymerase cleaves a poly A tail on the free 3 'hydroxyl end of RNA. , Using ATP as a precursor for catalysis. Recently, poly A Polymerase has been successfully used on 3'RNA with CTP to generate a labeled target. Joomyeong Kim et al., (1995) Nucl. Acids Res., 23 (12): 2245-2 251 reported.   The advantage of this method is that the sense RNA (mRNA) is directly labeled with biotin CTP. It can be done. The consumption of CTP is reduced by a factor of 5 compared to the IVT reaction.Embodiment 19 FIG. Direct labeling protocol Reagent for direct labeling of mRNA     1) 200 μl of 100 μM rATP         198 μL DEPC HTwoO         2 μL (10 mM) rATP     2) 100 μg / ml BSA         NEB acetylated BSA     3) 30 mM DTT     4) 10 units / μL polynucleotide kinase         Boehringer Mannheim 3 'Phosphate Free Model # 83829     5) 1 nmol / μL BioA6         Genetic Institute     6) 5 units / μL T4 RNA ligase + 10 × T4 RNA ligase buffer         Epicentre Technologies, Model # LR5025     7) 5xRNA fragmentation buffer         200 mM Tris-acetate, pH 8.1         500 mM KOAc         150 mM MgOAc   Direct labeling protocol   Fragmentation       Add to 1.5ml sterile test tube           DEPC-HTwo8 μL poly (A) in O (1 μg)+RNA           2 μL 5xRNA fragmentation buffer       Heat at 94 ° C. for 35 minutes.       Kinase reaction       Add to 10 μL fragmented RNA:           2.4 μL rATP (100 μM)           2 μL BSA (100 μg / ml)           2 μL DTT (30 mM)           1.6 μL DEPC-HTwoO           2 μL polynucleotide kinase (10 units / μL)   Incubate at 37 ° C for 2.5 hours. Heat at 94 ° C for 2 minutes (by heating the enzyme Inactivated).   T4 RNA ligase reaction       Added to 20 μL kinase-treated RNA:           0.5 μL BioA6 (DEPC-HTwo1 nmol / μL in O)           3 μL rATP (19 mM)           3 μL 10 × T4 RNA ligase buffer           0.5 μL DEPC-HTwoO     Overnight to 2 days at 17 ° C. 2 minutes at 94 ° C.Embodiment 20 FIG. Target DNA sample hybridized or ligated to generic DNA array Computation to implement base calling for Creating a set of n-electronic tile arrays on an n-mer generic DNA sequence Resequencing of DNA targets by PCR   This method of resequencing the target is compatible with the standard resequencing GeneChip. This is the same as the method described above, except that a series of tile probes are physically Unlike a generic GeneChip that is arranged in a generic way, a generic GeneChip is used to From the generic array (the generic array contains possible n-mer sequences) The right plow By retrieving the block information, a set of n-tile arrays is electronically reconstructed. Outline In order to resequence the target DNA, the target is It is decomposed into a mer complementary word spectrum. For each tile probe, On the generic chip (the generic chip contains the nearest neighbor of the highest floor) The "nearest neighbor" tile probe (a probe containing a single base substitution) Exists. This step involves tiling with a target sequence having n-mer words. (FIG. 24). To make a base call at a given location within the target, Compare the intensity of a tile probe with its "nearest neighbor" intensity at that location . Because single base substitutions occur at different positions in the probe, n sets of such " The nearest neighbor exists. Base substitution at a specific position in the probe that produces the highest intensity Is the base called for that position in the probe (FIG. 25). Standard Example The advantage of using a generic DNA array over GeneChip is that each base of the target A high degree of redundancy is achieved for calls. The n-mer generic array is Makes n base calls to each base in the target, but typically involves resequencing G The eneChip makes only single base calls.   The final base call of the target base is derived from n different electronic tilings of each target position. It is determined by electronic voting of base calling (FIG. 26).   Obtained from n electronic tile arrays to filter out incorrect electronic tiles Empirical use of base calling accuracy   A given reference DNA sample was hybridized / ligated to a generic DNA array. A set of n electronic tiles was created and the corresponding base calls were made. Default tile If the substitution series calls the correct base call, score 1, base call is accurate When there was no score, the score was set to 0 and an accuracy score table was constructed (FIG. 27). Any default For base calling The confidence level for a given base call is determined for each Added to points.   The various DNA samples are then hybridized / ligated to a second generic DNA array. Was. A further set of n electronic tiles has been generated, except that at this point the Discard all tiles with cores and only bases with accuracy score 1 It was included in the voting procedure (FIG. 28). The result is the overall percentage of exact base calls Was improved dramatically.   Comparison of the “local” normalized tile probe intensities between the reference sample and the mutant This is a highly sensitive method for detecting mutations.   For a given n-mer generic array, as the target complexity increases, the target The ability to correctly resequence is reduced. As target complexity increases, The number of n-mer tile probes that repeat themselves at Crosstalk between neighboring neighbors is increased, and overall cross-hybridization Increase. All of these factors are involved in base miscall in the target. three The comparison of the sample target to the control target is done by filtering out any non-specific noise due to redetection. Provides a powerful way to "take".   One way to compare between reference and sample is to compare the tile probe itself It is. However, before performing a direct comparison, normalize the intensity in several ways. Must account for chip-to-chip and sample-to-sample variation. I, The signal was normalized using a "local" normalization method. By "local" normalization Easily, you can divide the strength of the tile probe by the sum of the strengths of its nearest neighbors (FIG. 29).   This method of normalization results in good signal tracking between samples, resulting in a "bubble" Highly sensitive to the presence of mutations indicated by the formation of Is high (FIG. 30). This “local” normalized tile probe comparison further Analysis and finishing in a format where the presence of mutations is more easily visualized be changed.   Induced difference method for detecting mutations   Another method that uses a comparison between a reference and a sample to shed mutations is to use tile This is due to a mutagenic "induced" difference between the probe and its nearest neighbor. An application of this method to first-order nearest neighbor tile analysis is to use "local normalization" in the reference target. "Compare the probe with the corresponding probe in the sample target. Misco base To be controlled, tiles that are not informative in Part II are A probe member in the probe was induced between the reference and sample (increase or decrease in intensity). (Caused), indicating the presence of the mutation (FIG. 31). these The guidance is the sum of the good tiles on the forward and reverse chains relative to the default target location. Are the measurements of whether a mutation is present (FIGS. 32, 3 3).Embodiment 21 FIG. Increased duplex stability on generic ligated GeneChip, resulting in increased On the 5 'end of the MenPoc synthetic probe to increase the resulting ligation signal Use of inosine   Degenerate bases to increase duplex stability, such as inosine (all other bases We investigated the use of the addition of a pair with a) to the end of the MenPoc synthetic probe. . Indeed, the addition of 1-6 inosine on the end of the probe is a result of the generic ligation GeneC The signal intensity of both the hybridization and ligation reactions on the We have found that it has increased.   Inosine (0-6) was placed at the 5 'end of the probe during manufacture and these terminal The action of syn was determined by DNase I digestion, TdT labeling 78 The assay was performed by ligating the 8 bp DNA fragment to the chip. 2-6 inosine The increase in brightness when used indicated an increase in duplex stability. Six inosines When used, a slight decrease in strength was observed compared to 2-4 inosines, This is because the terminal inosine probably began to form a quaternary secondary structure.Embodiment 22 FIG. T4 ligase and T when used on Generic Ligation GeneChip Comparison between specificities of aq ligase   T4 ligase or Taq ligase targeted against generic ligated GeneChip We examined whether it was more specific to ligate. Use Taq ligase To do so, the ligation reaction had to be performed at 40 ° C. or higher. But Therefore, to increase the thermal stability of the duplex, six We used an 8mer chip with the following inosine. As a result, at 44 ° C., T Performing the aq ligase reaction and comparing it to the T4 ligation reaction at 37 ° C. did it. The results show that Taq is more specific than T4 ligase, A set of target ends that cannot be ligated were ligated.   Taq does not illuminate much of the feature, but is more intense than T4, This indicates the specificity of Taq versus T4.   Intensity profiling of tile probe and closest neighbor replacement at predefined locations within the target Is that Taq is more specific than T4. This shows that the signal intensity is detected by the probe. Examples described herein And the embodiments are illustrative and various modifications or changes in that regard. Are suggested to those skilled in the art, and they are intended to cover the spirit and scope of the present application and the appended claims. It is understood to be included in the scope. Publications, patents, patent applications cited herein Are all incorporated herein by reference.

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(KE,LS,MW,SD,S Z,UG),EA(AM,AZ,BY,KG,KZ,MD ,RU,TJ,TM),AL,AM,AT,AU,AZ ,BA,BB,BG,BR,BY,CA,CH,CN, CU,CZ,DE,DK,EE,ES,FI,GB,G E,HU,IL,IS,JP,KE,KG,KP,KR ,KZ,LC,LK,LR,LS,LT,LU,LV, MD,MG,MK,MN,MW,MX,NO,NZ,P L,PT,RO,RU,SD,SE,SG,SI,SK ,TJ,TM,TR,TT,UA,UG,US,UZ, VN (72)発明者 チー,マーク アメリカ合衆国,カリフォルニア 94306, パロ アルト,ウェバーリー ストリート 3199 (72)発明者 ガンダーソン,ケビン アメリカ合衆国,カリフォルニア 94303, パロ アルト,タンランド ドライブ 103 1090 (72)発明者 レイ,チャオキアン アメリカ合衆国,カリフォルニア 95051, サンタ クララ,ハルフォード アベニュ #230 1901 (72)発明者 ウォディカ,リサ アメリカ合衆国,カリフォルニア 95051, サンタ クララ,フロラ ビスタ #603 3770 (72)発明者 クロニン,マウリーン ティー. アメリカ合衆国,カリフォルニア 94024, ロス アルトス,アンダーソン ドライブ 771 (72)発明者 リー,ダンニー アメリカ合衆国,カリフォルニア 95118, サン ジョセ,リ フランク ドライブ 5520 (72)発明者 トラン,ヒュ エム. アメリカ合衆国,カリフォルニア 95117, サン ジョセ,カペ コド コート #1 3697 (72)発明者 マツザキ,ハジメ アメリカ合衆国,カリフォルニア 94306, パロ アルト,ケンダル アベニュ #26 562 (72)発明者 マックガル,グレン エイチ. アメリカ合衆国,カリフォルニア 94041, マウンテンビュー,ノース ショーライン ボウレバード 750 (72)発明者 バロン,アンソニー ディー. アメリカ合衆国,カリフォルニア 95125, サン ジョセ,エレン アベニュ 2118────────────────────────────────────────────────── ─── Continuation of front page    (81) Designated countries EP (AT, BE, CH, DE, DK, ES, FI, FR, GB, GR, IE, IT, L U, MC, NL, PT, SE), OA (BF, BJ, CF) , CG, CI, CM, GA, GN, ML, MR, NE, SN, TD, TG), AP (KE, LS, MW, SD, S Z, UG), EA (AM, AZ, BY, KG, KZ, MD , RU, TJ, TM), AL, AM, AT, AU, AZ , BA, BB, BG, BR, BY, CA, CH, CN, CU, CZ, DE, DK, EE, ES, FI, GB, G E, HU, IL, IS, JP, KE, KG, KP, KR , KZ, LC, LK, LR, LS, LT, LU, LV, MD, MG, MK, MN, MW, MX, NO, NZ, P L, PT, RO, RU, SD, SE, SG, SI, SK , TJ, TM, TR, TT, UA, UG, US, UZ, VN (72) Inventor Chi, Mark             United States of America, California 94306,             Palo Alto, Webbery Street               3199 (72) Inventor Gunderson, Kevin             United States of America, California 94303,             Palo Alto, Tunland Drive             103 1090 (72) Inventor Ray, Chao Kian             United States of America, California 95051,             Santa Clara, Halford Avenue               # 230 1901 (72) Inventor Wodica, Lisa             United States of America, California 95051,             Santa Clara, Flora Vista # 603               3770 (72) Inventor Clonin, Maureen tea.             United States of America, California 94024,             Los Altos, Anderson Drive               771 (72) Inventor Lee, Danney             United States, California 95118,             San Jose, Li Frank Drive             5520 (72) Inventor Tran, Huem.             United States, California 95117,             Sao Jose, Cape Cod Court # 1               3697 (72) Inventors Matsuzaki, Hajime             United States of America, California 94306,             Palo Alto, Kendall Avenue # 26               562 (72) McGull, Glen H. Inventors.             United States of America, California 94041,             Mountain View, North Showline               Bow levered 750 (72) Inventor Baron, Anthony Dee.             United States, California 95125,             Saint Joseph, Ellen Avenue 2118

Claims (1)

【特許請求の範囲】 1.2つ又はそれ以上の核酸試料間の核酸レベルの差異の確認方法であって、 (a)表面に付加されたプローブオリゴヌクレオチドを包含する1つ又はそれ 以上のオリゴヌクレオチドアレイを提供し; (b)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして 、上記核酸試料中の核酸と上記の核酸又はその部分列と相補的である上記の1つ 又はそれ以上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二 重鎖を形成し; (c)上記の1つ又はそれ以上のアレイを核酸リガーゼと接触させ;そして (d)ハイブリダイゼーションの上記差異が上記核酸レベルの差異を示す上記 核酸試料間のハイブリダイゼーションの差異を確定する; 工程を含んで成る方法。 2.上記オリゴヌクレオチドアレイを1つ又はそれ以上の結紮可能オリゴヌク レオチドと接触させることをさらに包含する請求項1の方法。 3.上記結紮可能オリゴヌクレオチドが予選択長の考え得るすべてのオリゴヌ クレオチドのプールである請求項2の方法。 4.上記確定が上記アレイに付着する1つ又はそれ以上の上記結紮可能オリゴ ヌクレオチドを検出することを包含する請求項2の方法。 5.上記1つ又はそれ以上のアレイが少なくとも2つのアレイであって、上記 アレイがプローブオリゴヌクレオチド組成物中で本質的に同一である請求項1の 方法。 6.上記プローブオリゴヌクレオチドの空間的配置が本質的に上記アレイと同 一である請求項5の方法。 7.上記核酸試料の各々が実質的に同一プローブオリゴヌクレオチド組成を有 する異なるアレイとハイブリダイズされる請求項1の方法。 8.2つ又はそれ以上の上記核酸試料が単一オリゴヌクレオチドアレイとハイ ブリダイズされる請求項1の方法。 9.上記核酸試料が単一オリゴヌクレオチドアレイと同時にハイブリダイズさ れる請求項8の方法。 10.上記プローブオリゴヌクレオチドが予選択ヌクレオチドで互いに異なる プローブオリゴヌクレオチドの対である請求項1の方法。 11.上記プローブオリゴヌクレオチド対が単一ヌクレオチドで互いに異なる 請求項10の方法。 12.上記確定が上記プローブオリゴヌクレオチド対の成員間の試料核酸ハイ ブリダイゼーション強度の差異を確定することを包含する請求項10の方法。 13.2つ又はそれ以上の核酸試料間の核酸レベルの差異を確認する方法であ って、 (a)定常領域及び可変領域から成る上記プローブオリゴヌクレオチドを包含 する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し; (b)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして 、上記核酸試料中の核酸と上記核酸又はその部分列と相補的である上記可変領域 との間にハイブリッド二重鎖を形成し;そして (c)上記ハイブリダイゼーションの差異が上記核酸レベルの差 異を示す上記核酸試料間のハイブリダイゼーションの差異を確定する; 工程を含んで成る方法。 14.上記可変領域が約3ヌクレオチド〜約50オリゴヌクレオチドの長さで 変化する請求項13の方法。 15.上記プローブオリゴヌクレオチドの可変領域が予選択長の考え得るすべ てのオリゴヌクレオチドを包含する請求項13の方法。 16.上記可変領域が少なくとも5ヌクレオチドの長さである請求項15の方 法。 17.上記定常領域が3ヌクレオチド〜約25ヌクレオチドの長さの範囲であ る請求項13の方法。 18.上記定常領域が制限エンドヌクレアーゼの認識部位のセンス又はアンチ センス配列と相補的なヌクレオチド配列を包含する請求項13の方法。 19.上記オリゴヌクレオチドアレイを上記定常領域又はその部分列と相補的 な定常オリゴヌクレオチドと接触させることをさらに包含する請求項13の方法 。 20.上記アレイをリガーゼと接触させることを包含する請求項19の方法。 21.上記確定が上記定常オリゴヌクレオチドに付加された上記核酸試料の核 酸を検出することを包含する請求項19の方法。 22.上記プローブオリゴヌクレオチドが予選択ヌクレオチドで互いに異なる プローブオリゴヌクレオチドの対である請求項13の方法。 23.上記確定が上記プローブオリゴヌクレオチド対の成員間の試料核酸ハイ ブリダイゼーション強度の差を確定することを包含す る請求項22の方法。 24.2つ又はそれ以上の核酸試料間の核酸レベルの差異を確認する方法であ って、 (a)プローブオリゴヌクレオチドの各対の成員が予選択ヌクレオチドで互い に異なるプローブオリゴヌクレオチドの対を包含するオリゴヌクレオチドの1つ 又はそれ以上のアレイを提供し; (b)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして 、上記核酸試料中の核酸と上記核酸又はその部分列と相補的である上記の1つ又 はそれ以上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重 鎖を形成し;そして (c)ハイブリダイゼーションの差異が上記核酸レベルの差異を示す上記核酸 試料間のハイブリダイゼーションの差異を確定する; 工程を含んで成る方法。 25.上記プローブオリゴヌクレオチドの各対の成員が中央に位置するヌクレ オチドで互いに異なる請求項24の方法。 26.2つ又はそれ以上の核酸試料間の核酸レベルの差異の確認方法であって 、 (a)100以上の異なるプローブオリゴヌクレオチドを包含し; 異なるプローブオリゴヌクレオチドの各々がアレイの予定領域に位置し; 異なるプローブオリゴヌクレオチドの各々が末端共有結合を介して表面に付加 され; 上記異なるプローブオリゴヌクレオチドの密度が約60以上/cmである オリゴヌクレオチドアレイの1つ又はそれ以上のアレイを提供し; (b)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブ リダイズして上記核酸試料中の核酸と上記核酸又はその部分列と相補的な1つ又 はそれ以上の上記アレイ中のプローブオリゴヌクレオチドとの間にハイブリッド 二重鎖を形成し; (c)上記ハイブリダイゼーションの差が上記核酸レベルの差を示す上記核酸 試料間のハイブリダイゼーションの差異を確定する; 工程を含んで成る方法。 27.上記の1つ又はそれ以上のオリゴヌクレオチドアレイをリガーゼと接触 させることをさらに包含する請求項26の方法。 28.2つ又はそれ以上の核酸試料間の核酸レベルの差異の確認方法であって 、 (a)特定予選択遺伝子又はmRNA由来の核酸とハイブリダイズするのに選 択されないプローブオリゴヌクレオチドを各々包含する1つ又はそれ以上のオリ ゴヌクレオチドアレイを提供し; (b)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして 、上記核酸試料中の核酸と上記核酸又はその部分列と相補的である上記の1つ又 はそれ以上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重 鎖を形成し;そして (c)上記ハイブリダイゼーションの差異が上記核酸レベルの差異を示す上記 核酸試料間のハイブリダイゼーションの差異を確定する; 工程を含んで成る方法。 29.上記プローブオリゴヌクレオチドが予選択ヌクレオチドで互いに異なる プローブオリゴヌクレオチドの対である請求項28の方法。 30.上記確定が上記プローブオリゴヌクレオチド対の成員間の試料核酸ハイ ブリダイゼーション強度の差異を確定することを包含する請求項29の方法。 31.2つ又はそれ以上の核酸試料間の核酸レベルの差異の確認方法であって 、 (a)無作為選択、偶発的選択、ヌクレオチド組成偏向選択から成る群から選 択される方法により選択されるヌクレオチド配列又は部分列を包含するプローブ オリゴヌクレオチド及び予選択長の考え得るすべてのオリゴヌクレオチドを各々 包含する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し; (b)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして 、上記核酸試料中の核酸と上記核酸又はその部分列と相捕的である上記の1つ又 はそれ以上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重 鎖を形成し;そして (c)上記ハイブリダイゼーションの差異が上記核酸レベルの差異を示す上記 核酸試料間のハイブリダイゼーションの差異を確定する; 工程を含んで成る方法。 32.上記ヌクレオチド配列又はヌクレオチド部分列が以下の:考え得るすべ ての6mers、考え得るすべての7mers、考え得るすべての8mers、 考え得るすべての9mers、考え得るすべての10mers、考え得るすべて の11mers及び考え得るすべての12mersから成る群から選択される特 定長の考え得るすべてのオリゴヌクレオチドである請求項31の方法。 33.多数の遺伝子の発現の同時モニタリング方法であって、 (a)1つ又はそれ以上の上記遺伝子のRNA転写体を包含する標的核酸又は 上記RNA転写体由来の核酸のプールを提供し; (b)上記核酸のプールを表面に固定されたプローブオリゴヌクレオチドを包 含するオリゴヌクレオチドアレイとハイブリダイズし (c)上記オリゴヌクレオチドアレイをリガーゼと接触させ;そして (d)上記核酸と上記アレイのハイブリダイゼーションを定量し、上記定量が 上記遺伝子の転写のレベルの測定を提供する; 工程を含んで成る方法。 34.上記プローブオリゴヌクレオチドが1つ又はそれ以上の上記遺伝子の予 選択RNA転写体と相補的なヌクレオチド配列又はヌクレオチド部分列、あるい は上記RNA転写体由来の核酸を包含する請求項33の方法。 35.多数の遺伝子の発現の同時モニタリング方法であって、 (a)定常領域及び可変領域から成る上記プローブオリゴヌクレオチドを包含 する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し; (b)1つ又はそれ以上の上記遺伝子のRNA転写体を包含する標的核酸、又 は上記RNA転写体由来の核酸のプールを提供し; (c)核酸の上記プールをオリゴヌクレオチドプローブのアレイとハイブリダ イズし;そして (d)上記核酸と上記アレイのハイブリダイゼーションを定量し、上記定量が 上記遺伝子の転写のレベルの測定を提供する; 工程を含んで成る方法。 36.上記プローブオリゴヌクレオチドが1つ又はそれ以上の上記遺伝子の予 選択RNA転写体と相補的なヌクレオチド配列又はヌクレオチド部分列あるいは 上記RNA転写体由来の核酸を包含する請求項35の方法。 37.2つ又はそれ以上の核酸試料間の核酸レベルの差異を確認するための核 酸アレイの作製方法であって、 (a)定常領域及び可変領域から成るプローブオリゴヌクレオチ ドを包含するオリゴヌクレオチドアレイを提供し; (b)1つ又はそれ以上の上記核酸試料を上記アレイとハイブリダイズして上 記可変領域と、上記可変領域と相補的な部分列を包含する上記核酸試料中の核酸 とのハイブリッド二重鎖を形成し; (c)上記ハイブリッド二重鎖を包含する試料核酸を上記プローブオリゴヌク レオチドアレイに付着させ;そして (d)非付着核酸を除去して上記アレイに付加された試料核酸を保有する高密 度オリゴヌクレオチドアレイを提供する; 工程を含んで成る方法。 38.2つ又はそれ以上の核酸試料間の核酸レベルの差異を確認するための核 酸アレイの作製方法であって、 (a)100以上の異なるプローブオリゴヌクレオチドを包含し; 各々の異なるプローブオリゴヌクレオチドは、アレイの予定領域に位置し; 各々の異なるプローブオリゴヌクレオチドは末端共有結合を介して表面に付着 され; 上記異なるプローブオリゴヌクレオチドの密度は1cm2当たり約60以上であ る アレイを提供し; (b)上記アレイを上記の2つ又はそれ以上の核酸試料のうちの1っ又はそれ 以上のと接触させて、それにより上記の2つ又はそれ以上の核酸試料のうちの一 つの核酸が上記アレイ中でプローブオリゴヌクレオチドとハイブリッド二重鎖を 形成し; (c)上記ハイブリッド二重鎖を包含する試料核酸を上記プローブオリゴヌク レオチドアレイに付着させ;そして (d)非付着核酸を除去して上記アレイに付加された試料核酸を 保有する高密度オリゴヌクレオチドアレイを提供する 工程を包含する方法。 39.2つ又はそれ以上の核酸試料間の核酸レベルの差を確認するためのキッ トであって、 表面に付加されたプローブオリゴヌクレオチドを包含する1つ又はそれ以上の オリゴヌクレオチドアレイを含入する容器;及び リガーゼを含入する容器; を含んで成るキット。 40.2つ又はそれ以上の核酸試料間の核酸レベルの差を確認するためのキッ トであって、 定常領域及び可変領域から成るプローブオリゴヌクレオチドを包含する1つ又 はそれ以上のオリゴヌクレオチドアレイを含入する容器 を含んで成るキット。 41.上記定常領域又はその部分列と相補的な定常オリゴヌクレオチドをさら に包含する請求項40のキット。 42.以下の工程: (a)核酸を提供し; (b)上記核酸を増幅してアンプリコンを形成し; (c)上記のアンプリコンを断片化して上記アンプリコンの断片を形成し;そ して (d)標識部分を少なくとも1つの上記断片と結合させる; を含んで成る核酸の標識方法。 43.以下の工程: (a)核酸を提供し; (b)上記核酸を転写して転写核酸を形成し; (c)上記転写核酸を断片化して上記転写核酸の断片を形成し; そして (d)標識部分を少なくとも1つの上記の断片と結合させる; を含んで成る核酸の標識方法。 44.以下の工程: (a)支持体と結合する少なくとも1つの核酸を提供し; (b)上記核酸にターミナルトランスフェラーゼで結合され得る標識部分を提 供し; (c)上記ターミナルトランスフェラーゼを提供し;そして (d)上記ターミナルトランスフェラーゼを用いて上記標識部分を上記核酸と 結合させる; を含んで成る核酸の標識方法。 44.以下の工程: (a)支持体と結合する少なくとも2つの核酸を提供し; (b)上記核酸のモノマー単位の数を増大して上記の少なくとも2つの核酸上 に共通核酸尾部を形成し; (c)上記共通核酸尾部を認識し得る標識部分を提供し;そして (d)上記の共通核酸尾部及び上記の標識部分を接触させる; を含んで成る核酸の標識方法。 45.以下の工程: (a)支持体と結合する少なくとも1つの核酸を提供し; (b)上記核酸にリガーゼを用いて結合され得る標識部分を提供し; (c)上記リガーゼを提供し;そして (d)上記標識部分をリガーゼを用いて上記核酸部分に結合させる; を含んで成る核酸の標識方法。 46.次式: (式中、R1は水素、ヒドロキシル、リン酸結合又はリン酸基であり; R2は水素又はヒドロキシルであり; R3は水素、ヒドロキシル、リン酸結合又はリン酸基であり;そして R4は結合標識化部分である) を有する化合物。 47.次式:(式中、R1は水素、ヒドロキシル、リン酸結合又はリン酸基であり; R2は水素又はヒドロキシルであり; R3は水素、ヒドロキシル、リン酸結合又はリン酸基であり;そして R4は結合標識化部分である) を有する化合物。 48.2つ又はそれ以上の核酸試料間の核酸レベルの差異の確認方法であって 、 (a)無作為選択、偶発的選択、ヌクレオチド組成偏向選択から成る群から選 択される方法により選択されるヌクレオチド配列又は部分列を包含するプローブ オリゴヌクレオチド及び予選択長の考え得るすべてのオリゴヌクレオチドを各々 包含する1つ又はそれ以上のオリゴヌクレオチドアレイを提供し; (b)上記アレイ上のプローブオリゴヌクレオチドの位置及び配列を記載する ソフトウエアを提供し; (c)上記核酸試料を上記の1つ又はそれ以上のアレイとハイブリダイズして 、上記核酸試料中の核酸と上記核酸又はその部分列と相補的である上記の1つ又 はそれ以上のアレイ中のプローブオリゴヌクレオチドとの間にハイブリッド二重 鎖を形成し;そして (d)上記ハイブリダイジングが上記核酸レベルの差異を示すように上記ソフ トウエアを操作する; 工程を含んで成る方法。Claims 1. A method for confirming a difference in nucleic acid level between two or more nucleic acid samples, comprising: (a) one or more oligonucleotides including a probe oligonucleotide attached to a surface; Providing a nucleotide array; (b) hybridizing the nucleic acid sample with the one or more arrays described above, wherein the nucleic acid in the nucleic acid sample is complementary to the nucleic acid or the nucleic acid or a subsequence thereof. Forming a hybrid duplex between one or more probe oligonucleotides in the array; (c) contacting the one or more arrays with a nucleic acid ligase; Determining a difference in hybridization between said nucleic acid samples, wherein the difference indicates a difference in said nucleic acid level. 2. 2. The method of claim 1, further comprising contacting the oligonucleotide array with one or more ligatable oligonucleotides. 3. 3. The method of claim 2, wherein said ligatable oligonucleotide is a pool of all possible oligonucleotides of a preselected length. 4. 3. The method of claim 2, wherein said determining comprises detecting one or more of said ligatable oligonucleotides attached to said array. 5. 2. The method of claim 1, wherein said one or more arrays are at least two arrays, wherein said arrays are essentially identical in a probe oligonucleotide composition. 6. 6. The method of claim 5, wherein the spatial arrangement of said probe oligonucleotides is essentially the same as said array. 7. 2. The method of claim 1, wherein each of said nucleic acid samples is hybridized to a different array having substantially the same probe oligonucleotide composition. 8. The method of claim 1, wherein two or more of said nucleic acid samples are hybridized to a single oligonucleotide array. 9. 9. The method of claim 8, wherein said nucleic acid sample is hybridized simultaneously with a single oligonucleotide array. 10. The method of claim 1, wherein said probe oligonucleotides are pairs of probe oligonucleotides that differ from each other in preselected nucleotides. 11. 11. The method of claim 10, wherein said probe oligonucleotide pairs differ from each other by a single nucleotide. 12. 11. The method of claim 10, wherein said determining comprises determining a difference in sample nucleic acid hybridization intensity between members of said probe oligonucleotide pair. 13. A method for determining the difference in nucleic acid levels between two or more nucleic acid samples, comprising: (a) one or more oligonucleotide arrays comprising said probe oligonucleotides consisting of a constant region and a variable region (B) hybridizing the nucleic acid sample with one or more of the arrays described above, and between the nucleic acid in the nucleic acid sample and the variable region that is complementary to the nucleic acid or a subsequence thereof. And c) determining a hybridization difference between said nucleic acid samples wherein said hybridization difference is indicative of said nucleic acid level difference. 14. 14. The method of claim 13, wherein said variable region varies in length from about 3 nucleotides to about 50 oligonucleotides. 15. 14. The method of claim 13, wherein the variable region of the probe oligonucleotide comprises all possible oligonucleotides of a preselected length. 16. 16. The method of claim 15, wherein said variable region is at least 5 nucleotides in length. 17. 14. The method of claim 13, wherein said constant region ranges from 3 nucleotides to about 25 nucleotides in length. 18. 14. The method of claim 13, wherein said constant region comprises a nucleotide sequence complementary to a sense or antisense sequence at a recognition site for a restriction endonuclease. 19. 14. The method of claim 13, further comprising contacting the oligonucleotide array with a constant oligonucleotide complementary to the constant region or a substring thereof. 20. 20. The method of claim 19, comprising contacting said array with a ligase. 21. 20. The method of claim 19, wherein said determining comprises detecting a nucleic acid of said nucleic acid sample added to said constant oligonucleotide. 22. 14. The method of claim 13, wherein said probe oligonucleotides are pairs of probe oligonucleotides that differ from each other in preselected nucleotides. 23. 23. The method of claim 22, wherein said determining comprises determining a difference in sample nucleic acid hybridization intensity between members of said probe oligonucleotide pair. 24. A method for determining the difference in nucleic acid levels between two or more nucleic acid samples, comprising: (a) each pair of probe oligonucleotides comprises a pair of probe oligonucleotides that differ from one another by preselected nucleotides. Providing one or more arrays of oligonucleotides; (b) hybridizing the nucleic acid sample with the one or more arrays to provide a nucleic acid in the nucleic acid sample and the nucleic acid or a subsequence thereof; Forming a hybrid duplex with the probe oligonucleotides in the one or more arrays that are complementary; and (c) between the nucleic acid samples wherein differences in hybridization indicate differences in the nucleic acid levels. Determining the hybridization difference of the method. 25. 25. The method of claim 24, wherein the members of each pair of said probe oligonucleotides differ from one another by a centrally located nucleotide. 26. A method for determining a difference in nucleic acid levels between two or more nucleic acid samples, comprising: (a) including 100 or more different probe oligonucleotides; each of the different probe oligonucleotides being located in a predetermined area of the array. Providing one or more arrays of oligonucleotide arrays wherein each of the different probe oligonucleotides is added to the surface via a terminal covalent bond; wherein the density of said different probe oligonucleotides is about 60 or more / cm; (B) the nucleic acid sample is hybridized to the one or more arrays and the nucleic acid in the nucleic acid sample and one or more probe oligos in the array complementary to the nucleic acid or a subsequence thereof; (C) forming a hybrid duplex with nucleotides; The method comprising the steps; to determine the differences in the hybridization between the nucleic acid sample indicating the difference in level. 27. 27. The method of claim 26, further comprising contacting said one or more oligonucleotide arrays with a ligase. 28. A method for confirming a difference in nucleic acid level between two or more nucleic acid samples, comprising: (a) a probe oligonucleotide that is not selected to hybridize with a nucleic acid derived from a specific preselection gene or mRNA; Providing one or more oligonucleotide arrays; (b) hybridizing the nucleic acid sample with the one or more arrays to complement a nucleic acid in the nucleic acid sample with the nucleic acid or a subsequence thereof. Forming a hybrid duplex with the probe oligonucleotides in the one or more arrays, wherein the hybridization differences are indicative of the nucleic acid level differences. Determining the hybridization difference of the method. 29. 29. The method of claim 28, wherein said probe oligonucleotides are pairs of probe oligonucleotides that differ from each other in preselected nucleotides. 30. 30. The method of claim 29, wherein said determining comprises determining a difference in sample nucleic acid hybridization intensity between members of said probe oligonucleotide pair. 31. A method for confirming differences in nucleic acid levels between two or more nucleic acid samples, comprising: (a) selected by a method selected from the group consisting of random selection, accidental selection, and nucleotide composition bias selection. Providing one or more oligonucleotide arrays each comprising a probe oligonucleotide comprising a nucleotide sequence or subsequence and all possible oligonucleotides of a preselected length; (b) providing said nucleic acid sample with one of said one Or hybridizing with one or more arrays to form a hybrid hybrid between the nucleic acid in the nucleic acid sample and the probe oligonucleotide in the one or more arrays that is complementary to the nucleic acid or a subsequence thereof. Forming a heavy chain; and (c) a high level between said nucleic acid samples wherein said hybridization difference indicates a difference in said nucleic acid level. Determining the difference in Lida homogenization; comprising the step. 32. The nucleotide sequence or nucleotide subsequence is as follows: all possible 6 mers, all possible 7 mers, all possible 8 mers, all possible 9 mers, all possible 10 mers, all possible 11 mers and all possible 32. The method of claim 31, which is all possible oligonucleotides of a particular length selected from the group consisting of: 33. A method for simultaneous monitoring of the expression of multiple genes, comprising: (a) providing a target nucleic acid comprising one or more RNA transcripts of said gene or a pool of nucleic acids derived from said RNA transcript; Hybridizing the pool of nucleic acids with an oligonucleotide array containing probe oligonucleotides immobilized on its surface; (c) contacting the oligonucleotide array with a ligase; and (d) quantifying hybridization of the nucleic acid with the array. And wherein said quantifying provides a measure of the level of transcription of said gene. 34. 34. The method of claim 33, wherein said probe oligonucleotide comprises a nucleotide sequence or nucleotide subsequence complementary to a preselected RNA transcript of one or more of said genes, or a nucleic acid from said RNA transcript. 35. A method for the simultaneous monitoring of the expression of multiple genes, comprising: (a) providing one or more oligonucleotide arrays comprising said probe oligonucleotides consisting of constant and variable regions; (b) one or more thereof. (C) hybridizing the pool of nucleic acids to an array of oligonucleotide probes; and (d) hybridizing the pool of nucleic acids from the RNA transcript. Quantifying the hybridization of the nucleic acid to the array, wherein the quantification provides a measure of the level of transcription of the gene. 36. 36. The method of claim 35, wherein said probe oligonucleotide comprises a nucleotide sequence or nucleotide subsequence complementary to a preselected RNA transcript of one or more of said genes or a nucleic acid from said RNA transcript. 37. A method for preparing a nucleic acid array for confirming a difference in nucleic acid level between two or more nucleic acid samples, comprising: (a) an oligonucleotide array including a probe oligonucleotide comprising a constant region and a variable region; (B) hybridizing one or more of the nucleic acid samples with the array to hybridize the variable region with a nucleic acid in the nucleic acid sample that includes a subsequence complementary to the variable region. Forming a heavy chain; (c) attaching the sample nucleic acid containing the hybrid duplex to the probe oligonucleotide array; and (d) removing the non-attached nucleic acid and retaining the sample nucleic acid added to the array. Providing a high density oligonucleotide array that comprises: 38. A method of making a nucleic acid array for determining a difference in nucleic acid levels between two or more nucleic acid samples, comprising: (a) including 100 or more different probe oligonucleotides; Is located in a predetermined area of the array; each different probe oligonucleotide is attached to the surface via a terminal covalent bond; providing an array wherein the density of the different probe oligonucleotides is about 60 or more per cm 2 ; b) contacting said array with one or more of said two or more nucleic acid samples so that the nucleic acid of one of said two or more nucleic acid samples is in said array (C) forming a hybrid nucleic acid with the probe oligonucleotide in the sample; Attaching to the probe oligonucleotide array; and (d) removing non-attached nucleic acids to provide a high density oligonucleotide array carrying sample nucleic acids added to the array. 39. A kit for determining a difference in nucleic acid level between two or more nucleic acid samples, comprising one or more oligonucleotide arrays including probe oligonucleotides attached to a surface. A kit comprising: a container; and a container containing the ligase. 40. A kit for determining differences in nucleic acid levels between two or more nucleic acid samples, the kit comprising one or more oligonucleotide arrays comprising a probe oligonucleotide consisting of a constant region and a variable region. A kit comprising a container to be filled. 41. 41. The kit of claim 40, further comprising a constant oligonucleotide complementary to said constant region or a substring thereof. 42. (A) providing a nucleic acid; (b) amplifying the nucleic acid to form an amplicon; (c) fragmenting the amplicon to form a fragment of the amplicon; and (d) A) binding a labeling moiety to at least one of the above fragments. 43. (A) providing a nucleic acid; (b) transcribing the nucleic acid to form a transcribed nucleic acid; (c) fragmenting the transcribed nucleic acid to form a fragment of the transcribed nucleic acid; and (d) Attaching a labeling moiety to at least one of the above fragments. 44. (A) providing at least one nucleic acid that binds to a support; (b) providing a label moiety that can be bound to the nucleic acid with a terminal transferase; (c) providing the terminal transferase; d) binding the labeled portion to the nucleic acid using the terminal transferase. 44. (A) providing at least two nucleic acids that bind to the support; (b) increasing the number of monomeric units of the nucleic acids to form a common nucleic acid tail on the at least two nucleic acids; c) providing a labeling moiety capable of recognizing the common nucleic acid tail; and (d) contacting the common nucleic acid tail and the labeling moiety. 45. (A) providing at least one nucleic acid that binds to a support; (b) providing a label moiety that can be bound to the nucleic acid using a ligase; (c) providing the ligase; d) binding the labeling moiety to the nucleic acid moiety using a ligase. 46. The following formula: Wherein R1 is hydrogen, hydroxyl, phosphate bond or phosphate group; R2 is hydrogen or hydroxyl group; R3 is hydrogen, hydroxyl, phosphate bond or phosphate group; and R4 is bond labeling. Which is a moiety). 47. The following formula: Wherein R1 is hydrogen, hydroxyl, phosphate bond or phosphate group; R2 is hydrogen or hydroxyl group; R3 is hydrogen, hydroxyl, phosphate bond or phosphate group; and R4 is bond labeling. Which is a moiety). 48. A method for confirming a difference in nucleic acid levels between two or more nucleic acid samples, the method comprising: (a) selected by a method selected from the group consisting of random selection, accidental selection, and nucleotide composition biased selection. Providing one or more oligonucleotide arrays, each comprising a probe oligonucleotide comprising a nucleotide sequence or subsequence and all possible oligonucleotides of a preselected length; (b) providing a probe oligonucleotide on said array; Providing software describing the position and sequence; (c) hybridizing the nucleic acid sample with the one or more arrays to complement the nucleic acid in the nucleic acid sample with the nucleic acid or a subsequence thereof. Forming a hybrid duplex with the probe oligonucleotide in one or more of the above arrays that is: The method comprising the steps; that to (d) above hybridizing to operate the software to indicate the difference in the nucleic acid level.
JP52712297A 1996-01-23 1997-01-22 Nucleic acid analysis Ceased JP2002515738A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US1047196P 1996-01-23 1996-01-23
US60/010,471 1996-01-23
PCT/US1997/001603 WO1997027317A1 (en) 1996-01-23 1997-01-22 Nucleic acid analysis techniques

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006035873A Division JP2006191932A (en) 1996-01-23 2006-02-13 Method for nucleic acid analysis

Publications (1)

Publication Number Publication Date
JP2002515738A true JP2002515738A (en) 2002-05-28

Family

ID=21745919

Family Applications (2)

Application Number Title Priority Date Filing Date
JP52712297A Ceased JP2002515738A (en) 1996-01-23 1997-01-22 Nucleic acid analysis
JP2006035873A Withdrawn JP2006191932A (en) 1996-01-23 2006-02-13 Method for nucleic acid analysis

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2006035873A Withdrawn JP2006191932A (en) 1996-01-23 2006-02-13 Method for nucleic acid analysis

Country Status (3)

Country Link
JP (2) JP2002515738A (en)
AU (1) AU2253397A (en)
WO (1) WO1997027317A1 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004339202A (en) * 2003-04-05 2004-12-02 F Hoffmann La Roche Ag Nucleotide analog having 6-membered ring
JP2011507493A (en) * 2007-12-04 2011-03-10 パナジーン インク. Method for selective labeling and detection of target nucleic acid using immobilized peptide nucleic acid probe {Method for selective labeling and detection of targeted nucleic acid soaking immunized benzidic acid probe}
EP3018215A1 (en) 2006-02-13 2016-05-11 Fluidigm Canada Inc. Gene expression assays conducted by elemental analysis
JP2017528166A (en) * 2014-09-17 2017-09-28 ヴイアイティーオー エヌヴイ Methods and means for analyzing hybridization

Families Citing this family (285)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6300063B1 (en) 1995-11-29 2001-10-09 Affymetrix, Inc. Polymorphism detection
US6953663B1 (en) 1995-11-29 2005-10-11 Affymetrix, Inc. Polymorphism detection
US20010018514A1 (en) 1998-07-31 2001-08-30 Mcgall Glenn H. Nucleic acid labeling compounds
US6965020B2 (en) 1996-01-23 2005-11-15 Affymetrix, Inc. Nucleic acid labeling compounds
US7423143B2 (en) 1996-01-23 2008-09-09 Affymetrix. Inc. Nucleic acid labeling compounds
US6864059B2 (en) 1996-01-23 2005-03-08 Affymetrix, Inc. Biotin containing C-glycoside nucleic acid labeling compounds
US7468243B2 (en) 2001-03-12 2008-12-23 Affymetrix, Inc. 2-aminopyrimidin-4-one nucleic acid labeling compounds
US7282327B2 (en) 1996-01-23 2007-10-16 Affymetrix, Inc. Nucleic acid labeling compounds
US7291463B2 (en) 1996-01-23 2007-11-06 Affymetrix, Inc. Nucleic acid labeling compounds
FR2775984B1 (en) 1998-03-11 2006-09-15 Bioscreen Therapeutics Sa QUALITATIVE DIFFERENTIAL SCREENING
US6881571B1 (en) 1998-03-11 2005-04-19 Exonhit Therapeutics S.A. Qualitative differential screening
EP0990142A4 (en) 1996-12-31 2000-09-27 Genometrix Genomics Inc Multiplexed molecular analysis apparatus and method
WO1998036099A1 (en) * 1997-02-18 1998-08-20 Oncor, Inc. Detection of targets with green fluorescent protein and fluorescent variants thereof
US6165709A (en) 1997-02-28 2000-12-26 Fred Hutchinson Cancer Research Center Methods for drug target screening
NO972006D0 (en) 1997-04-30 1997-04-30 Forskningsparken I Aas As New method for diagnosis of diseases
US7068830B2 (en) 1997-07-25 2006-06-27 Affymetrix, Inc. Method and system for providing a probe array chip design database
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
US6420108B2 (en) 1998-02-09 2002-07-16 Affymetrix, Inc. Computer-aided display for comparative gene expression
JP2001515234A (en) 1997-07-25 2001-09-18 アフィメトリックス インコーポレイテッド System for providing a polymorphism database
US6573044B1 (en) 1997-08-07 2003-06-03 The Regents Of The University Of California Methods of using chemical libraries to search for new kinase inhibitors
DE69827154T2 (en) 1997-08-15 2006-03-09 Affymetrix, Inc. (n.d.Ges.d.Staates Delaware), Santa Clara POLYMORPHISM IDENTIFICATION WITH HELP CLUSTER ANALYSIS
AU9063398A (en) * 1997-09-12 1999-04-05 Exiqon A/S Oligonucleotide analogues
DE19741715A1 (en) * 1997-09-22 1999-03-25 Hoechst Ag New pentopyranosyl nucleoside compounds
DE19741716A1 (en) * 1997-09-22 1999-03-25 Hoechst Ag Recognition system
WO1999023254A1 (en) * 1997-10-31 1999-05-14 Affymetrix, Inc. Expression profiles in adult and fetal organs
US6322968B1 (en) 1997-11-21 2001-11-27 Orchid Biosciences, Inc. De novo or “universal” sequencing array
WO1999028505A1 (en) 1997-12-03 1999-06-10 Curagen Corporation Methods and devices for measuring differential gene expression
US6458533B1 (en) * 1997-12-19 2002-10-01 High Throughput Genomics, Inc. High throughput assay system for monitoring ESTs
US6232066B1 (en) * 1997-12-19 2001-05-15 Neogen, Inc. High throughput assay system
US6238869B1 (en) 1997-12-19 2001-05-29 High Throughput Genomics, Inc. High throughput assay system
EP1418244A1 (en) * 1997-12-19 2004-05-12 Affymetrix, Inc. Exploiting genomics in the search for new drugs
US20030096232A1 (en) 1997-12-19 2003-05-22 Kris Richard M. High throughput assay system
AU1926899A (en) 1997-12-19 1999-07-12 Affymetrix, Inc. Exploiting genomics in the search for new drugs
WO1999034018A1 (en) * 1997-12-24 1999-07-08 The Regents Of The University Of California Methods of using chemical libraries to search for new kinase inhibitors
US6087102A (en) 1998-01-07 2000-07-11 Clontech Laboratories, Inc. Polymeric arrays and methods for their use in binding assays
US6289229B1 (en) 1998-01-20 2001-09-11 Scimed Life Systems, Inc. Readable probe array for in vivo use
AU2341999A (en) * 1998-01-26 1999-08-09 Schering Aktiengesellschaft Gene expression methods for screening compounds
US6187535B1 (en) 1998-02-18 2001-02-13 Institut Pasteur Fast and exhaustive method for selecting a prey polypeptide interacting with a bait polypeptide of interest: application to the construction of maps of interactors polypeptides
KR100440044B1 (en) * 1998-02-27 2004-07-14 팸진 비.브이. Method for the non-specific amplification of nucleic acid
DE69933369D1 (en) * 1998-04-03 2006-11-09 Compound Therapeutics Inc Adressierbare protein arrays
US6004755A (en) * 1998-04-07 1999-12-21 Incyte Pharmaceuticals, Inc. Quantitative microarray hybridizaton assays
US6495319B1 (en) 1998-04-27 2002-12-17 Sidney Kimmel Cancer Center Reduced complexity nucleic acid targets and methods of using same
EP1075548A1 (en) * 1998-05-04 2001-02-14 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Electrical integrated nucleic acid isolation, purification and detection
US5965352A (en) 1998-05-08 1999-10-12 Rosetta Inpharmatics, Inc. Methods for identifying pathways of drug action
US6872521B1 (en) 1998-06-16 2005-03-29 Beckman Coulter, Inc. Polymerase signaling assay
US6132969A (en) * 1998-06-19 2000-10-17 Rosetta Inpharmatics, Inc. Methods for testing biological network models
WO2000004188A2 (en) * 1998-07-15 2000-01-27 Chiron Corporation Methods and compositions for comparing and normalizing assays
US6787308B2 (en) * 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6232067B1 (en) 1998-08-17 2001-05-15 The Perkin-Elmer Corporation Adapter directed expression analysis
FR2783000B1 (en) 1998-09-04 2002-07-05 Genolife METHOD FOR AMPLIFYING THE TOTAL DNA FRAGMENTS OF A SAMPLE
US6185561B1 (en) 1998-09-17 2001-02-06 Affymetrix, Inc. Method and apparatus for providing and expression data mining database
EP1117836A2 (en) * 1998-09-30 2001-07-25 Millennium Pharmaceuticals, Inc. Expressionanalysis of specific nucleic acids and polypeptides useful in the diagnosis and treatment of prostate cancer
US6872811B1 (en) 1998-09-30 2005-03-29 Millennium Pharmaceuticals, Inc. HRPCa9 and HRPCa10 nucleic acids and polypeptides
US6593084B2 (en) * 1998-10-13 2003-07-15 Robert E. Bird Carcinogen assay
US6489096B1 (en) 1998-10-15 2002-12-03 Princeton University Quantitative analysis of hybridization patterns and intensities in oligonucleotide arrays
CA2346768A1 (en) * 1998-10-23 2000-05-04 Yale University Phytomics: a genomic-based approach to herbal compositions
US6468476B1 (en) 1998-10-27 2002-10-22 Rosetta Inpharmatics, Inc. Methods for using-co-regulated genesets to enhance detection and classification of gene expression patterns
US6950752B1 (en) 1998-10-27 2005-09-27 Rosetta Inpharmatics Llc Methods for removing artifact from biological profiles
US6203987B1 (en) 1998-10-27 2001-03-20 Rosetta Inpharmatics, Inc. Methods for using co-regulated genesets to enhance detection and classification of gene expression patterns
US6194158B1 (en) * 1998-11-12 2001-02-27 Nyxis Neurotherapies, Inc. Diagnostic assay for cancer
IL143486A0 (en) * 1998-12-04 2002-04-21 Keygene Nv Array and method for analysing nucleic acid sequences
US6245518B1 (en) * 1998-12-11 2001-06-12 Hyseq, Inc. Polynucleotide arrays and methods of making and using the same
US6801859B1 (en) 1998-12-23 2004-10-05 Rosetta Inpharmatics Llc Methods of characterizing drug activities using consensus profiles
US6453241B1 (en) 1998-12-23 2002-09-17 Rosetta Inpharmatics, Inc. Method and system for analyzing biological response signal data
US6370478B1 (en) 1998-12-28 2002-04-09 Rosetta Inpharmatics, Inc. Methods for drug interaction prediction using biological response profiles
US6222093B1 (en) 1998-12-28 2001-04-24 Rosetta Inpharmatics, Inc. Methods for determining therapeutic index from gene expression profiles
US6351712B1 (en) 1998-12-28 2002-02-26 Rosetta Inpharmatics, Inc. Statistical combining of cell expression profiles
CA2259745A1 (en) * 1999-01-19 2000-07-19 Guy Tremblay Generation of oligonucleotide libraries representative of genomes or expressed mrnas (cdnas) and use thereof
US6251601B1 (en) * 1999-02-02 2001-06-26 Vysis, Inc. Simultaneous measurement of gene expression and genomic abnormalities using nucleic acid microarrays
EP1190091A2 (en) * 1999-03-15 2002-03-27 Vistagen, Inc. Bar coding and indentifying nucleic acids using a limited number of probes and low stringency conditions
WO2000056921A2 (en) * 1999-03-22 2000-09-28 Paul Cullen Nucleic acid combination
DE60014350T2 (en) * 1999-04-09 2005-10-13 Keygene N.V. METHOD OF DETECTION AND / OR ANALYSIS, USING PRIMER TECHNIQUES, OF SIMPLE NUCLEOTIDE POLYMORPHISMS IN RESTRICTION FRAGMENTS SPECIALLY MADE FROM AMPLIFIED RESTRICTION FRAGMENTS GENERATED BY AFLP
WO2000066781A2 (en) * 1999-04-30 2000-11-09 Ball Semiconductor, Inc. Dna balls
WO2000068423A2 (en) * 1999-05-05 2000-11-16 The European Molecular Biology Laboratory Improved predictive power of rna analysis for protein expression
DE19923966C2 (en) * 1999-05-25 2003-04-24 Phylos Inc Detection system for the separation of sample components, its production and use
US6516276B1 (en) * 1999-06-18 2003-02-04 Eos Biotechnology, Inc. Method and apparatus for analysis of data from biomolecular arrays
US6346423B1 (en) 1999-07-16 2002-02-12 Agilent Technologies, Inc. Methods and compositions for producing biopolymeric arrays
FR2796465B1 (en) * 1999-07-16 2001-11-23 Suisse Electronique Microtech BIOCHEMICAL SENSOR SYSTEM WITH INCREASED SENSITIVITY BY MOLECULAR SIGNAL AMPLIFICATION
JP3451035B2 (en) * 1999-07-27 2003-09-29 日立ソフトウエアエンジニアリング株式会社 Microarray information display method
CN1244880C (en) * 1999-08-21 2006-03-08 分子农业生物学院 DNA marker profile data analysis
AU7412900A (en) * 1999-08-22 2001-04-10 Dot Diagnostics B.V. Improved method for nucleotide detection and devices used therein
US6505125B1 (en) 1999-09-28 2003-01-07 Affymetrix, Inc. Methods and computer software products for multiple probe gene expression analysis
CA2356207C (en) 1999-10-21 2012-10-09 Case Western Reserve University Gene expression profiling of inflammatory bowel disease
JP2001186880A (en) * 1999-10-22 2001-07-10 Ngk Insulators Ltd Method for producing dna chip
EP1096024A1 (en) * 1999-10-28 2001-05-02 Remacle, José Method and kit for the screening and/or the quantification of multiple homologous nucleic acid sequences on arrays
GB2355791B (en) * 1999-10-28 2004-10-20 Molecular Light Tech Res Ltd Detection of mRNA expression using chemiluminescent labelled probes
JP3996307B2 (en) * 1999-11-05 2007-10-24 富士フイルム株式会社 DNA fragment immobilization method, DNA chip and nucleic acid fragment detection method
US6913882B2 (en) 1999-12-22 2005-07-05 Affymetrix, Inc. Methods of screening for B cell activity modulators
US6500620B2 (en) * 1999-12-29 2002-12-31 Mergen Ltd. Methods for amplifying and detecting multiple polynucleotides on a solid phase support
US6800439B1 (en) 2000-01-06 2004-10-05 Affymetrix, Inc. Methods for improved array preparation
US6235483B1 (en) * 2000-01-31 2001-05-22 Agilent Technologies, Inc. Methods and kits for indirect labeling of nucleic acids
GB2397376B (en) * 2000-02-04 2004-12-01 Aeomica Inc Human genome-derived single exon nucleic acid probes useful for analysis of gene expression in human heart
AU2001233114A1 (en) * 2000-02-04 2001-08-14 Aeomica, Inc. Methods and apparatus for predicting, confirming, and displaying functional information derived from genomic sequence
US20020072060A1 (en) * 2000-07-19 2002-06-13 Getts Robert C. Methods for detecting and assaying nucleic acid sequences
CA2373708A1 (en) * 2000-03-09 2001-09-13 Yale University Phytomics: a genomic-based approach to herbal compositions
WO2001066804A2 (en) * 2000-03-09 2001-09-13 Protogene Laboratories, Inc. Methods for optimizing hybridization performance of polynucleotide probes and localizing and detecting sequence variations
US20020111746A1 (en) * 2000-03-15 2002-08-15 Wei-Min Liu Systems and computer software products for gene expression analysis
US6806361B1 (en) 2000-03-17 2004-10-19 Affymetrix, Inc. Methods of enhancing functional performance of nucleic acid arrays
AU2001250858A1 (en) * 2000-03-17 2001-10-03 Gene Logic, Inc. Methods of preparing amplified nucleic acid molecules
US6833450B1 (en) 2000-03-17 2004-12-21 Affymetrix, Inc. Phosphite ester oxidation in nucleic acid array preparation
WO2006053770A1 (en) 2004-11-18 2006-05-26 Eppendorf Array Technologies Real-time pcr of targets on a micro-array
US7202026B2 (en) 2000-03-24 2007-04-10 Eppendorf Array Technologies Sa (Eat) Identification of a large number of biological (micro)organisms groups at different levels by their detection on a same array
US7875442B2 (en) 2000-03-24 2011-01-25 Eppendorf Array Technologies Identification and quantification of a plurality of biological (micro)organisms or their components
US7829313B2 (en) 2000-03-24 2010-11-09 Eppendorf Array Technologies Identification and quantification of a plurality of biological (micro)organisms or their components
US8288128B2 (en) 2004-11-18 2012-10-16 Eppendorf Array Technologies S.A. Real-time quantification of multiple targets on a micro-array
US7205104B2 (en) 2000-03-24 2007-04-17 Eppendorf Array Technologies Sa (Eat) Identification of biological (micro) organisms by detection of their homologous nucleotide sequences on arrays
JP2004508010A (en) * 2000-03-24 2004-03-18 マイクロメット アーゲー mRNA amplification
US7005259B1 (en) 2000-06-01 2006-02-28 Affymetrix, Inc. Methods for array preparation using substrate rotation
US7700359B2 (en) 2000-06-02 2010-04-20 Novartis Vaccines And Diagnostics, Inc. Gene products differentially expressed in cancerous cells
WO2003057926A1 (en) 2002-01-08 2003-07-17 Chiron Corporation Gene products differentially expressed in cancerous breast cells and their methods of use
EP1164201A1 (en) * 2000-06-14 2001-12-19 Facultés Universitaires Notre-Dame de la Paix Reverse detection for identification and/or quantification of nucleotide target sequences on biochips
US20020012905A1 (en) 2000-06-14 2002-01-31 Snodgrass H. Ralph Toxicity typing using liver stem cells
EP1953243B1 (en) 2000-06-15 2012-12-26 Novartis Vaccines and Diagnostics, Inc. Polynucleotides related to colon cancer
US6424921B1 (en) * 2000-07-10 2002-07-23 Incyte Genomics, Inc. Averaging multiple hybridization arrays
CA2425112C (en) 2000-10-06 2011-09-27 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding dna and rna
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
DE60125312T2 (en) 2000-10-26 2007-06-06 Agilent Technologies, Inc. (n.d. Ges. d. Staates Delaware), Santa Clara microarray
EP1415005B1 (en) 2000-12-07 2012-11-21 Novartis Vaccines and Diagnostics, Inc. Endogenous retroviruses up-regulated in prostate cancer
WO2002061140A2 (en) * 2001-01-31 2002-08-08 Ambion, Inc. Competitive population normalization for comparative analysis of nucleic acid samples
AU785425B2 (en) 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
US7115726B2 (en) 2001-03-30 2006-10-03 Perlegen Sciences, Inc. Haplotype structures of chromosome 21
US7138506B2 (en) 2001-05-09 2006-11-21 Genetic Id, Na, Inc. Universal microarray system
WO2004001042A2 (en) * 2002-06-20 2003-12-31 Nuevolution A/S Microarrays displaying encoded molecules
WO2002102820A1 (en) 2001-06-20 2002-12-27 Nuevolution A/S Nucleoside derivatives for library preparation
US9261460B2 (en) 2002-03-12 2016-02-16 Enzo Life Sciences, Inc. Real-time nucleic acid detection processes and compositions
US6974671B1 (en) 2001-09-12 2005-12-13 Salk Institute For Biological Studies Methods for indentifying compounds that modulate gluconeogenesis through the binding of CREB to the PGC-1 promoter
AU2002359446B2 (en) 2001-11-09 2008-12-04 Georgetown University Novel isoforms of vascular endothelial cell growth inhibitor
JP4355210B2 (en) 2001-11-30 2009-10-28 フルイディグム コーポレイション Microfluidic device and method of using microfluidic device
US9353405B2 (en) 2002-03-12 2016-05-31 Enzo Life Sciences, Inc. Optimized real time nucleic acid detection processes
AU2003214031A1 (en) 2002-03-15 2003-09-29 Nuevolution A/S An improved method for synthesising templated molecules
US7351542B2 (en) 2002-05-20 2008-04-01 The Regents Of The University Of California Methods of modulating tubulin deacetylase activity
EP1365034A3 (en) 2002-05-21 2004-02-18 Bayer HealthCare AG Methods and compositions for the prediction, diagnosis, prognosis, prevention and treatment of malignant neoplasia
ATE545651T1 (en) 2002-06-13 2012-03-15 Novartis Vaccines & Diagnostic VECTORS FOR EXPRESSING HML-2 POLYPEPTIDES
AU2003261168A1 (en) 2002-07-19 2004-02-09 Althea Technologies, Inc. Strategies for gene expression analysis
WO2004013070A2 (en) 2002-08-01 2004-02-12 Nuevolution A/S Multi-step synthesis of templated molecules
CN102838654B (en) 2002-10-30 2016-05-18 纽韦卢森公司 The method of synthetic difunctional compound
EP1583948B1 (en) 2002-11-26 2010-09-01 University of Maryland Biotechnology High-sensitivity assays for pathogen detection using metal-enhanced fluorescence
AU2003291964A1 (en) 2002-12-19 2004-07-14 Nuevolution A/S Quasirandom structure and function guided synthesis methods
EP1947116B1 (en) 2003-02-10 2017-06-21 2-BBB Medicines B.V. Differentially expressed nucleic acids in the blood-brain barrier under inflammatory conditions
US20070026397A1 (en) 2003-02-21 2007-02-01 Nuevolution A/S Method for producing second-generation library
WO2004089810A2 (en) 2003-04-03 2004-10-21 Fluidigm Corp. Microfluidic devices and methods of using same
WO2006102264A1 (en) 2005-03-18 2006-09-28 Fluidigm Corporation Thermal reaction device and method for using the same
EP1660674B1 (en) 2003-09-10 2010-03-17 Althea Technologies, Inc. Expression profiling using microarrays
WO2005027719A2 (en) 2003-09-12 2005-03-31 Perlegen Sciences, Inc. Methods and systems for identifying predisposition to the placebo effect
DK1670939T3 (en) 2003-09-18 2010-03-01 Nuevolution As Method for obtaining structural information on a coded molecule and method for selecting compounds
EP1522594A3 (en) 2003-10-06 2005-06-22 Bayer HealthCare AG Methods and kits for investigating cancer
FR2862314A1 (en) * 2003-11-13 2005-05-20 Exonhit Therapeutics Sa Method for diagnosing encephalopathy, or the risk of developing it, useful particularly in screening cattle for bovine spongiform encephalopathy, based on detecting specific nucleic acid markers
US20070292850A1 (en) * 2003-11-13 2007-12-20 Annelies Resink Identification of Diagnostic Markers for Communicable Subacute Spongiform Encephalopathies
FR2867485B1 (en) * 2003-12-10 2008-02-22 Exonhit Therapeutics Sa IDENTIFICATION OF DIAGNOSTIC MARKERS FOR TRANSMISSIBLE SPONGIFORM SUGASTED ENCEPHALOPATHIES
CN101076537B (en) * 2003-11-19 2012-07-04 阿莱洛吉克生物科学公司 Oligonucleotides labeled with a plurality of fluorophores
ATE491043T1 (en) 2004-04-09 2010-12-15 Us Gov Health & Human Serv DIAGNOSTIC DEVICE FOR DIAGNOSIS OF BENEFITS VERSUS MALIGNANT THYROID LESIONS
MXPA06013502A (en) 2004-05-21 2007-03-01 Univ California Method for enhancing production of isoprenoid compounds.
EP2290069A3 (en) 2004-05-28 2011-08-10 Asuragen, Inc. Methods and compositions involving microRNA
GB0412301D0 (en) 2004-06-02 2004-07-07 Diagenic As Product and method
US7892731B2 (en) * 2004-10-01 2011-02-22 Radix Biosolutions, Ltd. System and method for inhibiting the decryption of a nucleic acid probe sequence used for the detection of a specific nucleic acid
US20060078898A1 (en) * 2004-10-12 2006-04-13 Curry Bo U Methods and compositions for reducing label variation in array-based comparative genome hybridization assays II
US20060078899A1 (en) * 2004-10-12 2006-04-13 Scheffer Alicia F Methods and compositions for reducing label variation in array-based comparative genome hybridization assays
CA2585970A1 (en) 2004-10-27 2006-05-04 Vanderbilt University Mammalian genes involved in infection
EP2808389A1 (en) 2004-11-12 2014-12-03 Asuragen, Inc. Methods and compositions involving MIRNA and MIRNA inhibitor molecules
US20060147963A1 (en) * 2004-12-30 2006-07-06 Affymetrix, Inc. Detection of polynucleotides on nucleic acid arrays using azido-modified triphosphate nucleotide analogs
US7541144B2 (en) * 2005-01-31 2009-06-02 Agilent Technologies, Inc. RNA labeling method
WO2006099421A2 (en) 2005-03-14 2006-09-21 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for evaluating graft survival in a solid organ transplant recipient
EP1731620A1 (en) 2005-06-07 2006-12-13 Institut National De La Sante Et De La Recherche Medicale (Inserm) Method for the diagnosis of immune graft tolerance
EP1736780A1 (en) 2005-06-24 2006-12-27 Eppendorf Array Technologies S.A. Method and means for detecting and/or quantifying hierarchical molecular change of a cell in response to an external stimulus
WO2007016367A2 (en) 2005-07-29 2007-02-08 Bayer Healthcare Llc Neoplastic disease-related methods, kits, systems and databases
US7544471B2 (en) * 2005-07-30 2009-06-09 Agilent Technologies, Inc. Preparing RNA from a wax-embedded tissue specimen
DE602005005333T2 (en) 2005-09-13 2008-09-18 Eppendorf Array Technologies S.A. Method for detecting homologous sequences differing by a base on a microarray
WO2007053732A2 (en) 2005-11-01 2007-05-10 Mayo Foundation For Medical Education And Research Promoter polymorphisms of the blys gene and use in diagnostic methods
SI3305900T1 (en) 2005-12-01 2022-02-28 Nuevolution A/S Enzymatic encoding methods for efficient synthesis of large libraries
US20070238094A1 (en) 2005-12-09 2007-10-11 Baylor Research Institute Diagnosis, prognosis and monitoring of disease progression of systemic lupus erythematosus through blood leukocyte microarray analysis
US7700289B2 (en) 2006-04-03 2010-04-20 Agilent Technologies, Inc. Method for labeling RNA
CA2650730A1 (en) 2006-04-27 2007-11-08 Pikamab, Inc. Methods and compositions for antibody therapy
EP3796002B1 (en) 2006-07-14 2023-11-22 The Regents of The University of California Cancer biomarkers and methods of use thereof
WO2008026927A2 (en) * 2006-08-30 2008-03-06 Academisch Medisch Centrum Process for displaying t- and b-cell receptor repertoires
EP2115138A2 (en) 2006-09-19 2009-11-11 Asuragen, Inc. Micrornas differentially expressed in pancreatic diseases and uses thereof
WO2008036776A2 (en) 2006-09-19 2008-03-27 Asuragen, Inc. Mir-15, mir-26, mir -31,mir -145, mir-147, mir-188, mir-215, mir-216 mir-331, mmu-mir-292-3p regulated genes and pathways as targets for therapeutic intervention
EP2570951A1 (en) 2006-11-03 2013-03-20 Baylor Research Institute Diagnosis of metastatic melanoma and monitoring indicators of immunosuppression through blood leukocyte microarray analysis
DE112007002932B4 (en) 2006-12-01 2015-08-06 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable, reversible, fluorescent nucleotide terminators
EP1935496A1 (en) 2006-12-22 2008-06-25 Eppendorf Array Technologies SA Device and/or method for the detection of amplified nucleotides sequences on micro-arrays
US7838234B2 (en) 2007-01-30 2010-11-23 Pharmacyclics, Inc. Methods for determining cancer resistance to histone deacetylase inhibitors
EP1961825A1 (en) 2007-02-26 2008-08-27 INSERM (Institut National de la Santé et de la Recherche Medicale) Method for predicting the occurrence of metastasis in breast cancer patients
US8200440B2 (en) 2007-05-18 2012-06-12 Affymetrix, Inc. System, method, and computer software product for genotype determination using probe array data
WO2009023676A1 (en) 2007-08-12 2009-02-19 Integrated Dna Technologies, Inc. Microarray system with improved sequence specificity
WO2009029266A2 (en) 2007-08-27 2009-03-05 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health Of Human Services, National Institutes Of Health Diagnostic tool for diagnosing benign versus malignant thyroid lesions
US8361714B2 (en) 2007-09-14 2013-01-29 Asuragen, Inc. Micrornas differentially expressed in cervical cancer and uses thereof
US8445217B2 (en) 2007-09-20 2013-05-21 Vanderbilt University Free solution measurement of molecular interactions by backscattering interferometry
EP2940029B1 (en) 2007-10-19 2023-11-29 The Trustees of Columbia University in the City of New York Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis
EP2209911B1 (en) 2007-10-19 2013-10-16 The Trustees of Columbia University in the City of New York Dna sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators and a deoxyinosine analogue with a reversible terminator group
WO2009073511A2 (en) 2007-11-30 2009-06-11 Mayo Foundation For Medical Education And Research Polymorphisms of the blys gene and use in diagnostic methods
US8071562B2 (en) * 2007-12-01 2011-12-06 Mirna Therapeutics, Inc. MiR-124 regulated genes and pathways as targets for therapeutic intervention
EP2077336A1 (en) 2007-12-19 2009-07-08 Koninklijke Philips Electronics N.V. Device and method for parallel quantitative analysis of multiple nucleic acids
US8211652B2 (en) 2008-01-29 2012-07-03 University of Pittsburgh—of the Commonwealth System of Higher Education FSTL-1 as a biomaker of inflammation
US8658379B2 (en) 2008-01-29 2014-02-25 University of Pittsburgh—of the Commonwealth System of Higher Education Follistatin-like protein-1 as a biomarker for sepsis
WO2009099602A1 (en) * 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
EP2107125A1 (en) 2008-03-31 2009-10-07 Eppendorf Array Technologies SA (EAT) Real-time PCR of targets on a micro-array
US9146238B2 (en) 2008-04-16 2015-09-29 The Johns Hopkins University Compositions and methods for treating or preventing prostate cancer and for detecting androgen receptor variants
WO2009146204A1 (en) 2008-04-18 2009-12-03 Tufts Medical Center Polymorphisms associated with age-related macular degeneration and methods for evaluating patient risk
US8258111B2 (en) 2008-05-08 2012-09-04 The Johns Hopkins University Compositions and methods related to miRNA modulation of neovascularization or angiogenesis
EP2135674A1 (en) 2008-06-19 2009-12-23 Eppendorf Array Technologies SA Device for multiparametrics assays
EP2138232A1 (en) 2008-06-23 2009-12-30 Koninklijke Philips Electronics N.V. Detection of tapped aliquots of amplified nucleic acids
EP2138587A1 (en) 2008-06-23 2009-12-30 Koninklijke Philips Electronics N.V. Amplification of nucleic acids using temperature zones
EP2138588A1 (en) 2008-06-23 2009-12-30 Koninklijke Philips Electronics N.V. Melting curve measurement during amplification
EP2324129A4 (en) 2008-08-18 2012-06-20 Univ Leland Stanford Junior Methods and compositions for determining a graft tolerant phenotype in a subject
EP2358897B1 (en) * 2008-11-17 2015-02-25 Headway Technologies, Inc. Methods and compositions in particle-based detection of target molecules using linking molecules
EP2358898B1 (en) * 2008-11-17 2016-08-31 Headway Technologies, Inc. Methods and compositions in particle-based detection of target molecules using covalent bond forming reactive pairs
WO2010087702A1 (en) 2009-01-30 2010-08-05 Stichting Katholieke Universiteit TET2 gene as a marker for diagnosing a myelodysuplastic syndrome (MDS) or an acute myeloid leukemia (AML) and determining the prognosis in a subject
EP2411541B1 (en) 2009-03-27 2015-02-11 Tufts Medical Center, Inc. Markers related to age-related macular degeneration and uses therefor
CA2767616A1 (en) 2009-07-09 2011-01-13 The Scripps Research Institute Gene expression profiles associated with chronic allograft nephropathy
AU2010286740B2 (en) 2009-08-22 2016-03-10 The Board Of Trustees Of The Leland Stanford Junior University Imaging and evaluating embryos, oocytes, and stem cells
WO2011034421A1 (en) 2009-09-16 2011-03-24 Stichting Het Nederlands Kanker Instituut Fra-1 target genes as drug targets for treating cancer
EP3185013B1 (en) 2009-12-02 2019-10-09 The Board of Trustees of the Leland Stanford Junior University Biomarkers for determining an allograft tolerant phenotype
GB0922085D0 (en) 2009-12-17 2010-02-03 Cambridge Entpr Ltd Cancer diagnosis and treatment
ES2631458T3 (en) 2010-03-04 2017-08-31 Interna Technologies B.V. MRNA molecule defined by its source and its therapeutic uses in cancer associated with EMT
SI2558577T1 (en) 2010-04-16 2019-05-31 Nuevolution A/S Bi-functional complexes and methods for making and using such complexes
JP2013527756A (en) 2010-04-19 2013-07-04 ザ プロクター アンド ギャンブル カンパニー GENE SIGNATURE AND GENE CHIP, AND THEIR METHODS AND TREATMENTS RELATED TO ADMINISTRATION OF ELECTRIC CONDUCTIVE HIGH FREQUENCY CURRENT
BR112012026871A2 (en) 2010-04-19 2017-06-06 Procter & Gamble combined application of topical composition and energy to regulate mammalian skin condition
WO2011139721A1 (en) 2010-04-27 2011-11-10 The Regents Of The University Of California Cancer biomarkers and methods of use thereof
WO2011146725A1 (en) 2010-05-19 2011-11-24 Bayer Healthcare Llc Biomarkers for a multikinase inhibitor
WO2011156713A1 (en) 2010-06-11 2011-12-15 Vanderbilt University Multiplexed interferometric detection system and method
AU2011274619B2 (en) 2010-07-06 2016-11-10 Interna Technologies Bv miRNA and its diagnostic and therapeutic uses in diseases or conditions associated with melanoma, or in diseases or conditions associated with activated BRAF pathway
WO2012019099A2 (en) 2010-08-05 2012-02-09 University Of Pittsburgh - Of The Commonwealth System Of Higher Education Follistatin-like-protein-1 as a biomarker for inflammatory disorders
NZ620799A (en) 2010-09-15 2015-10-30 Almac Diagnostics Ltd Molecular diagnostic test for cancer
EP2441520A1 (en) 2010-10-12 2012-04-18 Eppendorf AG Real-time amplification and micro-array based detection of nucleic acid targets in a flow chip assay
JP6155194B2 (en) 2010-11-17 2017-06-28 インターペース ダイアグノスティックス リミテッド ライアビリティ カンパニー MiRNA as a biomarker for distinguishing benign and malignant thyroid neoplasms
US10202615B2 (en) 2010-12-10 2019-02-12 Vanderbilt University Mammalian genes involved in toxicity and infection
EP2474617A1 (en) 2011-01-11 2012-07-11 InteRNA Technologies BV Mir for treating neo-angiogenesis
CN105969773A (en) 2011-02-03 2016-09-28 米尔纳医疗股份有限公司 Synthetic mimics of MIR-124
WO2012112563A2 (en) 2011-02-16 2012-08-23 Magic Technologies, Inc. Methods and compositions for the target-localized anchoring of detectable label
US9562853B2 (en) 2011-02-22 2017-02-07 Vanderbilt University Nonaqueous backscattering interferometric methods
EP2678675B1 (en) 2011-02-23 2017-10-11 The Board of Trustees of the Leland Stanford Junior University Methods of detecting aneuploidy in human embryos
EP2681566A2 (en) 2011-02-28 2014-01-08 University of Iowa Research Foundation Anti-müllerian hormone changes in pregnancy and prediction ofadverse pregnancy outcomes and gender
US9051619B2 (en) 2011-03-25 2015-06-09 Florida Agricultural and Mechanical University (FAMU) Methods and compositions for prostate cancer metastasis
BR112013031019A2 (en) 2011-06-02 2017-03-21 Almac Diagnostics Ltd molecular diagnostic test for cancer
WO2013040251A2 (en) 2011-09-13 2013-03-21 Asurgen, Inc. Methods and compositions involving mir-135b for distinguishing pancreatic cancer from benign pancreatic disease
US20130157884A1 (en) 2011-10-26 2013-06-20 Asuragen, Inc. Methods and compositions involving mirna expression levels for distinguishing pancreatic cysts
WO2013063544A1 (en) 2011-10-27 2013-05-02 Asuragen, Inc. Mirnas as diagnostic biomarkers to distinguish benign from malignant thyroid tumors
WO2013087789A1 (en) 2011-12-13 2013-06-20 Glykos Finland Ltd. Antibody isoform arrays and methods thereof
US9273949B2 (en) 2012-05-11 2016-03-01 Vanderbilt University Backscattering interferometric methods
US20150152499A1 (en) 2012-07-03 2015-06-04 Interna Technologies B.V. Diagnostic portfolio and its uses
WO2014055117A1 (en) 2012-10-04 2014-04-10 Asuragen, Inc. Diagnostic mirnas for differential diagnosis of incidental pancreatic cystic lesions
CA2893033A1 (en) 2012-12-03 2014-06-12 Almac Diagnostics Limited Molecular diagnostic test for cancer
EP4066841A1 (en) 2013-03-14 2022-10-05 University of Maryland, Baltimore Androgen receptor down-regulating agents and uses thereof
EP3404116B1 (en) 2013-03-15 2022-10-19 The University of Chicago Methods and compositions related to t-cell activity
EP2971132B1 (en) 2013-03-15 2020-05-06 Baylor Research Institute Tissue and blood-based mirna biomarkers for the diagnosis, prognosis and metastasis-predictive potential in colorectal cancer
WO2014151551A1 (en) 2013-03-15 2014-09-25 Baylor Research Institute Ulcerative colitis (uc)-associated colorectal neoplasia markers
CN105392882A (en) 2013-04-19 2016-03-09 加利福尼亚大学董事会 Lone star virus
MX2016001901A (en) 2013-08-12 2016-10-13 Tokai Pharmaceuticals Inc Biomarkers for treatment of neoplastic disorders using androgen-targeted therapies.
GB201409479D0 (en) 2014-05-28 2014-07-09 Almac Diagnostics Ltd Molecular diagnostic test for cancer
EP3146081B1 (en) 2014-05-19 2020-10-28 The Johns Hopkins University Methods for identifying androgen receptor splice variants in subjects having castration resistant prostate cancer
US11104951B2 (en) 2014-05-22 2021-08-31 The Scripps Research Institute Molecular signatures for distinguishing liver transplant rejections or injuries
EP3146077A4 (en) 2014-05-22 2018-05-02 The Scripps Research Institute Tissue molecular signatures of kidney transplant rejections
US10443100B2 (en) 2014-05-22 2019-10-15 The Scripps Research Institute Gene expression profiles associated with sub-clinical kidney transplant rejection
EP3825416A3 (en) 2014-05-22 2021-09-15 The Scripps Research Institute Gene expression profiles associated with sub-clinical kidney transplant rejection
CA2949959A1 (en) 2014-05-22 2015-11-26 Northwestern University Gene expression profiles associated with sub-clinical kidney transplant rejection
WO2016025510A1 (en) 2014-08-12 2016-02-18 Rappolee Daniel A Systems and methods to detect stem cell stress and uses thereof
JP6860476B2 (en) 2014-08-25 2021-04-14 ザ ジョンズ ホプキンズ ユニヴァーシティー Methods and Compositions for Prostate Cancer Treatment
EP3227687A4 (en) 2014-12-05 2018-10-24 Prelude, Inc. Dcis recurrence and invasive breast cancer
JP2018506715A (en) 2015-01-23 2018-03-08 ヴァンダービルト ユニバーシティー Robust interferometer and method of use
CA3021399A1 (en) 2015-05-01 2016-11-10 Griffith University Diagnostic methods
GB201512869D0 (en) 2015-07-21 2015-09-02 Almac Diagnostics Ltd Gene signature for minute therapies
EP4019643A1 (en) 2015-09-23 2022-06-29 Oklahoma Medical Research Foundation Biomarkers for assessing subjects with multiple sclerosis
EP3408649B1 (en) 2016-01-29 2023-06-14 Vanderbilt University Free-solution response function interferometry
US20190128895A1 (en) 2016-04-20 2019-05-02 Ldx Prognostics Limited Co. Methods and compositions for prognosing preterm birth
WO2017197573A1 (en) 2016-05-17 2017-11-23 Ldx Prognostics Limited Co. Methods and compositions for providing preeclampsia assessment
AU2018358016A1 (en) 2017-11-03 2020-05-07 Interna Technologies B.V. MiRNA molecule, equivalent, antagomir, or source thereof for treating and/or diagnosing a condition and/or a disease associated with neuronal deficiency or for neuronal (re)generation
US11957695B2 (en) 2018-04-26 2024-04-16 The Broad Institute, Inc. Methods and compositions targeting glucocorticoid signaling for modulating immune responses
WO2019213660A2 (en) 2018-05-04 2019-11-07 The Broad Institute, Inc. Compositions and methods for modulating cgrp signaling to regulate innate lymphoid cell inflammatory responses
EP3837380A4 (en) 2018-08-17 2022-05-11 Cellecta, Inc. Multiplex preparation of barcoded gene specific dna fragments
CA3112792A1 (en) 2018-09-14 2020-03-19 Prelude Corporation Method of selection for treatment of subjects at risk of invasive breast cancer
WO2020077135A1 (en) 2018-10-10 2020-04-16 Dana-Farber Cancer Institute, Inc. Modulating resistance to bcl-2 inhibitors
AU2020228047A1 (en) 2019-02-27 2021-09-30 Madera Therapeutics, LLC Use of caseinolytic protease P function as a biomarker of drug response to imipridone-like agents
US20220154282A1 (en) 2019-03-12 2022-05-19 The Broad Institute, Inc. Detection means, compositions and methods for modulating synovial sarcoma cells
WO2020186235A1 (en) 2019-03-14 2020-09-17 The Broad Institute, Inc. Compositions and methods for modulating cgrp signaling to regulate intestinal innate lymphoid cells
US20220142948A1 (en) 2019-03-18 2022-05-12 The Broad Institute, Inc. Compositions and methods for modulating metabolic regulators of t cell pathogenicity
US20220152148A1 (en) 2019-03-18 2022-05-19 The Broad Institute, Inc. Modulation of type 2 immunity by targeting clec-2 signaling
US11210554B2 (en) 2019-03-21 2021-12-28 Illumina, Inc. Artificial intelligence-based generation of sequencing metadata
KR20210151944A (en) 2019-04-12 2021-12-14 더 리전트 오브 더 유니버시티 오브 캘리포니아 Compositions and methods for increasing muscle mass and oxidative metabolism
RU2709815C1 (en) * 2019-05-14 2019-12-23 Федеральное бюджетное учреждение науки "Нижегородский научно-исследовательский институт эпидемиологии и микробиологии им. академика И.Н. Блохиной" Федеральной службы по надзору в сфере защиты прав потребителей и благополучия человека Method of searching for molecular markers of a pathological process for differential diagnosis, monitoring and targeted therapy
WO2021030627A1 (en) 2019-08-13 2021-02-18 The General Hospital Corporation Methods for predicting outcomes of checkpoint inhibition and treatment thereof
US11981922B2 (en) 2019-10-03 2024-05-14 Dana-Farber Cancer Institute, Inc. Methods and compositions for the modulation of cell interactions and signaling in the tumor microenvironment
US11793787B2 (en) 2019-10-07 2023-10-24 The Broad Institute, Inc. Methods and compositions for enhancing anti-tumor immunity by targeting steroidogenesis
US11844800B2 (en) 2019-10-30 2023-12-19 Massachusetts Institute Of Technology Methods and compositions for predicting and preventing relapse of acute lymphoblastic leukemia
WO2021127610A1 (en) 2019-12-20 2021-06-24 EDWARD Via COLLEGE OF OSTEOPATHIC MEDICINE Cancer signatures, methods of generating cancer signatures, and uses thereof
WO2022192419A2 (en) 2021-03-09 2022-09-15 Massachusetts Institute Of Technology Methods of treating inflammatory bowel disease (ibd) with anti- tnf-blockade
WO2024028794A1 (en) 2022-08-02 2024-02-08 Temple Therapeutics BV Methods for treating endometrial and ovarian hyperproliferative disorders

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1323293C (en) * 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) * 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004339202A (en) * 2003-04-05 2004-12-02 F Hoffmann La Roche Ag Nucleotide analog having 6-membered ring
EP3018215A1 (en) 2006-02-13 2016-05-11 Fluidigm Canada Inc. Gene expression assays conducted by elemental analysis
EP3561071A1 (en) 2006-02-13 2019-10-30 Fluidigm Canada Inc. Gene expression assays conducted by elemental analysis
JP2011507493A (en) * 2007-12-04 2011-03-10 パナジーン インク. Method for selective labeling and detection of target nucleic acid using immobilized peptide nucleic acid probe {Method for selective labeling and detection of targeted nucleic acid soaking immunized benzidic acid probe}
JP2017528166A (en) * 2014-09-17 2017-09-28 ヴイアイティーオー エヌヴイ Methods and means for analyzing hybridization

Also Published As

Publication number Publication date
AU2253397A (en) 1997-08-20
JP2006191932A (en) 2006-07-27
WO1997027317A1 (en) 1997-07-31

Similar Documents

Publication Publication Date Title
JP2002515738A (en) Nucleic acid analysis
US6344316B1 (en) Nucleic acid analysis techniques
EP0853679B1 (en) Expression monitoring by hybridization to high density oligonucleotide arrays
US6582908B2 (en) Oligonucleotides
US7217522B2 (en) Genetic analysis by sequence-specific sorting
JP3863189B2 (en) Characterization to DNA
US7011949B2 (en) Methods and compositions for producing labeled probe nucleic acids for use in array based comparative genomic hybridization applications
US9464106B2 (en) Oligonucleotides useful for detecting and analyzing nucleic acids of interest
EP1660674B1 (en) Expression profiling using microarrays
US7552013B2 (en) Ratio-based oligonucleotide probe selection
US6340565B1 (en) Determining signal transduction pathways
US20060292614A1 (en) Methods of gene expression monitoring
WO2024048602A1 (en) Buffer composition for hybridization, and hybridization method
AU751557B2 (en) Expression monitoring by hybridization to high density oligonucleotide arrays

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051129

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060411

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060710

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060828

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20061204

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070123