JP2000511045A - Measurement of gene expression profiles in toxicity determination - Google Patents

Measurement of gene expression profiles in toxicity determination

Info

Publication number
JP2000511045A
JP2000511045A JP09515240A JP51524097A JP2000511045A JP 2000511045 A JP2000511045 A JP 2000511045A JP 09515240 A JP09515240 A JP 09515240A JP 51524097 A JP51524097 A JP 51524097A JP 2000511045 A JP2000511045 A JP 2000511045A
Authority
JP
Japan
Prior art keywords
group
tag
microparticles
compound
cdna molecules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP09515240A
Other languages
Japanese (ja)
Other versions
JP2000511045A5 (en
JP4105764B2 (en
Inventor
ブレナー,シドニー
Original Assignee
リンクス セラピューティクス,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by リンクス セラピューティクス,インコーポレイテッド filed Critical リンクス セラピューティクス,インコーポレイテッド
Priority claimed from PCT/US1996/016342 external-priority patent/WO1997013877A1/en
Publication of JP2000511045A publication Critical patent/JP2000511045A/en
Publication of JP2000511045A5 publication Critical patent/JP2000511045A5/ja
Application granted granted Critical
Publication of JP4105764B2 publication Critical patent/JP4105764B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 選択された組織の遺伝子発現プロフィールを測定することによって、テスト生物における化合物の毒性を評価するための方法が提供される。遺伝子発現プロフィールは、選択された組織から抽出されるmRNAから構築されたcDNAライブラリーのしっかりした並行サイン配列決定によって測定される。遺伝子発現プロフィールは、急性毒性テストならびに長期および慢性毒性テストの両方におけるテスト生物に化合物を投与する効果についての広範な情報を提供する。   (57) [Summary] Measuring the gene expression profile of a selected tissue provides a method for assessing the toxicity of a compound in a test organism. Gene expression profiles are measured by robust parallel signature sequencing of cDNA libraries constructed from mRNA extracted from selected tissues. Gene expression profiles provide extensive information about the effects of administering compounds to test organisms in both acute and long-term and chronic toxicity tests.

Description

【発明の詳細な説明】 毒性決定における遺伝子発現プロフィールの測定 発明の分野 本発明は、一般に、化学化合物の毒性を評価および/または決定するためのイ ンビトロおよびインビボシステムにおける表現型変化を検出およびモニターする 方法に関し、そしてより特定には、本発明は、薬物候補の毒性を決定するための インビトロおよびインビボシステムにおける遺伝子発現パターンの変化を検出お よびモニターする方法に関する。 背景 新化合物の毒性を迅速かつ便利に評価する能力は、非常に重要である。何千も の新化合物が毎年合成され、そして多くが、新しい市販の産物および加工の開発 によって、しばしばその短期および長期の健康への影響の知見がほとんどなしに 、環境中へ導入される。新薬物の開発では、候補化合物の安全性および有効性を 評価する費用は天文学的になっている:製薬産業は、新しい薬学化合物をマーケ ットにもたらすために平均約300,000,000ドルを費やす、例えば、13:226-228(19 95)。これらの費用の大部分は、開発過程のより後の段階における候補化合物の 失敗によるものである。すなわち、候補薬物の評価は、例えば、比較的安価な結 合アッセイまたはインビトロスクリーニングアッセイによって、薬物候補として の化合物の同定から進行するので、薬物動態学的研究に、毒性研究に、モデル系 における有効性研究に、前臨床試験などに関連するテストおよび分析の費用は、 途方もなく増加する。結果として、1度将来有望になった候補化合物が、さらに 開発することが商業的に実行不可能になる副作用または交差反応性を有すると決 定されるために、数千万ドルの費用がかかり得る。製薬開発の大きなチャレンジ は、薬物テストのより後の段階で失敗するような化合物を、できるだけ早くさら なる考慮から除去することである。 薬物開発プログラムは、この対象について明らかに構築される;しかし、急速 に増加する費用は、できるだけ早く間違った先導を同定するために、初期の段階 でさらに緊縮しかつより高価でないスクリーニングを開発する必要性を生じてい る。毒性評価は、このような改良が、薬物開発のためと、一般的に新化合物の環 境、健康、および安全性の効果を評価するためとの両方について行われる領域で ある。 代表的には、化合物の毒性は、制御された条件下で1種以上のテスト動物に化 合物を投与することによって、および広範囲のパラメータにおける効果をモニタ ーすることによって、決定される。パラメータには、血液化学、体重増加または 減少、種々の行動パターン、筋緊張、体温、呼吸数、致死率などのようなことが 挙げられ、これらはテスト動物の健康状態の尺度を集合的に提供する。正常範囲 型のこのようなパラメータの逸脱の程度は、化合物の毒性の尺度を提供する。こ のようなテストは、化合物の急性、長期(prolonged)、または慢性(chronic)毒性 を評価するために設計され得る。一般的に、急性テストは、テスト化学薬品の一 回での投与を包含する。テスト動物の観察期間は、2、3時間のような短期であ り得るが、通常は少なくとも24時間であり、そしてある場合には1週間以上の長 期であり得る。一般的に、長期のテストは、テスト化学薬品の複数回での投与を 包含する。テスト化学薬品は、毎日1回以上、食餌に組み込まれる場合は不規則 に、妊娠中のような特定の時に、またはある場合には規則的であるが隔週で投与 され得る。また、長期のテストでは、実験は、通常、ラットまたはマウスでは90 日間未満、あるいはイヌでは1年間行われる。急性および長期のタイプのテスト とは逆に、慢性毒性テストは、テスト化学薬品が、テスト動物の寿命の実質的な 部分の間投与されるテストである。マウスまたはラットの場合には、これは、2 〜3年の期間である。イヌの場合は、5〜7年間である。 このようなアッセイのために大群のテスト動物を、特に慢性毒性アッセイでは より大きな動物を樹立しそして維持することで、重要な費用が損なわれる。さら に、種特異的効果のため、このような毒性テストを省略することは、化合物がヒ トで使用される場合に毒性効果がないことを保証しない。しかし、このようなテ ストは、新化合物の安全性を判断するための情報の標準化されたセットを提供し 、そして関連化合物の予備評価についてのデータベースを提供する。毒性決定を 改 良するための重要な領域は、高価かつ退屈な動物アッセイの結果の予測になる新 しい注目すべきことの同定である。 他の医学分野では、バイオテクノロジーにおいて、特にDNA配列決定において の近年の進歩を、健常および病気の生物における区別して発現された遺伝子の同 定および研究へ適用することに、非常に興味があった。例えば、Adamsら,Scien ce,252:1651-1656(1991);Matsubaraら,Gene,135:265-274(1993);Rosen ber gら,国際特許出願PCT/US95/01863。このような適用の対象には、病気の過程の 知見を増加させること、病気の過程で重要な役割を果たす遺伝子を同定すること 、ならびに発現された遺伝子またはその産物を利用する診断および治療アプロー チを提供することが挙げられる。このようなアプローチは魅力的であるが、発現 された遺伝子の徹底的なまたはさらにサンプリングされた配列決定に基づくアプ ローチは、必要とされる多くの努力がさらに付きまとう:30,000〜35,000の異な る遺伝子が任意の所定の段階の代表的な噛乳動物組織で発現されると推定される 。例えば、Ausubelら編、Current Protocols,5.8.1-5.8.4(John Wiley & Sons ,New York,1992)。ある数の遺伝子産物のより小さな試料の配列を決定するこ とは、工業的規模の供給源を必要とする主要な企画である。したがって、発現さ れた遺伝子のしっかりした配列決定のルーチンの適用は、まだ現在の市販の技法 を越えない。 テスト動物の健康状態についてのより広いかつ正確な情報を提供する、候補薬 物のような化合物の毒性を評価するための新しいアッセイの利用可能性が、非常 に所望される。このような追加のアッセイは、好ましくは現在のテスト手順より も、高価でなく、より迅速で、そしてより便利であり、そして同時に、新化合物 の安全性に関する早い判断を行うために十分な情報を提供する。 発明の要旨 本発明の目的は、インビトロまたはインビボテストシステムにおける、遺伝子 発現パターンまたはプロフィールの検査に基づく毒性評価への新しいアプローチ を提供することである。 本発明の他の目的は、化学薬品、特に薬物候補の毒物学的特性に関する基本決 定へのデータベースを提供することである。 本発明のさらなる目的は、テスト動物の選択された組織における遺伝子発現パ ターンを分析する方法を提供することである。 本発明のなおさらなる目的は、テスト化合物への曝露に応じて区別して発現さ れる遺伝子を同定するためのシステムを提供することである。 本発明の目的は、遺伝子発現とテスト動物における短期および長期毒性とを相 互関連させる迅速かつ信頼できる方法を提供することである。 本発明の他の目的は、発現が有害な毒性の予測となる遺伝子を同定することで ある。 本発明は、テスト化合物に曝露された生物の1つ以上の選択された組織で発現 された遺伝子のしっかりした並行したサイン配列決定(massively parallel sign ature sequecing)の方法を提供することによって、これらおよび他の目的を達成 する。本発明の重要な特徴は、多数の異なるポリヌクレオチドの部分の配列を並 行に決定することによって、選択された組織についての遺伝子発現プロフィール の形成を可能にする新規DNAソーティングおよび配列決定法の適用である。この ようなプロフィールは、毒性を予測する発現パターンを同定するために、単一ま たは複数の時点でのコントロール生物の組織からのプロフィールと比較され得る 。 本発明のソーティング方法論は、オリゴヌクレオチドの最小で交差反応するセ ットのメンバーであるオリゴヌクレオチドタグを使用する。このようなセットの オリゴヌクレオチドの配列は、少なくとも2つのヌクレオチドによる同じセット の他のメンバー毎の配列とは異なる。したがって、このようなセットの各メンバ ーは、2つより少ないミスマッチを有する任意の他のメンバーの相補物との二重 鎖(または三重鎖)を形成し得ない。本発明のオリゴヌクレオチドタグの相補物 は、本明細書では「タグ相補物」といい、これは天然のヌクレオチドまたは非天 然のヌクレオチドアナログを含み得る。好ましくは、タグ相補物は、固相支持体 に付着される。対応するタグ相補物とともに使用される場合、このようなオリゴ ヌクレオチドタグは、cDNAのようなポリヌクレオチドをソーティングするための ハイブリダイゼーションの特異性を増強する手段を提供する。 それぞれソーティングされるポリヌクレオチドは、異なるポリヌクレオチドが 異なるタグを有するように付着されたオリゴヌクレオチドタグを有する。以下に より十分に説明されるように、この条件は、ポリヌクレオチドの群より実質的に 大きいタグのレパートリーを用いることによって、およびタグ付けされたポリヌ クレオチドの完全なアンサンブルからのタグ付けされたポリヌクレオチドの十分 に小さい試料を採用することによって、達成される。このようなサンプリング後 、支持体およびポリヌクレオチドの群が、オリゴヌクレオチドタグのそれぞれの 相補物との特異的ハイブリダイゼーションを可能にする条件下で混合される場合 、同一のポリヌクレオチドが、特定のビーズまたは領域上でソーティングする。 次いで、ポリヌクレオチドのソーティングされた群は、以下のより詳細に記載す るように、「単一塩基(single-base)」または「塩基毎(base-by-base)」配列決 定方法論によって、固相支持体上で配列決定され得る。 1つの局面では、本発明の方法は、以下の工程を包含する:(a)テスト生物に 化合物を投与する工程;(b)テスト生物の1つ以上の組織のそれぞれからmRNA分 子の群を抽出する工程;(c)別々の群の各cDNA分子が付着されたオリゴヌクレオ チドタグを有するように、1つ以上の組織から抽出されたmRNA分子の各群からcD NA分子の別々の群を形成する工程であって、オリゴヌクレオチドタグが同じ最小 交差ハイブリダイズセットから選択される、工程;(d)別々の群内の実質的にす べての異なるcDNA分子が付着された異なるオリゴヌクレオチドタグを有するよう に、cDNA分子の各群を別々にサンプリングする工程;(e)オリゴヌクレオチドタ グをそれぞれの相補物と特異的にハイブリダイズすることによってそれぞれ別々 の群のcDNA分子をソーティングする工程であって、それぞれの相補物が、1つ以 上の固相支持体上の空間的に異なる領域において実質的に同一の相補物の均一な 群として付着される、工程;(f)1つ以上の組織のそれぞれについて発現された 遺伝子の頻度分布を形成するために、それぞれ別々の群のソーティングされたcD NA分子のそれぞれの一部のヌクレオチド配列を決定する工程;および(g)1つ以 上の組織のそれぞれにおいて発現された遺伝子の頻度分布を化合物の毒性と相互 関係させる工程。 本発明の重要な局面は、発現が化合物の毒性の予測になる遺伝子の同定である 。一旦このような遺伝子が同定されると、これらは、遺伝子発現のための逆転写 酵 素ポリメラーゼ連鎖反応(RT-PCR)のような従来のアッセイで用いられ得る。 図面の簡単な説明 図1は、オリゴヌクレオチドの最小交差ハイブリダイズセットを生成するため のアルゴリズムのフローチャート表示である。 図2は、本発明によるポリヌクレオチド配列決定を行うための装置を図示する 。 定義 オリゴヌクレオチドタグに関して本明細書で使用される場合、「相補物」また は「タグ相補物」とは、オリゴヌクレオチドタグが特異的にハイブリダイズして 、完全に一致した二重鎖または三重鎖を形成するオリゴヌクレオチドをいう。特 異的ハイブリダイゼーションが三重鎖を生じる実施態様では、オリゴヌクレオチ ドタグは、二本鎖または一本鎖のいずれかに選択され得る。したがって、三重鎖 が形成される場合、用語「相補物」とは、一本鎖オリゴヌクレオチドタグの二本 鎖相補物または二本佐織後ヌクレオチドタグの一本鎖相補物のいずれかを包含す ることを意味する。 本明細書で使用される場合、用語「オリゴヌクレオチド」には、ワトソン・ク リックタイプの塩基対形成、塩基スタッキング、フーグスティーンまたは逆フー グスティーン型の塩基対形成などのようなモノマー対モノマー相互作用の調節パ ターンによって、標的ポリヌクレオチドに特異的に結合し得る、デオキシリボヌ クレオシド、リボヌクレオシド、そのアノマー形態、ペプチド核酸(PNA)など を含む、天然または改変されたモノマーまたは結合の直線オリゴマーが含まれる 。通常、モノマーは、ホスホジエステル結合またはそのアナログによって連結さ れて、少数のモノマー単位、例えば、3〜4から数十のモノマー単位までのサイ ズの範囲のオリゴヌクレオチドを形成する。オリゴヌクレオチドが「ATGCCTG」 のような文宇の配列で表される場合はいつでも、ヌクレオチドが左から右へ5'→ 3'の順であり、そして他に記載がなければ、「A」がデオキシアデノシンを示し 、「C」がデオキシシチジンを示し、「G」がデオキシグアノシンを示し、そして 「T」がチミジンを示すことが理解される。ホスホジエステル結合のアナログに は、ホスホロチオエート、ホスホロジチオエート、ホスホルアニリデート、ホス ホルアミデートなどが挙げられる。通常、本発明のオリゴヌクレオチドは、4つ の天然ヌクレオチドを含む;しかし、これらはまた、非天然ヌクレオチドアナロ グを含み得る。天然または非天然ヌクレオチドを有するオリゴヌクレオチドが用 いられる場合、例えば、酵素によるプロセシングが要求される場合、通常、天然 ヌクレオチドからなるオリゴヌクレオチドが必要とされることが当業者には明ら かである。 二重鎖に関して「完全に一致した」とは、各鎖におけるあらゆるヌクレオチド が他の鎖におけるヌクレオチドとワトソン・クリック塩基対形成を受けるように 、二重鎖を作り上げるポリ-またはオリゴヌクレオチド鎖が互いに二本鎖構造を 形成することを意味する。この用語はまた、用いられ得る、デオキシイノシン、 2-アミノプリン塩基を有するヌクレオシドのような、ヌクレオシドアナログの対 形成を包含する。三重鎖に関して、この用語は、三重鎖が、完全に一致した二重 鎖と、あらゆるヌクレオチドが、完全に一致した二重鎖の塩基対とフーグスティ ーンまたは逆フーグスティーン結合を受ける第3の鎖とからなることを意味する 。逆に、タグとオリゴヌクレオチドとの間の二重鎖における「ミスマッチ」とは 、二重鎖または三重鎖におけるヌクレオチドの対またはトリプレットが、ワトソ ン・クリックおよび/またはフーグスティーンおよび/または逆フーグスティー ン結合を受けないことを意味する。 本明細書で使用される場合、「ヌクレオシド」には、例えば、Kornbergおよび Baker,DNA Replication,第2版(Freeman,San Francisco,1992)に記載のよう に、2'-デオキシおよび2'-ヒドロキシル形態を含む、天然のヌクレオシドが含ま れる。ヌクレオシドに関して「アナログ」には、特異的ハイブリダイゼーション し得ることのみを除いては、例えば、Scheit,Nucleotide Analog(John Wiley, New York,1980);UhlmanおよびPeyman,Chemical Reviews,90:543-584(1990) などに記載される、改変された塩基部分および/または改変された糖部分を有す る合成ヌクレオシドが挙げられる。このようなアナログには、結合特性を増強し 、複雑性を減少させ、特異性を増加させるなどために設計された合成オリゴヌク レオチドが挙げられる。 ポリヌクレオチドに関して本明細書で使用される場合、「配列決定」または「 ヌクレオチド配列を決定すること」には、ポリヌクレオチドの部分ならびに全配 列情報を決定することが挙げられる。すなわち、この用語には、標的ポリヌクレ オチドにおける、配列比較、フィンガープリンティング、および標的ポリヌクレ オチドならびにヌクレオシド、通常、各ヌクレオシドの発現同定および順序付け についての情報の類似レベルが含まれる。この用語はまた、標的ポリヌクレオチ ド内のヌクレオチドの4つのタイプのうちの1、2、または3つの同定、順序づ け、および位置の決定を含む。例えば、いくつかの実施態様では、決定は、ヌク レオチドの単一タイプの順序づけおよび位置を同定することによって行われ得、 例えば、標的ポリヌクレオチド「CATCGC...」内のシトシンは、そのため、その 配列は、「C-(Cでない)-(Cでない)-C-(Cでない)-C...」については二進法コード 、例えば、「100101...」として表されるなどである。 本明細書で使用される場合、ポリヌクレオチドの群に関して用語「複雑性」と は、群に存在する分子の異なる種の数を意味する。 本明細書で使用される場合、等しく使用される用語「遺伝子発現プロフィール 」および「遺伝子発現パターン」とは、タグ-cDNA結合体の群からサンプリング されたcDNA分子の一部の配列の頻度分布を意味する。一般的に、配列の一部は、 その一部が生じたcDNAを独特に同定するために十分に長い。好ましくは、決定さ れる配列の総数は、少なくとも1000であり;より好ましくは、遺伝子発現プロフ ィールで決定される配列の総数は、少なくとも10,000である。 本明細書で使用される場合、「テスト生物」とは、テスト化合物への曝露への 測定可能な応答を提供する任意のインビトロまたはインビポシステムを意味する 。代表的には、テスト生物は、哺乳動物細胞培養物、特に、肝細胞、腎臓細胞、 コロニー形成細胞などの特定の組織の哺乳動物細胞培養物であるか、あるいは、 テスト生物は、ラット、マウス、ハムスター、モルモット、イヌ、ネコ、ウサギ 、ブタ、サルなどのような動物全体であり得る。 発明の詳細な説明 本発明は、化合物に曝露されたテスト生物の選択された組織における遺伝子発 現プロフィールの変化を分析することによって、化合物の毒性を決定する方法を 提供する。本発明はまた、急に発現されそして長期または慢性毒性と相互関係の ある個々の遺伝子または遺伝子の群からなる毒性マーカーを同定する方法を提供 し、あるいは、化合物が望ましくない反応性を有することを示唆する。遺伝子発 現プロフィールは、テストされる化合物に曝露されたテスト生物の組織から抽出 されたmRNAから、cDNA分子構築の一部を配列決定することによって生成される。 本明細書で使用される場合、用語「組織」は、細胞培養物のようなインビトロテ スト系に関して、単に培養物からの試料を意味すること以外は、通常の医学また は生物学的意味で用いられる。テスト生物に由来する遺伝子発現プロフィールは 、コントロール生物に由来する遺伝子発現プロフィールと比較されて、テストさ れる化合物への曝露のため、テスト生物で区別して発現される遺伝子を決定する 。両方の場合とも、遺伝子発現プロフィールの配列情報は、cDNAのしっかりした 並行のサイン配列決定によって得られ、これは上記の方法の工程(c)から(f)で行 われる。 毒性評価 インビトロおよびインビポ系において毒性テストを設計および実行するための 手順は周知であり、そしてLoomisらLoomis's Esstentials of Toxicology,第4 版(Academic Press,New York,1996);Echobichon,The Basics of Toxicity T esting(CRC Press,Boca Raton,1992);Frazier編,In Vitro Toxicity Testin g(Marcel Dekker,New York,1992)などのように、この主題について多くのテ キストに記載される。 毒性テストでは、テスト生物の2群が通常用いられる:一方の群はコントロー ルとして用い、そして他方の群には単回用量(急性毒性テストについて)で、ま たは数用量の投与計画(長期または慢性毒性テストについて)で、テスト化合物 を投与する。ほとんどの場合には、本発明の方法で要求されるような組織の抽出 は、テスト動物を屠殺することを必要とするので、コントロール群および化合物 投与群の両方とも、実験の期間中に遺伝子発現の動力学を観察することが所望さ れるならば、組織をサンプリングするための動物の除去を可能にするために十分 に大きくなければならない。 毒性研究を組み立てることにおいて、テストされる化合物、投与経路、用量範 囲などについて適切なテスト生物を選択するための、広範な指針が文献に提供さ れる。水または生理学的生理食塩水(水中に0.9%NaCl)は、これらの溶媒が種 々の経路による投与を可能にするので、テスト化合物についての選択すべき溶質 である。これが溶解性限界のため不可能である場合、プロピレングリコールが普 通に使用される、コーン油または有機溶媒でさえものような植物油の使用に頼る 必要がある。可能な場合はいつでも、乳化剤の懸濁液の使用は、経口投与以外は 避けるべきである。投与経路に関わりなく、所定の用量を投与するために必要な 容量は、使用される動物のサイズによって限定される。動物の群内および群間で 均一の各用量容量を保つことが所望される。ラットまたはマウスが使用される場 合、経口経路によって投与される容量は、0.005ml/グラム動物を越えるべきでは ない。水溶液または生理学的生理食塩溶液が、非経口注射に使用される場合でさ え、耐えられる容量は限定されるが、このような溶液は、通常無害であると考え られる。マウスにおける蒸留水の静脈内LD50は、約0.044ml/グラムであり、そし て等張生理食塩水のLD50は、0.068ml/グラムマウスである。 化合物が吸入によって投与されるべきである場合、テスト雰囲気を生成するた めの特別の技法が必要である。用量推定は、非常に複雑になる。この方法は、通 常、化合物を含む液体のエアロゾル化または噴霧化を包含する。テストされる薬 剤がかなりの蒸気圧を有する液体であるならば、制御された温度条件下で空気を 溶液に通すことによって投与され得る。これらの条件下で、用量は、単位時間当 たりの吸入される空気の容量、溶液の温度、および含まれる薬剤の蒸気圧から推 定される。気体はリザーバーから計量される。溶液の粒子が投与されるべき場合 、粒子サイズが約2μm未満でなければ、粒子は、肺の末端肺胞嚢に達しない。 種々の装置およびチャンバーが、吸入によって投与される場合、刺激剤または他 の毒性端点の効果を検出するための研究を行うために利用可能である。薬剤を動 物に投与する好ましい方法は、挿管法または食餌中に薬剤を組み込むことのいず れかによって、経口経路によるものである。 好ましくは、毒性評価を設計するにおいて、代謝、吸収、排出、組織貯蔵など の点でできる限りヒトに類似してテスト化合物を取り扱う、2つ以上の種が用い られるべきである。好ましくは、種々の濃度での複数回の用量または投与計画は 、毒性効果に関して用量−応答関係を確立するために用いられるべきである。そ して好ましくは、テスト動物への投与経路は、ヒトへの化合物の投与経路と同じ 、またはできる限り類似であるべきである。テスト動物への投与の1つの経路に より得られる効果は、ヒトへの別の投与経路による効果に経験的に適用可能では ない。例えば、ヒト用の食品添加物は、テスト動物の食餌中での物質の混合によ ってテストされるべきである。 急性毒性テストは、一回でテスト生物へ化合物を投与する工程からなる。この ようなテストの目的は、化合物の投与の結果の症候学を決定することおよび化合 物の致死率の程度を決定することである。最初の手順は、単一種において化合物 の一連の範囲発見用量を行うことである。これは、投与経路の選択、選択された 経路による投与に適切な形態での化合物の調製、および適切な種の選択を必要と する。好ましくは、最初の急性毒性研究は、その低費用、その利用可能性、およ びこれらの種における豊富な毒物学的参照データの利用可能性のため、ラットま たはマウスのいずれかで行われる。長期毒性テストは、3〜4カ月の期間にわた って、繰り返して、通常は毎日ベースで、テスト生物に化合物を投与する工程か らなる。このようなテストの設計を束縛する2つの実際の因子に遭遇する:第1 に、選択された経路が有害な効果を誘導することなく繰り返された投与に適切で なければならないので、投与の利用可能な経路は限定される。そして第2に、血 液、尿、およびおそらく他の試料は、テスト動物に顕著な有害性を誘導すること なく、繰り返して採取されるべきである。好ましくは、本発明の方法では、遺伝 子発現プロフィールは、以下の表に挙げられるような伝統的な毒物学的パラメー タの測定とともに得られる:血液学 血液化学 尿分析 赤血球数 ナトリウム pH 総白血球数 カリウム 比重 分化白血球数 塩素 総タンパク質 ヘマトクリット カルシウム 沈渣 ヘモグロビン 二酸化炭素 グルコース 血清グルタミン−ピルビン酸 ケトン トランスアミナーゼ 血清グルタミン-オキザロ酢酸 ビリルビン トランスアミナーゼ 血清タンパク質 電気泳動 血糖 血液尿素窒素 総血清タンパク質 血清アルブミン 総血清ビリルビン オリゴヌクレオチドタグおよびタグ相補物 オリゴヌクレオチドタグは、オリゴヌクレオチドの最小交差ハイブリダイズセ ットのメンバーである。このようなセットのオリゴヌクレオチドの配列は、少な くとも2つのヌクレオチドが、同じ七ットのあらゆる他のメンバーの配列とは異 なる。したがって、このようなセットの各メンバーは、2つ未満のミスマッチと の任意の他のメンバーの相補物と、二重鎖(または三重鎖)を形成し得ない。本 明細書で「タグ相補物」と呼ばれる、オリゴヌクレオチドタグの相補物は、天然 ヌクレオチドまたは非天然ヌクレオチドアナログを含み得る。好ましくは、タグ 相補物は、固相支持体に結合する。このようなオリゴヌクレオチドタグは、対応 するタグ相補物とともに使用される場合、分子、特にポリヌクレオチドをソーテ ィング、トラッキング、または標識するためにハイブリダイゼーションの特異性 を増強する手段を提供する。 オリゴヌクレオチドタグおよびタグ相補物の最小交差ハイブリダイズセットは 、所望のセットのサイズおよび交差ハイブリダイゼーションが最小であることが 求められる程度(または他の方法で述べると、特異性が増強されることが求めら れ る程度)に依存して、組み合わせて、または個々に、のいずれかで合成され得る 。例えば、最小交差ハイブリダイズセットは、少なくとも4ヌクレオチドが互い に異なる個々に合成された10マー配列のセットからなり得、このようなセットは 、332の最大サイズを有する(3種のヌクレオチドから構成されそして付録Icに 開示されるようなコンピュータプログラムを使用して計数される場合)。あるい は、オリゴヌクレオチドタグの最小交差ハイブリダイズセットはまた、それ自体 が最小交差ハイブリダイズセットから選択されるサブユニットから組み合わせて 組み立てられ得る。例えば、少なくとも3ヌクレオチドによって他方とは異なる 最小交差ハイブリダイズ12マーのセットは、3ヌクレオチドが互いに異なる最小 交差ハイブリダイズ4マーのセットから選択された3つのサブユニットを組み立 てることによって合成され得る。このような実施態様は、93、すなわち729、12 マーの最大のサイズのセットを提供する。数字9は、付録Iaのコンピュータプロ グラムに挙げられるオリゴヌクレオチドの数であり、これは、10マーでのように 、ヌクレオチドの4つの異なるタイプのうちの3つのみが使用されると仮定する 。付録Ia〜cのコンピュータプログラムが、所定の入力(例えば、長さ、組成、 メンバー間のヌクレオチドの数の差)について最大のセットを提供するので、セ ットは、「最大」として記載される。さらに最小交差ハイブリダイズセットは、 このような計算されたセットのサブセットから形成され得る。 オリゴヌクレオチドタグは、一本鎖であり得、そして二重鎖形成による一本鎖 タグ相補物への特異的ハイブリダイゼーションのために、または三重鎖形成によ る二本鎖タグ相補物への特異的ハイブリダイゼーションのために設計され得る。 オリゴヌクレオチドタグはまた、二本鎖であり得、そして三重鎖形成による一本 鎖タグ相補物への特異的ハイブリダイゼーションのために設計され得る。 組み合わせて合成される場合、オリゴヌクレオチドタグは、好ましくは、多数 のサブユニットからなり、各サブユニットは、3〜9ヌクレオチドの長さのオリ ゴヌクレオチドからなり、ここで各サブユニットは同じ最小交差ハイブリダイズ セットから選択される。このような実施態様では、利用可能なオリゴヌクレオチ ドタグの数は、タグ当たりのサブユニットの数およびサブユニットの長さに依存 する。一般的に、数は、すべての可能な配列の数よりも非常に少なく、タグの長 さは、nヌクレオチド長のタグについては4nである。 固相支持体に結合されたオリゴヌクレオチドタグの相補物は、タグを含むポリ ヌクレオチドそれぞれの混合物からポリヌクレオチドをソーティングするために 使用される。オリゴヌクレオチドタグの相補物は、同一配列の群が特異的領域で 生成されるような微細ビーズまたは単一支持体上の合成位置の整列における特異 的位置のような、固相支持体の表面上で合成される。すなわち、ビーズの場合ま たは各領域の場合、整列の場合には、各支持体の表面は、特定の配列を有する相 補物の1つのみのタイプによって誘導体化される。このようなビーズまたは領域 の群は、異なる配列との相補物のレパートリーを含む。オリゴヌクレオチドタグ およびタグ相補物に関して本明細書で使用される場合、用語「レパートリー」と は、特定の実施態様でタグを作り上げるオリゴヌクレオチドの最小交差ハイブリ ダイズセットのセットまたはタグ相補物の対応するセットを意味する。 ソーティングされるポリヌクレオチドはそれぞれ、異なるポリヌクレオチドが 異なるタグを有するように、付着されるオリゴヌクレオチドタグを有する。以下 により十分に説明されるように、この条件は、ポリヌクレオチドの群より実質的 に大きいタグのレパートリーを用いることによって、およびタグ付けされたポリ ヌクレオチドの完全アンサンブルからタグ付けされたポリヌクレオチドの十分に 小さい試料を採取することによって達成される。このようなサンプリングの後、 支持体およびポリヌクレオチドの群が、それぞれの相補物とオリゴヌクレオチド タグの特異的ハイブリダイゼーションを可能にする条件下で混合される場合、同 一のポリヌクレオチドは、特定のビーズまたは領域上でソーティングされる。 最小交差ハイブリダイズセットのオリゴヌクレオチドのヌクレオチド配列は、 ソースコードが付録IaおよびIbに挙げられるプログラムによって例示されるよう な、単純なコンピュータプログラムによって便宜上列挙される。付録Iaのプログ ラムminhxは、3種のヌクレオチドから構成される4マーサブユニットを有する すべての最小交差ハイブリダイズセットを計算する。付録IbのプログラムtagNは 、最小交差ハイブリダイズセットのより長いオリゴヌクレオチドを列挙する。類 似のアルゴリズムおよびコンピュータプログラムは、本発明の任意の実施態様に ついて最小交差ハイブリダイズセットのオリゴヌクレオチドを挙げるために容易 に 書かれる。以下の表Iは、指示された長さについての最小交差ハイブリダイズオ リゴヌクレオチドのセットのサイズおよびヌクレオチドの差異の数についての指 針を提供する。上記のコンピュータプログラムを使用して数を生成した。 本発明のいくつかの実施態様について、タグの非常に大きなレパートリーが必 要とされない場合、最小交差ハイブリダイズセットのオリゴヌクレオチドタグは 、別々に合成され得る。数百から数千、または数万ものオリゴヌクレオチドを含 むセットは、種々の並行合成アプローチによって直接合成され得、例えば、以下 に開示される:Frankら,米国特許第4,689,405号;Frankら,Nucleic Acids Res earch,11:4365-4377(1983);Matsonら,Anal.Biochem.,224:110-116(1995); Fodorら,国際特許出願PCT/US93/04145;Peaseら,Proc.Natl.Acad.Sci., 91:5022-5026(1994);Southernら,J.Biotechnology,35:217-227(1994);Bren nan,国際出願PCT/US94/05896;Lashkariら,Proc.Natl.Acad.Scl.,92:7912 -7915(1995)など。 好ましくは、本発明のオリゴヌクレオチドタグは、3と6との間のヌクレオチ ド長のサブユニットから組み合わせで合成され、そして同じ最小交差ハイブリダ イズセットから選択される。この範囲におけるオリゴヌクレオチオについて、こ のようなセットのメンバーは、図1のアルゴリズムに基づいてコンピュータープ ログラムによって列挙され得る。 図1のアルゴリズムは、最初に、最小交差ハイブリダイズセットのサブユニッ トの特徴、すなわち、長さ、メンバー間の塩基の差異の数、および組成を定義す ることによって行われ、例えば、これらは、2、3、および4種の塩基からなる 。表Mn、n=1は、所定の長さおよび組成のすべての可能な配列からなる(100) が生成される。最初のサブユニットS1が選択され、そして表の最後に対するi =n+1についての連続するサブユニットSiと(120)を比較する。連続するサブ ユニットが、最小交差ハイブリダイズセットのメンバーであるミスマッチの必要 とされる数を有する場合はいつでも、新しい表Mn+1(125)において、工程120を 通過する前に予め選択されたサブユニットも含むことが省かれる。例えば、比較 の最初のセットでは、M2はS1を含み;比較の第2のセットでは、M3はS1およ びS2を含み;比較の第3のセットでは、M4はS1、S2、およびS3を含むなど である。同様に、表Mjにおける比較は、SjとMjにおけるすべての連続するサ ブユニットとの間である。サブユニットが工程130による連続通過で排除される ので、各連続する表Mn+1がその前のものよりも小さいことに留意すること。表 Mnのあらゆるサブユニットが(140)と比較された後、古い表は新しい表Mn+1に 置換され、そして比較の次のラウンドが始まる。選択されたサブユニットSiと 比較するために連続するサブユニットを含まない表Mnが達成される場合、すな わち、Mn=Mn+1の場合、プロセスは(160)を停止する。 好ましくは、最小交差ハイブリダイズセットは、セット中のあらゆる他のサブ ユニットとして二重鎖安定性へのほとんど等しい貢献を行うサブユニットを含む 。このように、あらゆるサブユニットとその相補物との間の完全に一致した二重 鎖 の安定性は、ほぼ等しい。このようなセットを選択するための指針は、最適PCR プライマーを選択することおよび二重鎖安定性を計算することについての公開さ れた技法によって提供される:例えば、Rychlikら,Nucleic Acids Research,1 7:8543-8551(1989)および18:6409-6412(1990);Breslauerら,Proc.Natl.Acad .Sci.,83:3746-3750(1986);Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:2 27-259(1991)など。より短いタグ、例えば、約30ヌクレオチド以下については、 RychlikおよびWetmurに記載されるアルゴリズムが好ましく、そしてより長いタ グ、例えば、約30〜35ヌクレオチド以上については、Suggsら,683-693頁,Brow n編,ICN-UCLA Symp.Dev.Biol.23巻(Academic Press,New York,1981)に開 示されるアルゴリズムが、便利に用いられ得る。明らかに、本発明の範囲内の最 小交差ハイブリダイズサブユニットのセットを設計するために、多くのアプロー チが当業者に利用可能である。例えば、末端ヌクレオチドの異なる塩基スタッキ ングエネルギーの影響を最小にするために、サブユニットが組み立てられる場合 、同じ末端ヌクレオチドを有するサブユニットが提供され得る。このように、サ ブユニットが連結される場合、すべての連結する末端ヌクレオチドの塩基スタッ キングエネルギーの合計は同じであり、それによってタグの融点の変動性を減少 または排除する。 以下のイタリックで示す、末端ヌクレオチドの「語」はまた、完全な一致がそ れと任意の他のタグ相補物上の類似の末端「語」との間でいつも形成されるよう に、タグの各末端に付加され得る。このような増大されたタグは以下の形態を有 する: ここで、プライムされたW’は相補物を示す。タグの末端が完全にマッチした二 重鎖をいつも形成するので、すべてのミスマッチした語は、内部ミスマッチであ り、それによって他に末端でミスマッチした語を有するタグ-相補物二重鎖の安 定性を減少させる。内部ミスマッチを有する二重鎖が、末端での同じミスマッチ を有する二重鎖よりも著しく安定でないことは周知である。 最小交差ハイブリダイズセットの好ましい実施態様は、サブユニットが4つの 天然ヌクレオチドのうちの3つから作り上げられるセットである。以下により十 分に論議されるように、オリゴヌクレオチドタグにおけるヌクレオチドの1つの タイプの不在は、DNAポリメラーゼの5'→3'エキソヌクレアーゼ活性の使用によ って、標的ポリヌクレオチドが固相支持体上にロードされることを可能にする。 以下は、A、G、およびTからなる群より選択される4つのヌクレオチドを含む サブユニットそれぞれの代表的な最小交差ハイブリダイズセットである: このセットでは、各メンバーは、あらゆる他のメンバーの相補物との3つのミス マッチした塩基を有する二重鎖を形成する。 さらなる代表的な最小交差ハイブリダイズセットを、以下に表IIIに挙げる。 明らかに、追加のセットは、ヌクレオチドの異なる群を置換することによって、 または公知の最小交差ハイブリダイズセットのサブセットを使用することによっ て、生成され得る。 表III 4マーサブユニットの代表的な最小交差ハイブリダイズセット 本発明のオリゴヌクレオチドタグおよびその相補物は、ホスホラミダイト化学 反応のような標準的化学反応を使用して、自動化DNA合成機、例えば、Applied B iosystems,Inc.(Foster City,California)モデル392または394 DNA/RNA Synt hesizerで都合良く合成され、例えば、以下の参考文献に開示される:Beaucage およびIyer,Tetrahedron,48:2223-2311(1992);Molkoら,米国特許第4,980,46 0号;Kosterら,米国特許第4,725,677号;Caruthersら,米国特許第4,415,732; 同第4,458,066号;および同第4,973,679号など。得られるオリゴヌクレオチドが 特異的にハイブリダイゼーションし得ることを除いては、例えば、ホスホロチオ エート、ホスホラミダイトなどのような非天然骨格基を生じる代替の化学反応も 、用いられ得る。いくつかの実施態様では、タグは、酵素によってプロセシング またはマニピュレーションを可能にする天然に存在するヌクレオチドを含み得る が、対応するタグ相補物は、ソーティング中により安定な二本鎖の形成を促進す る、ペプチド核酸、または類似化台物のような非天然ヌクレオチドアナログを含 み得る。 微粒子が支持体として使用される場合、オリゴヌクレオチドタグおよびタグ相 補物のレパートリーは、「分割および混合」技術によるサブユニット関連合成に よって生成され得、例えば、Shortleら,国際特許出願PCT/US93/03418またはLyt tleら,Biotechniques,19:274-280(1995)に開示される。簡単にいえば、合成の 基本単位は、オリゴヌクレオチドタグのサブユニットである。好ましくは、ホ スホラミダイト化学反応が使用され、そして3'ホスホラミダイトリゴヌクレオチ ドは、最小交差ハイブリダイズセットにおける各サブユニットについて調製され 、例えば、上記に列挙された第1のセットについては、8つの4マー3'-ホスホ ラミダイトがある。合成は、Shortleらに開示されるようにか、またはヌクレオ シドモノマーを使用して異なるオリゴヌクレオチドライブラリーを生成するため に用いられる技法を用いて直接的な類推において進められ、例えば、Teleniusら ,Genomics,13:718-725(1992);Welshら,Nucleic Acids Research,19:5275 -5279(1991);Grothuesら,Nucleic Acids Research,21:1321-1322(1993);Har tley,欧州特許出願90304496.4;Lamら,Nature,354:82-84(1991);Zuckerman ら,Int.J.Pept.Protein Research,40:498-507(1992)などに開示される。一 般的に、これらの技法は、単に、カップリング工程中に増大するオリゴヌクレオ チドへの活性化されたモノマーの混合物の適用を要求する。好ましくは、オリゴ ヌクレオチドタグおよびタグ相補物は、タグの構築で使用される異なる種類の語 の数より大きいかまたは等しい、多くの合成チャンバーを有するDNA合成機で合 成される。すなわち、好ましくは、各タイプの語に対応する合成チャンバーがあ る。この実施態様では、語が5ヌクレオチドからなる場合のように、各合成チャ ンバーで5つのモノマーカップリングがあるように、語は、ヌクレオチド毎に付 加される。語が完全に合成された後、合成支持体は、チャンバーから取り出され 、混合され、そして語付加の次のサイクルのためのチャンバーに再分配される。 この後の実施態様は、例えば、ホスホラミダイト化学で、モノマー付加の高いカ ップリング収率を利用する。 タグの二本鎖形態は、相補鎖を別々に合成すること、次いで二本鎖形成を可能 にする条件下で混合することによって行われ得る。あるいは、二本鎖タグは、プ ライマー結合部位として役立つ既知のオリゴヌクレオチド配列に連結された一本 鎖レパートリーを最初に合成することによって形成され得る。次いで、第2鎖は 、一本鎖レパートリーをプライマーと合わせること、およびポリメラーゼで伸長 することによって合成される。この後者のアプローチは、Oliphantら,Gene,44 :177-183(1986)に記載される。次いで、このような二本鎖タグは、本発明に従っ て、標的ポリヌクレオチドのソーティングおよびマニピュレーションのための標 的ポリヌクレオチドとともに、クローニングベクターに挿入され得る。 PNAまたはオリゴヌクレオチドN3'→P5'ホスホラミダイトのような、増強され た結合の特徴を有するヌクレオチドから作成されるタグ相補物が用いられる場合 、ソーティングは、タグを一本鎖にするためにDNAポリメラーゼの3'→5'エキソ ヌクレアーゼ活性を用いる「ストリッピング」反応の代わりとして、天然ヌクレ オチドおよびそのPNAまたはホスホラミダイト相補物を含む、タグ間のD-ループ の形成によって行われ得る。 本発明のオリゴヌクレオチドタグは、12〜60ヌクレオチドまたは塩基対の長さ の範囲であり得る。好ましくは、オリゴヌクレオチドタグは、18〜40ヌクレオチ ドまたは塩基対の長さの範囲である。より好ましくは、オリゴヌクレオチドタグ は、25〜40ヌクレオチドまたは塩基対の長さの範囲である。好ましい、そしてよ り好ましい数の立場から、これらの範囲は以下のように表され得る: 表IV 好ましい実施態様におけるタグ中のサブユニットの数 サブユニット中のモノマー オリゴヌクレオチドタグ中のヌクレオチド (12-60) (18-40) (25-40) 3 4-20サブユニット 6-13サブユニット 8-13サブユニット 4 3-15サブユニット 4-10サブユニット 6-10サブユニット 5 2-12サブユニット 3-8サブユニット 5-8サブユニット 6 2-10サブユニット 3-6サブユニット 4-6サブユニット より好ましくは、オリゴヌクレオチドタグは、一本鎖であり、そして特異的ハイ ブリダイゼーションは、タグ相補物とのワトソン・クリック対形成によって生じ る。 好ましくは、本発明の一本鎖オリゴヌクレオチドタグのレパートリーは、少な くとも100メンバーを含み;より好ましくは、このようなタグのレパートリーは 、少なくとも1000メンバーを含み;そして最も好ましくは、このようなタグのレ パ ートリーは、少なくとも10,000メンバーを含む。 三重鎖タグ 特異的ハイブリダイゼーションが三重鎖形成によって生じる実施態様では、タ グ配列のコードが二本鎖形成タグについてと同じ原理に従い;しかし、サブユニ ット配列の選択におけるさらなる制約がある。一般的に、Hoogsteenタイプの結 合による第3の鎖は結合は、二本鎖標的におけるホモピリミジン−ホモプリント ラックとともに最も安定である。通常、塩基トリプレットは、T-A*TまたはC-G*C モチーフ(ここで、「-」はワトソン・クリック対形成を示し、そして「*」はHo ogsteenタイプの結合を示す)中で形成し;しかし、他のモチーフもまた可能で ある。例えば、Hoogsteen塩基対形成は、条件および鎖の組成に依存して、第3 の鎖(Hoogsteen鎖)と第3の鎖が結合する二本鎖のプリンリッチ鎖との間の平 行および逆平行の配向を可能にする。特定の実施態様で所望される三重鎖の安定 性を最大にするか、またはさもなくば調節するために、適切な配列、配向、条件 、ヌクレオシドタイプ(例えば、リボースまたはデオキシリボースヌクレオシド が用いられるかどうか)、塩基改変(例えば、メチル化シトシンなど)を選択す るために、文献に広範な指針がある。例えば、Robertsら,Proc.Natl.Acad.S ci.,88:9397-9401(1991);Robertsら,Science,258:1463-1466(1992);Robert sら,Proc.Natl.Acad.Sci.,93:4320-4325(1996);Distefanoら,Proc.Natl .Acad.Sci.,90:1179-1183(1993);Mergnyら,Biochemistry,30:9791-9798(1 991);Chengら,J.Am.Chem.Soc.,114:4465-4474(1992);BealおよびDervan ,Nucleic Acids Research,20:2773-2776(1992);BealおよびDervan,J.Am.C hem.Soc.,114:4976-4982(1992);Giovannangeliら,Proc.Natl.Acad.Sci. ,89:8631-8635(1992);MoserおよびDervan,Science,238:645-650(1987);McS hanら,J.Biol.Chem.,267:5712-5721(1992);Yoonら,Proc.Natl.Acad.Sc i.,89:3840-3844(1992);Blumeら,Nucleic Acids Research,20:1777-1784(19 92);ThuongおよびHelene,Angew.Chem.Int.Ed.Engl.32:666-690(1993);E scudeら,Proc.Natl.Acad.Sci.,93:4365-4369(1996)など)。一本鎖または 二本鎖タグをその一本鎖または二本鎖相補物にアニ ールするための条件は周知である(例えば、Jiら,Anal.Chem.65:1323-1328(1 993);Cantorら,米国特許第5,482,836号など。三重鎖タグの使用は、その相補 物にアニールするためのタグを曝露するために、ポリメラーゼとの「ストリッピ ング」反応を必要としない利点がある。 好ましくは、三重鎖ハイブリダイゼーションを用いる本発明のオリゴヌクレオ チドタグは二本鎖DNAであり、そして対応するタグ相補物は一本鎖である。より 好ましくは、タグとその相補物との間に形成される三重鎖のpH安定性の範囲を広 げるために、タグ相補物中のシトシンの代わりに、5-メチルシトシンが使用され る。三重鎖を形成するために好ましい条件は、上記の参考文献に十分に開示され る。簡単にいえば、ハイブリダイゼーションは、5.5以下(または、5-メチルシ トシンが使用される場合は6.5)のpHでの濃い塩溶液(例えば、1.0M NaCl、1.0M 酢酸カリウムなど)で行う。ハイブリダイゼーション温度は、タグの長さおよび 組成に依存し;しかし、より長い18〜20マータグについては、室温でのハイブリ ダイゼーションが適切である。洗浄は、室温にて、濃くない塩溶液、例えば、10 mM酢酸ナトリウム、100mM MgCl2、pH5.8で行われ得る。タグは、pH9.0での同様 の塩溶液中でのインキュベーションによってこれらのタグ相補物から溶出され得 る。 三重鎖を形成するオリゴヌクレオチドタグの最小交差ハイブリダイズセットは 、添付物Icのコンピュータプログラムまたは類似のプログラムによって生成され 得る。二本鎖8マー語の代表的セットは、大文字で以下に列挙され、対応する相 補物は小文字で列挙される。このような語のそれぞれは、3つの塩基対によって セット中の他の語のそれぞれとは異なる。表V 二本鎖8マータグの例示的最小交差ハイブリダイズセット 表VI タグ相補物と三重鎖を形成する種々の二本鎖タグのレパートリーサイズ 好ましくは、本発明の二本鎖オリゴヌクレオチドタグのレパートリーは、少な くとも10メンバーを含み;より好ましくは、このようなタグのレパートリーは少 なくとも100メンバーを含む。好ましくは、語は、組み合わせて合成された二本 鎖オリゴヌクレオチドタグについては4と8との間のヌクレオチドの長さであり 、そしてオリゴヌクレオチドタグは、12と60との間の塩基対の長さである。より 好ましくは、このようなタグは、18と40との間の塩基対の長さである。 固相支持体 本発明での使用のための固相支持体は、微粒子、ビーズ、および膜、スライド 、プレート、マイクロマシン化(micromachined)チップなどを含む、広範な種々 の 形態を有し得る。同様に、本発明の固相支持体は、ガラス、プラスチック、シリ コン、アルカンチオエート誘導体化金、セルロース、低架橋および高架橋ポリス チレン、シリカゲル、ポリアミドなどを含む、広範な種々の組成物を含み得る。 好ましくは、それぞれが同じタグ(および他ではない)の相補配列の均一なコー ティングもしくは群を有するように、別々の粒子の群のいずれかが用いられるか 、または、同じタグ(および他ではない)への相補配列の均一のコーティングも しくは群をそれぞれ含む空間的に異なる領域を有する、単一または少数の支持体 が用いられる。後の実施態様では、領域の面積は、特定の適用に従って変化し得 る;通常、領域は、数μm2、例えば、3〜5から数百μm2、例えば、100〜500 までの面積の範囲である。好ましくは、このような領域は、隣接領域での事象( 例えば、蛍光発光)によって生じるシグナルが、用いられている検出システムに よって解析され得るように、空間的に分離される。いくつかの適用では、例えば 、同時配列分析について、またはタグ化分子を別々に近位に持ってくることにつ いて、1つより多くのタグ相補物の均一なコーティングを有する領域を有するこ とが所望され得る。 例えば、Lundら,Nucleic Acids Research,16:10861-10880(1988);Albretse nら,Anal.Biochem.,189:40-50(1990);Wolfら,Nucleic Acids Research,15 :2911-2926(1987);またはGhoshら,Nucleic Acids Research,15:5353-5372(19 87)に開示されるように、タグ相補物は、固相支持体とともに使用され得、タグ 相補物がそこで合成されるか、あるいは別に合成され、そして使用のために付着 され得る。好ましくは、タグ相補物は、同じ固相支持体上で合成されてともに使 用され、これは種々の形態を含み得、そして種々の連結部分を含み得る。タグ相 補物の均一の群が合成される領域のこのような支持体は、微粒子または整列、あ るいはマトリクスを含み得る。広範な種々の微粒子支持体が本発明で使用され得 、これは、制御された孔ガラス(CPG)、高架橋ポリスチレン、アクリルコポリ マー、セルロース、ナイロン、デキストラン、ラテックス、ポリアクロレインな どから生成される微粒子を含み、以下の例示的参考文献に開示される:Meth.En zymol.,A項,11-147頁,44巻(Academic Press,New York,1976);米国特許第4 ,678,814号;同第4,413,070号;および同第4,046,720号;およびPon,19章, Agrawal編,Methods in Molecular Biology,20巻,(Humana Press,Totowa,NJ ,1993)。微粒子支持体は、市販のヌクレオシド誘導体化CPGおよびポリスチレン ビーズ(例えば、Applied Biosystems,Foster City,CAから入手可能);誘導 体化磁性ビーズ;ポリエチレングリコールでグラフトされたポリスチレン(例え ば、TentaGelTM,Rapp Polymere、Tubingen Germany)などをさらに含む。物質 、多孔性、サイズ、形状などのような支持体の特徴、ならびに用いられる連結部 分のタイプの選択は、タグが使用される条件下に依存する。例えば、酵素での連 続的プロセシングを含む適用では、酵素の立体障害を最小化し、そして基質への 接近を容易にする支持体およびリンカーが好ましい。最も適切な微粒子支持体の 選択において考慮されるべき他の重要な因子には、サイズの均一性、合成支持体 としての有効性、既知の表面積の程度、および光学特性が挙げられ、例えば、以 下のより十分な説明として、表面上で多数のビーズを扱う場合、傷のない平滑な ビーズは機械的利点を提供する。 微粒子表面上でタグを付着および/または合成するための例示的な連結部分は 、Ponら,Biotechniques,6:768-775(1988);Webb,米国特許第4,659,774号;Ba ranyら,国際特許出願PCT/US91/06103;Brownら,J.Chem.Soc.Commun.,1989 :891-893;Damhaら,Nucleic Acids Research,18:3813-3821(1990);Beattieら ,Clinical Chemistry,39:719-722(1993);MaskosおよびSouthern,Nucleic Ac ids Research,20:1679-1684(1992)などに開示される。 上記のように、タグ相補物はまた、タグ相補物で均一にコーティングされた領 域の配列を形成するために、単一(または少数)の固相支持体上で合成され得る 。すなわち、このような配列中の各領域内で、同じタグ相補物が合成される。こ のような配列を合成するための技術は、McGallら,国際特許出願PCT/US93/03767 ;Peaseら,Proc.Natl.Acad.Sci.,91:5022-5026(1994);SouthernおよびMas kos,国際特許出願PCT/GB89/01114;MaskosおよびSouthern(前出);Southern ら,Genomics,13:1008-1017(1992);およびMaskosおよびSouthern,Nucleic Ac ids Research,21:4663-4669(1993)に開示される。 好ましくは、本発明は、同じタグ配列の相補物で均一にコーティングされた微 粒子またはビーズで行われる。微粒子支持体およびその表面にオリゴヌクレオチ ドを共有結合または非共有結合する方法は、以下の参考文献によって例示される ように、周知である:BeaucageおよびIyer(前出);Gait編,Oligonucleotide Synthesis:A Practical Approach(IRL Press,Oxford,1984);および前出の参 考文献。一般的に、微粒子のサイズおよび形状は重要ではない;しかし、少数、 例えば、1〜2から数百、例えば、200〜1000μm直径のサイズ範囲の微粒子が 好ましい。なぜなら、これらは、最少の試薬および試料使用でのオリゴヌクレオ チドタグの大きなレパートリーの構築およびマニピュレーションを容易にするか らである。 いくつかの好ましい適用では、市販の制御された孔ガラス(CPG)またはポリ スチレン支持体は、本発明において固相支持体として用いられる。このような支 持体は、塩基に不安定なリンカーおよび付着される最初のヌクレオチドとともに 利用可能になる。例えば、Applied Biosystems(Foster City,CA)。好ましくは 、500〜1000オングストロームの孔サイズを有する微粒子が用いられる。 他の好ましい適用では、非孔性微粒子が、それらの光学特性について用いられ 、これは顕微鏡スライドのような平らな支持体上で多数の微粒子を追跡する場合 、有利に使用され得る。特に好ましい非孔性微粒子は、Bangs laboratories(Car mel,IN)から入手可能なグリシダルメタクリレート(GMA)ビーズである。この ような微粒子は、種々のサイズで有用であり、そしてタグまたはタグ相補物を合 成するための種々の連結基で誘導体化される。好ましくは、タグ化された微粒子 の大量の平行するマニピュレーションのために、5μm直径GMAビーズが用いら れる。 固相支持体上でソーティングするためにタグをポリヌクレオチドに 付着させる工程 本発明の重要な局面は、例えば、cDNAライブラリーからの、ポリヌクレオチド の群のソーティング、および各微粒子または領域が1種のみの付着されるポリヌ クレオチドを実質的に有するように固相支持体上の別々の領域へのポリヌクレオ チドの付着である。この目的は、実質的にすべての異なるポリヌクレオチドが付 着された異なるタグを有することを保証することによって達成される。次に、こ の条件は、分析のためにタグ-ポリヌクレオチド結合体の完全な集合の試料を採 取することによって達成される。(2つの異なる位置で操作または2度分析され ている同じポリヌクレオチドを得るのみなので、同一のポリヌクレオチドが異な るタグを有することは、許容可能である。)このようなサンプリングは、タグが ポリヌクレオチドに付着された後、明白に--例えば、より大きな混合物から小容 量を採取することによって--行われ得るか、ポリヌクレオチドおよびタグをプロ セシングするために使用される技術の二次的効果として本質的に行われ得るか、 またはサンプリングは、明白かつプロセシング工程の固有の部分としての両方で 行われ得るかのいずれかである。 好ましくは、実質的にすべての異なるcDNAが異なるタグを有するcDNAライブラ リーを構築することにおいて、その複雑性、または異なるタグの数が、細胞また は組織試料から抽出されるmRNAの総数を大きく越えるタグレパートリーが用いら れる。好ましくは、タグレパートリーの複雑性は、ポリヌクレオチド集団の少な くとも10倍であり;そしてより好ましくは、タグレパートリーの複雑性は、ポリ ヌクレオチド集団の少なくとも100倍である。以下で、例示的9語タグの完全レ パートリーを含むプライマー混合物を使用するcDNAライブラリー構築物について のプロトコルが開示される。タグ含有プライマーのこのような混合物は、89ま たは1.34×108の複雑性を有する。Winslowら,Nucleic Acids Research,19:325 1-3253(1991)に示されるように、ライブラリー構築のためのmRNAは、10〜100の 少数の哺乳動物細胞から抽出され得る。単一哺乳動物細胞は、標準的技術によっ て約3.4×104の異なる種類のmRNA分子の約5×105コピーを含むので、約100細胞 からのmRNA、すなわち(理論的には)約5×107mRNA分子を単離し得る。この数 をプライマー混合物の複雑性と比較することは、いずれの追加工程もなしに、そ してさらに、mRNAが完全な効率で(1%以下の効率がより正確である)cDNAに変 換されることを仮定せずに、cDNAライブラリー構築プロトコルが、異なるタグの 総数のわずか37%しか含まない集団を生じることを示す。すなわち、いずれの明 らかなサンプリング工程が全く無しで、このプロトコルは、タグレパートリーの 37%、またはそれ以下を含む資料を本質的に生成する。これらの条件下で二本鎖 を得ることの確率は、約5%であり、これは好ましい範囲内である。10細胞から のmRNAでは、サンプリングされたタグレパートリーの画分が、3.7%のみまで 減少され、さらに、すべてのプロセシング工程が100%の効率で行うと想定され る。実際、cDNAライブラリーを構築するためのプロセシング工程の効率は、非常 に低く、「だいたいの目安」は、良好なライブラリーが106の哺乳動物細胞から 抽出されたmRNAからの約108のcDNAクローンを含むべきであることである。 上記のプロトコルにおけるmRNAのより大量の使用、または一般にポリヌクレオ チドのより大量の使用(ここで、このような分子の数はタグレパートリーの複雑 性を上回る)、タグ-ポリヌクレオチド結合体混合物は、タグのあらゆる可能な 対形成およびmRNAまたはポリヌクレオチドのタイプを潜在的に含む。このような 場合には、明白なサンプリングは、タグ-ポリヌクレオチド結合体の開始混合物 の連続希釈後に試料容量を除去することによって行われ得る。必要とされる希釈 の量は、開始物質の量およびプロセシング工程の効率に依存し、これらは容易に 推定される。 mRNAが106細胞(約0.5μgのポリ(A)+RNAに対応する)から抽出されたならば 、そしてプライマーが約10〜100倍濃度の過剰で存在するならば--代表的プロト コル、例えば、Sambrookら,Molecular Cloning,2版,8.61頁[1mg/mLでの10 μL1.8kb mRNAは約1.68×10-11モルに等しく、そして1mg/mLでの10μL 18マ ープライマーは約1.68×10-9モルに等しい]において要求されるように、cDNAラ イブラリーにおけるタグ-ポリヌクレオチド結合体の総数は、単に、mRNAの開始 数に等しいかそれ以下、あるいはタグ-ポリヌクレオチド結合体を含む約5×101 1 ベクターである--これはまたcDNA構築における各工程--第1の鎖の合成、第2 の鎖の合成、ベクターへのライゲーション--が完全な効率で生じることを想定す る(これは非常に保守的な推定である)。実際の数は著しく、より少ない。 n個のタグ-ポリヌクレオチド結合体の試料が、反応混合物からランダムに取 られるならば--試料容量を採取することによって行われ得るように、同じタグを 有する結合体を採取する確率は、Poisson分布、P(r)=e- λ(λ)r/rによって記載 され、ここでrは同じタグを有する結合体の数であり、そしてλ=npであり、こ こで、pは選択される所定のタグの確率である。n=106およびp=1/(1.34×108 )ならば、λ=0.00746およびP(2)=2.76×10-5である。したがって、1,000,000 分子の試料は、好ましい範囲内の二連のウェルの予測された数を生じる。この ような試料は、以下のように容易に得られる:5×1011mRNAがインサートとして タグ-cDNA結合体を有する5×1011ベクターに完全に変換され、そして5×1011 ベクターが100μlの容量を有する反応溶液中にあると仮定する。4つの10倍連 続希釈は、元の溶液からの10μlを、90μlの適切な緩衝液(例えば、TE)を含 む容器に移すことによって行われ得る。このプロセスは、1μl当たり5×105 ベクター分子を含む100μl溶液を得るために、3つの追加の希釈について繰り 返され得る。この溶液からの2μlアリコートは、インサートとしてタグ-cDNA 結合体を含む106ベクターを得る。次いで、この試料は、コンピテント宿主細胞 の、直接的な(straight forward)形質転換、次いで培養することによって増幅さ れる。 もちろん、上記のように、上記のプロセス中の工程は完全な効率では進行しな い。特に、タグ-ポリヌクレオチド結台体の試料を増幅するために、ベクターが 用いられる場合、宿主を形質転換する工程は非常に非効率的である。通常、わず か1%のベクターが、宿主によって採用されそして複製される。したがって、増 幅のこのような方法について、さらに少ない希釈が、106結合体の試料を得るた めに必要とされる。 オリゴヌクレオチドタグのレパートリーは、タグ配列を含むプライマーなどを 使用して、直接酵素的ライゲーション、例えば、PCRによる増幅を含む、多くの 方法で、ポリヌクレオチドの集団に結合され得る。最初のライゲート工程は、単 一のタグが、一般的に多くの異なるポリヌクレオチドに付着されるように、タグ -ポリヌクレオチド結合体の非常に大きな集団を生じる。しかし、上記のように 、結合体の十分に小さい試料を採取することによって、「ダブル」(すなわち、 2つの異なるポリヌクレオチド上の同じタグ)を得ることの確率は、無視され得 る。一般的に、試料が大きくなるほど、ダブルを得る確率が大きくなる。したが って、設計の交換(trade-off)は、タグ-ポリヌクレオチド結合体の大きな試料を 選択すること--これは、例えば、ショットガン配列決定操作における標的ポリヌ クレオチドの適切な適用範囲または速く変化するmRNAプールの適切な表示を確実 にする--と、最少数のダブルが存在することを確実にする小さい試料を選択する こととの間に存在する。ほとんどの実施態様では、ダブルの存在は、ノイズのさ らあなる供給源を付与するのみであるか、または、配列決定の場合は、多数の蛍 光シグ ナルを与える微粒子が簡単に無視出来るので、スキャンニングおよびシグナルプ ロセシングにおける小さな複雑性を付与するのみである。 本明細書で使用される場合、タグを分子(特にポリヌクレオチド)に付着させ ることに関して、用語「実質的にすべて」とは、本質的にダブルを含まないタグ -分子結合体の集団を得るために用いられるサンプリング手順の統計学的性質を 反映することを意味する。タグ-分子結合体の実際の割合に関して実質的にすべ ての意味は、どのようにタグが用いられるかに依存する。好ましくは、核酸配列 決定については、実質的にすべてとは、少なくとも80パーセントのポリヌクレオ チドが、付着された独特のタグを有することを意味する。より好ましくは、少な くとも90パーセントのポリヌクレオチドが、付着された独特のタグを有すること を意味する。さらにより好ましくは、少なくとも95パーセントのポリヌクレオチ ドが、付着された独特のタグを有することを意味する。そして、最も好ましくは 、少なくとも99パーセントのポリヌクレオチドが、付着された独特のタグを有す ることを意味する。 好ましくは、ポリヌクレオチドの集団がメッセンジャーRNA(mRNA)からなる 場合、オリゴヌクレオチドタグは、好ましくはタグ配列の相補体を含む1セット のプライマーでmRNAを逆転写することによって付着され得る。このようなプライ マーの例示的なセットは、以下の配列(配列番号1)を有し得る: ここで、「「W,W,W,C]9」は、各4つのヌクレオチドの9つのサブユニットのオリ ゴヌクレオチドタグの配列を表し、そして「「W,W,W,C]」は、上に挙げたサブユ ニット配列を表す(すなわち「W」はTまたはAを表す)。下線を引いた配列は、 1つが使用される場合、ビオチンを介して固相支持体への付着からポリヌクレオ チドを放出するために使用され得る、任意の制限エンドヌクレアーゼ部位を同定 する。上記のプライマーについて、微粒子へ付着された相補体は以下の形態を有 する: 逆転写後、mRNAは(例えば、RNase H消化によって)除去され、そしてcDNAの 第2鎖は、例えば、以下の形態(配列番号2)のプライマーを使用して合成され る: ここで、Nは、A、T、G、またはCのいずれか1つであり;Rは、プリン含有ヌクレ オチドであり、そしてYは、ピリミジン含有ヌクレオチドである。この特定のプ ライマーは、得られる二本鎖DNA(Sal I部位によって、ベクター(例えば、Bam HIおよびXho I部位を有する)中にクローニングすることを容易にする)中に、B st Y1制限部位を生じる。Bst Y1およびSal I消化の後、例示的な結合体は以下の 形態を有する: 次いで、ポリヌクレオチド-タグ結合体は、標準的な分子生物学的技法を使用し て処置され得る。例えば、上記の結合体--これは、実際には混合物である--は、 市販のクローニングベクター(例えば、Stratagene Cloning System(La Jolla, CA))に挿入され得;宿主(例えば、市販の宿主細菌)にトランスフェクトされ ;次いでこれは結合体の数を増加させるために培養される。次いで、クローニン グベクターは、標準的な技法(例えば、Sambrookら,Molecular Cloning,第2版 (Cold Spring Harbor Laboratory,New York,1989))を使用して単離され得る 。あるいは、結合体集団がPCRによって増加され得るように、適切なアダプター およびプライマーが用いられ得る。 好ましくは、配列決定のリガーゼに基づいた方法が用いられる場合、Bst Y1お よびSal I消化したフラグメントは、以下の単一コピー制限部位(配列番号3) を有するBam HI-/Xho I-消化したベクター中にクローニングされる: これは、以下でより十分に議論される配列決定プロセスの開始を可能にするFok I部位を付加する。 タグは、標準的なクローニング方法により、現存するライブラリーのcDNAに結 合され得る。cDNAは、それらの現存するベクターから切除され、単離され、次い でタグのレパートリーを含むベクターに連結される。好ましくは、タグ含有ベク ターは、切除されたcDNAが所定の配向で連結され得るように、2つの制限酵素で 切断することによって線状化される。線状化されたタグ含有ベクターの濃度は、 ライゲーションがタグの本来のサンプリングを提供するように、cDNAインサート の濃度を実質的に超えている。 増幅後に一本鎖タグを曝露するための一般的な方法は、T4 DNAポリメラーゼの 5'→3'エキソヌクレアーゼ活性で標的ポリヌクレオチド含有結合体を消化する工 程または酵素のようなものを包含する。単一のデオキシヌクレオシド三リン酸の 存在において使用した場合、単一のデオキシヌクレオシド三リン酸の相補体がテ ンプレート鎖に達するまで、このようなポリメラーゼは、二本鎖フラグメントの 非テンプレート鎖に存在する3'凹(recessed)末端からヌクレオチドを切断する。 このようなヌクレオチドが達成される場合、ポリメラーゼの伸長活性が、切除活 性がヌクレオチドを除去するよりも高い割合でヌクレオチドを付加するので、5' →3'消化は効率的に終わる。結果として、固相支持体上へのローディングのため に、3つのヌクレオチドで構築される一本鎖タグは、容易に調製される。 この技法はまた、標的ポリヌクレオチドの内部Fok I部位を優先的にメチル化 するために使用され得るが、メチル化されていないポリヌクレオチドの末端で単 一のFok I部位を残す。第1に、末端Fok I部位は、デオキシシチジン三リン酸と ともにポリメラーゼを使用して一本鎖にされる。次いで、フラグメントの二本鎖 部分をメチル化し、その後一本鎖末端を、4つのすべてのヌクレオシド三リン酸 の存在下でDNAポリメラーゼで満たし、それによってFok I部位を再生する。明ら かに、この手順は、Fok I以外のエンドヌクレアーゼに対して一般化され得る。 オリゴヌクレオチドタグが(例えば、上記のように、これらを一本鎖にするこ とによって)特異的ハイブリダイゼーションのために調製された後、ポリヌクレ オチドは、タグとその相補体との間の完全に一致した二重鎖の形成を好都合にす る条件下でタグの相補配列を含む微粒子と混合される。文献中に、これらの条件 を生じるための広範な指針がある。このような指針を提供する例示的な参考文献 には、Wetmur,Critical Reviews in Biochemistry and Molecular Biology,26 :227-259(1991);Sambrookら,Molecular Cloning:A Laboratory Manual,第2版 (Cold Spring Harbor Laboratory,New York,1989)などが挙げられる。好まし くは、ハイブリダイゼーション条件は、完全に一致した配列のみが安定な二重鎖 を形成するような、十分なストリンジェントである。このような条件下で、それ らのタグを介して特異的にハイブリダイズしたポリヌクレオチドは、微粒子に付 着された相補配列に連結され得る。最終的に、微粒子は洗浄されて、連結されて いないおよび/またはミスマッチしたタグを有するポリヌクレオチドが除去され る。 合成支持体として便利に用いられるCPG微粒子が使用される場合、微粒子表面 上のタグ相補体の密度は、代表的には、いくつかの配列決定操作に必要な相補体 よりも大きい。すなわち、種々の酵素での付着されたポリヌクレオチドの連続処 理を必要とする配列決定アプローチにおいて、密に間隔をとったポリヌクレオチ ドは、比較的かさばった酵素のポリヌクレオチドへの接近を阻害する傾向があり 得る。このような場合には、ポリヌクレオチドは、好ましくは、タグ相補体が、 ポリヌクレオチドよりも著しく過剰(例えば、10:1〜100:1、またはそれ以上) で存在するように、微粒子と混合される。これは、微粒子表面上のポリヌクレオ チドの密度が、酵素の接近を阻害するほど高くないことを確実にする。好ましく は、微粒子表面上の平均ポリヌクレオチド間間隔は、30〜100nmくらいである。 標準的なCPG支持体およびBallotiniビーズ(固体ガラス支持体の型)についての 比を選択する指針は、MaskosおよびSouthern,Nucleic Acids Research,20:167 9-1684(1992)に見られる。好ましくは、配列決定適用について、20〜50μmの範 囲の直径の標準的なCPGビーズは、約105ポリヌクレオチドでロードされ、そして 5〜10μmの範囲の直径のGMAビーズは、数万ポリヌクレオチド、例えば、4×1 04〜6×104でロードされる。 好ましい実施態様では、タグ相補体は、微粒子上で組み合わせて合成され;し たがって、合成の最後に、試料がタグ付けされたポリヌクレオチドをロードする ために採取される微粒子の複合混合物を得る。微粒子の試料のサイズは、いくつ かの因子に依存し、これには、タグ相補体のレパートリーのサイズ、ロードされ た微粒子を観察するために使用される装置の性質--例えば、その能力、同じタグ 相補体を有する微粒子の複数のコピーに対する抵抗性(すなわち、「ビーズダブ ル」などが含まれる。以下の表は、微粒子試料サイズ、微粒子直径、および種々 の直径の微粒子のパックされた集合体(array)のおおよその物理的大きさに関 する指針を提供する。 微粒子の試料が、所定のタグ相補体を含む確率または複数コピー中に存在する確 率は、以下の表に示すように、Poisson分布によって記載される。 高度に特異的な選別およびパンニング 選別の動力学は、オリゴヌクレオチドタグのタグ相補体へのハイブリダイゼー ションの速度に依存し、これは次にハイブリダイゼーション反応におけるタグの 複雑性に依存する。したがって、交換(trade off)は、選別速度とタグ複雑性と の間に存在し、そのため選別速度の増加は、ハイブリダイゼーション反応に関連 するタグの複雑性を減少させる費用で達成され得る。以下に説明するように、こ の交換(trade off)の効果は、「パンニング」によって回復され得る。 ハイブリダイゼーションの特異性は、十分に小さい試料を採取することによっ て増加され得、その結果、試料中の高い割合のタグは独特であり、そして試料中 の実質的にすべてのタグの最も近い隣接物は少なくとも2語で異なる。この後者 の条件は、用いられているレパートリーの約0.1パーセント以下のサイズである 多数のタグ-ポリヌクレオチド結合体を含む試料を採取することによって達せら れ得る。例えば、タグが表IIから選択される8語で構築されるならば、88(す なわち約1.67×107のレパートリー)タグ、およびタグ相補体が生成される。上 記のようなタグ-cDNA結合体のライブラリーでは、0.1パーセント試料は、約16,7 00の異なるタグが存在することを意味する。微粒子のレパートリー等価物(すな わちこの実施例では、1.67×107微粒子)上にこれが直接ロードされた場合、試 料になった微粒子の低密度なサブセットがロードされる。ロードされた微粒子の 密度は--例えば、より効果的な配列決定のために--試料にされたタグ-cDNA結合 体がロードされなかった微粒子からロードされた微粒子を分離するために使用さ れる「パンニング」工程を行うことによって、増加され得る。したがって、上記 の例において、たとえ「0.1パーセント」試料が16,700cDNAのみを含むとしても 、サンプリングおよびパンニング工程は、所望のように多くのロードされた微粒 子が蓄積されるまで繰り返され得る。 パンニング工程は、タグ-cDNA結合体の試料を提供することによって行われ得 、このそれぞれは、オリゴヌクレオチドタグの反対の末端、または遠位に、捕獲 部分を含む。好ましくは、捕獲部分は、タグ-cDNA結合体から放出され得るタイ プのものであり、そのため、タグ-cDNA結合体は、一塩基配列決定方法で配列決 定され得る。このような部分は、ビオチン、ジゴキシゲニン、または類似のリガ ン ド、三重鎖結合領域などを含み得る。好ましくは、このような捕獲部分は、ビオ チン成分を含む。ビオチンは、多くの標準的技法によってタグ-cDNA結合体に付 着され得る。PCRプライマー結合部位を含む適切なアダプターが、タグ-cDNA結合 体に付着される場合、ビオチンは、サンプリング後の増幅においてビオチン化し たプライマーを使用することによって付着され得る。あるいは、タグ-cDNA結合 体が、クローニングベクターのインサートである場合、ビオチンは、適切な制限 酵素での消化次いで単離によって、タグ-cDNA結合体を切り出すこと、ならびに ピオチン化ウリジン三リン酸の存在下でDNAポリメラーゼでタグの遠位の突出す る鎖を満した後に、付着され得る。 タグ-cDNA結合体が捕獲された後、還元によって切断される(例えば、Herman ら,Anal.Biochem.,156:48-55(1986))、または光化学的に切断される(例え ば、Olejnikら,Nucleic Acids Research,24:361-366(1996))、またはPCRプラ イマーに制限部位を導入することによって酵素的に切断される化学結合によって 、多くの方法でビオチン部分から放出され得る。後者の実施態様は、上記のタグ -ポリヌクレオチド結合体のライブラリーを考慮することによって例示され得る : 以下のアダプターは、PCRによる増幅を可能にするこれらのフラグメントの末端 に連結され得る: ここで、「ACTAGT」は、Spe I認識部位(これは一塩基配列決定に準備した付着 切断を残す)であり、そしてXおよびZは、それぞれのプライマーのアニーリング および解離温度がほぼ同じであるように選択されたヌクレオチドである。アダプ ターの連結、およびビオチン化プライマーを使用するPCRによる増幅の後、結合 体のタグは、T4 DNAポリメラーゼのエキソヌクレアーゼ活性によって一本鎖にさ れ、そして結合体は、付着されたタグ相補体とともに、微粒子の試料(例えば、 レパートリー等価物)と組み合わされる。(タグのミス付着を最少にするために )ストリンジェント条件下でのアニーリング後、結合体は、好ましくは、タグ相 補体に連結され、そしてロードされた微粒子は、アビジン化磁性ビーズ、または 類似の捕獲技法での捕獲によって、ロードされていない微粒子から分離される。 例に戻ると、このプロセスは、種々のタグを有する約10,500(=16,700×0.63 )のロードされた微粒子の蓄積を生じ、これはSpe Iでの切断によって磁性ビー ズから放出され得る。微粒子およびタグ-cDNA結合体の新しい試料でこのプロセ スを40〜50回繰り返すことによって、4〜5×105cDNAは、放出された微粒子を プールすることによって蓄積され得る。次いで、プールされた微粒子は、+一塩 基配列決定技法によって同時に配列決定され得る。 サンプリングおよびパンニング工程を繰り返す回数を決定すること--またはよ り一般的には、分析するcDNAの数を決定することは、その目的に依存する。目的 が、例えば、集団の5%以上を構成する比較的普通の配列の豊富さの変化をモニ ターするならば、比較的小さい試料、すなわち、全体の群サイズの小画分が、相 対的な豊富さの統計学的に有意な見積もりを可能にし得る。他方では、例えば、 集団の0.1%以下を構成するまれな配列の豊富さをモニターしようとするならば 、大きな試料が必要とされる。一般的に、試料サイズと、試料に基づく相対的豊 富さの見積もりの信頼性との間には、直接的関係がある。信頼できる統計学的見 積もりを作成するために適切な試料サイズを決定することについて、文献に広範 な 指針があり、例えば、Kollerら,Nucleic Acids Research,23:185-191(1994); Good,Biometrika,40:16-264(1953);Bungeら,J.Am.Stat.Assoc.,88:364- 373(1993)などである。好ましくは、3.0〜3.5×104の異なる配列の105〜108の独 立したクローンを含む一連のcDNAライブラリーの分析に基づく遺伝子発現の変化 をモニターするために、少なくとも104配列の試料が、各ライブラリーの分析の ために蓄積される。より好ましくは、少なくとも105配列の試料が、各ライブラ リーの分析のために蓄積され;そして最も好ましくは、少なくとも5×105配列 の試料が、各ライブラリーの分析のために蓄積される。あるいは、サンプリング された配列の数は、好ましくは、集団サイズの0.1%くらいの95%信頼限界で0.1 %〜5%の範囲内の頻度で存在する配列の相対的豊富さを見積もるために十分で ある。 単一塩基DNA配列決定 本発明は、例えば、Hultmanら,Nucleic Acids Research,17:4937-4946(1989 )に開示されるような、DNA配列決定の従来の方法で用いられ得る。しかし、並行 、または同時の複数のポリヌクレオチドの配列決定については、近いサイズのDN Aフラグメントの電気泳動分離も、ペプチド配列決定におけるような別個の分析 手順による切断されたヌクレオチオの分析も必要としない、DNA配列決定方法論 が好ましい。好ましくは、この方法論は、処理および検出の連続サイクルによっ て、配列において、通常は1度に1つずつ、ヌクレオチドの段階的同定を可能に する。このような方法論は、本明細書では、「単一塩基」配列決定方法という。 単一塩基アプローチは、以下の参考文献に開示される:Cheeseman,米国特許5,3 02,509;Tsienら,国際出願WO 91/06678;Rosenthalら,国際出願WO 93/21340; Canardら,Gene,148:1-6(1994);およびMetzkerら,Nucleic Acids Research, 22:4259-4267(1994)。 本発明での使用に適切でありそしてDNAフラグメントの電気泳動分離を必要と しないDNA配列決定の「単一塩基」方法は、国際出願PCT/US95/03678に記載され る。簡単にいえば、この方法は、以下の工程を含む:(a)連結された複合体を形 成するために突出鎖を有するボリヌクレオチドの末端にプローブを連結する工程 であって、このプローブがポリヌクレオチドの鎖に相補的な突出鎖を有し、そし てこのプローブがヌクレアーゼ認識部位を有する、工程;(b)連結された複合体 から連結されていないプローブを除去する工程;(c)連結されたプローブの同一 性によってポリヌクレオチドの突出鎖における1つ以上のヌクレオチドを同定す る工程;(d)ヌクレアーゼで連結した複合体を切断する工程;および(e)ポリヌク レオチドのヌクレオチド配列またはその一部が決定されるまで、工程(a)から(d) を繰り返す工程。 シグナル蛍光染料のような、単一のシグナル生成部分は、並行配列決定操作に おいて、固定された微粒子のような、種々の空間的にアドレス可能な(addressab le)固相支持体に付着されたいくつかの異なる標的ポリヌクレオチドを配列決定 する場合に、用いられる。これは、種々の微粒子における多数の標的ポリヌクレ オチドに連続的に適用されるプローブの4つのセットを提供することによって達 成され得る。このようなプローブの代表的セットを以下に示す: ここで、リストされたプローブのそれぞれは、そのため上部鎖の3'末端ヌクレオ チドの正体は固定され、そして突出鎖の他の位置は、ヌクレオチドのあらゆる3 マー順列(permutation)または複雑性が減少したアナログによって満たされるよ うな、43=64オリゴヌクレオチドの混合物を表す。リストしたプローブはまた 、「T*」として示す末端チミジンに付着したシグナル生成部分を有する一本鎖ポ リTテイルとともに示される。標識されていないプローブにおける「d」は、連結 ブロック部分、または標識されていないプローブが連結されることを抑制する3' - ヒドロキシルが不在を示す。好ましくは、このような3'-末端ヌクレオチドは、 ジデオキシヌクレオチドである。この実施態様では、セット1のプローブは、最 初に多数の標的ポリヌクレオチドに適用され、そして標識されたプローブの3'末 端アデノシンに相補的なチミジンを有する標的ポリヌクレオチドが連結されるよ うに、リガーゼで処理される。標識されていないプローブは、不適切なライゲー ションを最少にするために同時に適用される。「A」で終わるプローブと共に連 結された複合体を形成する標的ポリヌクレオチドの位置は、プローブにおいて行 われる標識によって生成されるシグナルによって同定される。洗浄および切断後 、セット2のプローブが適用される。この場合、「C」で終わるプローブと共に 連結された複合体を形成する標的ポリヌクレオチドは、位置によって同定される 。同様に、セット3および4のプローブが適用され、そしてポジティブシグナル の位置が同定される。プローブの4つのセットを連続的に適用するこのプロセス は、所望の数のヌクレオチドが標的ポリヌクレオチドで同定されるまで、続ける 。明らかに、当業者は、例えば、種々の長さの突出鎖、標識されていないプロー ブのライゲーションをブロックするための種々の部分、プローブを標識するため の種々の手段を有するなどの、多くの変更を有し得るプローブの類似のセットを 構築し得る。 ポリヌクレオチドの集団を配列決定するための装置 本発明の目的は、タグおよびその相補物の特異的ハイブリダイゼーションによ って、微粒子の表面上に、同一の分子、特にポリヌクレオチドをソーティングす ることである。一旦このようなソーティングが行われると、そこで行われる分子 または操作の存在は、微粒子が別々にまたは「バッチ」で検出されるかどうか、 繰り返しの測定が所望であるかどうかなどの、タグ付けされた分子の性質に依存 して多くの方法で検出され得る。代表的には、ソーティングされた分子は、例え ば、薬物の開発において、結合のためのリガンドに曝露されるか、または、例え ば、ポリヌクレオチド配列決定において、化学的または酵素的プロセスを受ける 。これらの使用の両方において、多数の微粒子におけるこのような事象またはプ ロセスに対応するシグナルを同時に観察することが、しばしば所望される。ソー テ ィングされた分子を有する微粒子(本明細書では、「ロードされた」微粒子とい う)は、例えば、Lamら(前出)によって証明されるように、このような大規模 並行操作に適合できる。 好ましくは、光生成シグナル、例えば、化学発光、蛍光などは、事象またはプ ロセスを検出するために用いられるいずれの場合でも、ロードされた微粒子は、 国際特許出願PCT/US91/09217、PCT/NL90/00081、およびPCT/US95/01886に記載の ように、スキャンニングシステムでの実験について、平坦な基板、例えば、ガラ ススライド上に広げられる。スキャンニングシステムは、基板を再生可能にスキ ャンすることおよび座標系によって所定の領域における各微粒子の位置を規定す ることが可能であるべきである。ポリヌクレオチド配列決定適用では、微粒子の 位置の同定が、連続的スキャン工程で繰り返し可能であることが重要である。 このようなスキャンニングシステムは、市販の成分(例えば、1つ以上の光電 子増倍管、または代替的にCCDアレイ、および例えば、蛍光シグナルを励起、収 集、およびソーティングするために適切なレンズ系(optics)を含む検出システム とともに使用されるデジタルコンピュータによって制御されるx-y変換テーブル )から構築され得る。いくつかの実施態様では、共焦点レンズ系システムが所望 され得る。4色配列決定での使用に適切な代表的なスキャンニングシステムは、 図5で図示する。基板300(例えば、固定された微粒子を有する顕微鏡スライド )は、x-y変換テーブル302上に配置し、これは適切にプログラムされたディジタ ルコンピュータ304に接続されそして制御され、このコンピュータは、種々の市 販のパーソナルコンピュータ、例えば、486ベースマシンまたはApple Computer( Cupertino,CA)から入手可能なPowerPC model 7100または8100のいずれかであり 得る。テーブル変換およびデータ収集機能のためのコンピュータソフトウエアは 、National Instrumentsから入手可能な、Lab Windowsのような市販の実験室ソ フトウエアによって提供され得る。 基板300およびテーブル302は、1つ以上の対物レンズ308を有する顕微鏡306に 操作上結合され、このレンズは、基板300に固定された微粒子に光を収集しそし て送達し得る。光源312からの励起光線310(好ましくはレーザーである)は、光 線スプリッター314(例えば、二色性ミラー)に向けられ、これは、顕微鏡306お よび対物レンズ308を通って光線を向け直し、次に基板300上に光線を焦点に集め る。レンズ308は、微粒子から放射された蛍光316を収集し、そして光線スプリッ ター314を通してそれをシグナル分配レンズ系318に向け、次に、いくつかの蛍光 特性(例えば、強度、寿命など)を電気シグナルに変換するために適切な1つ以 上の光電素子に蛍光を向ける。シグナル分配レンズ系318は、当該技術分野で標 準的な種々の構成物、例えば、帯域透過フィルター、光ファイバー(fiber optic s)、回転ミラー、固定位置ミラーおよびレンズ、回折格子などを含み得る。図2 に示すように、シグナル分配レンズ系318は、蛍光316を4つの別々の光電子増倍 管330、332、334、および336に向け、次いで、その出力は、プリアンプおよびフ ォトンカウンター350、352、354、および356に向けられる。フォトンカウンター の出力は、コンピュータ304によって収集され、ここでこれは保存され、分析さ れ、そしてビデオ360に表示される。あるいは、シグナル分配レンズ系318は、蛍 光シグナル318をCCDアレイに向ける回折格子であり得る。 スキャンニングにおける位置的局在化(positional localization)の安定性お よび再現性は、近くに配置された微粒子を分離するための解像をだいたいにおい て決定する。好ましくは、スキャンニングシステムは、近くに配置された(例え ば、パーティクル直径以下で離れている)微粒子を解像し得るべきである。した がって、ほとんどの適用では、例えば、CPG微粒子を使用すると、スキャンニン グシステムは、少なくとも、10〜100μmほどの対象を解像する能力を有するべ きである。さらにより高い解像度がいくつかの実施態様で所望され得るが、増加 した解像度では基板を完全にスキャンするために必要とされる時間が増加し;し たがって、いくつかの実施態様では、速度と解像度との間で妥協が行われるべき であり得る。スキャンニング時間の増加は、微粒子が、(例えば、最初の完全ス キャンから)位置することが知られている位置をスキャンするのみのシステムに よって達成され得る。好ましくは、微粒子サイズおよびスキャンニングシステム 解像度は、cm2当たり約10,000〜100,000微粒子の間の密度で平面上に無作為に配 置された蛍光標識した微粒予の解像を可能にするように選択される。 配列決定適用では、ロードされた微粒子は、種々の方法で基板の表面に固定さ れ得る。固定は、微粒子が、試薬曝露および洗浄の連続的サイクルを著しい損失 なしに受けることを可能にするに十分な強さであるべきである。基板がガラスで ある場合、その表面は、市販の試薬(例えば、Pierce Chemical)を使用して、 アルキルアミノリンカーで誘導体化され得、次に、従来の化学を使用して再度ア ビジンに架橋され得て、アビジン化表面を形成する。ビオチン部分は、多くの方 法で、ロードされた微粒子に導入され得る。例えば、タグをポリヌクレオチドに 付着するために使用されるクローニングベクターの画分(例えば、10〜15%)が 、タグの反対のポリヌクレオチドの末端でポリヌクレオチドインサートに直に隣 接する独特の制限部位(消化の際に付着末端を提供する)を含むように操作され る。この部位は、微粒子上へのローディングのためにポリヌクレオチドおよびタ グで切り出される。ローディングの後、約10〜15%のロードされたポリヌクレオ チドは、微粒子表面から遠位の独特の制限部位を有する。結合した制限エンドヌ クレアーゼでの消化後、ビオチン部分を含む適切な二本鎖アダプターは、付着末 端に連結される。次いで、得られる微粒子は、ビオチン-アビジン連結によって 固定されるアビジン化ガラス表面上に広げられる。 あるいはおよび好ましくは、ライゲーションによる配列決定が用いられる場合 、最初のライゲーション工程で、プローブの混合物はロードされた微粒子に適用 される:プローブのある画分は、配列決定法に必要とされるような、IIs型制限 認識部位を含み、そしてプローブのある画分は、このような認識部位を有さない が、代わりにその非連結末端にビオチン部分を含む。好ましくは、混合物は、ビ オチン化したプローブの約10〜15パーセントを含む。 さらに他の代わりでは、DNAロードした微粒子がガラス基板に適用される場合 、DNAは、数時間(例えば、24時間)インキュベーションでガラス表面に非特異 的に吸着し得、微粒子を著しく損失することなく試薬および洗浄液への繰り返し の曝露を可能にするに十分に強い結合を生成する。好ましくは、このようなガラ ス基板は、フローセルであり、これはガラススライドにエッチングされたチャン ネルを含み得る。好ましくは、このようなチャンネルは、液体がこれを通ってポ ンプで吸い出され得るように閉鎖され、そして微粒子の単層が規定の観察領域内 に捕らえられるように微粒子の直径に十分に近い深さを有する。cDNA ライブラリーにおける新規ポリヌクレオチドの同定 cDNAライブラリーにおける新規ポリヌクレオチドは、上記のように、微粒子に 付着したcDNA分子のライブラリーを構築することによって同定され得る。ライブ ラリーの大画分、または全ライブラリーでさえが、次いで、並行して部分的に配 列決定され得る。mRNAの単離、およびおそらく、Soaresら,Proc.Natl.Acad. Sci.,91:9228-9232(1994)などの参考文献に教示されるような集団の正規化の後 、以下のプライマーが、従来のプロトコルを使用して、逆転写酵素での第1鎖合 成のためにポリAテイルにハイブリダイズされ得る(配列番号1): ここで、[W,W,W,C]9は、上記のようなタグを表し、「ACCAGCTGATC」は、二本鎖 形態で制限部位を形成する任意配列であり、そして「プライマー部位」は、PCR によって目的のポリヌクレオチドを増幅するために後にプライマー結合部位とし て使用されるライブラリーのすべてのメンバーに普通の配列である。 従来の技法による逆転写および第2鎖の合成の後、二本鎖フラグメントは、上 記のようにクローニングベクターに挿入されそして増幅される。次いで、増幅さ れたライブラリーはサンプリングされ、そして試料は増幅される。増幅された試 料からのクローニングベクターは単離され、そしてタグ付けされたcDNAフラグメ ントが切り出され、そして精製される。上記のようにポリメラーゼでタグを一本 鎖にした後、フラグメントはメチル化され、そして本発明に従って微粒子上にソ ーティングされる。好ましくは、上記のように、クローニングベクターは、タグ 付けされたcDNAがFok Iのようなエンドヌクレアーゼで切り出され得るように構 築され、ソーティングおよび微粒子への連結の後、好ましい単一塩基方法によっ てすぐに配列決定することを可能にする。 次いで、十分な数のヌクレオチドが、ライブラリーが由来する生物のゲノム中 の独特の表現について各cDNAにおいて同定されるまで、段階的配列決定方法は、 本発明に従って、ライブラリー全体またはライブラリーの1つ以上の大きな画分 で同時に行われる。例えば、ライブラリーが哺乳動物mRNAに由来するならば、無 作為に選択した配列14〜15ヌクレオチド長は、代表的な啼乳動物ゲノムの2000〜 3000メガ塩基のうちの独特な表示を有すると予測される。もちろん、はるかに少 ないヌクレオチドの同定は、細菌、または他の下等動物に由来するライブラリー 独特の表示に十分である。好ましくは、少なくとも20〜30ヌクレオチドが、独特 の表示を確実にし、そして以下に記載のように適切なプライマーの構築を可能に するために同定される。次いで、表にした配列は、独特のcDNAを同定するために 公知の配列と比較され得る。 次いで、独特のcDNAは、従来の技法、例えば、プライム部位および配列が決定 されたcDNAの部分に向けられるプライマーとともに生成されるPCRアンプリコン からプローブを構築することによって、単離される。次いで、プローブは、従来 のスクリーニングプロトコルを使用して、ライブラリー中のcDNAを同定するため に使用され得る。 新しいcDNAを同定するための上記の方法はまた、単離された測定において、ま たは動力学的変化集団に関してのいずれかで、mRNA集団をフィンガープリントす るために使用され得る。部分配列情報は、上記の方法で記載されるように微粒子 を分離するために付着された大きな試料、例えば、10,000〜100,000以上のcDNA から、同時に得られる。 実施例1 タグライブラリーの構築 代表的タグライブラリーを、以下の式によって規定されるヌクレオチドA、G、 およびTの化学合成された9語タグを形成するために以下のように構築する: ここで、「[4(A,G,T)9]」は、タグ混合物を示し、ここで各タグはA、G、およびT の9つの4マー語からなり;そして「p」は5'リン酸を示す。この混合物を、以 下の右および左プライマー結合領域(配列番号4および配列番号5)に連結する : 右および左プライマー結合領域を、上記のタグ混合物に連結し、その後、連結さ れた構造の一本鎖部分を、DNAポリメラーゼで満たし、次いで以下に示される右 および左プライマーと混合し、そして増幅してタグライブラリーを得る(配列番 号6)。 左プライマー結合領域の下線を引いた部分は、Rsr II認識部位を示す。右プライ マー結合領域の最も左の下線を引いた領域は、Bsp 120I、Apa I、およびEco 0 1 09Iについての認識部位、ならびにHga Iについての切断部位を示す。右プライマ ー結合領域の最も右の下線を引いた領域は、Hga Iについての認識部位を示す。 必要に応じて、右または左プライマーを、増幅および/または切断後の精製を容 易にするために、(例えば、Clontech Laboratories,Palo Alto,CAから入手可 能な、従来の試薬を使用して)付着されたビオチンとともに合成し得る。 プラスミドを、Ppu MIおよびPme Iで切断し(インサートが配向されるようにRsr II適合可能な末端および平滑末端を得るために)、次いで、DAMメチラーゼでメ チル化する。タグ含有構築物を、Rsr IIで切断し、次いで開いたプラスミドに連 結し、その後、結合体を、Mbo IおよびBam HIで切断して連結およびプラスミド の閉鎖を可能にする。次いで、プラスミドを増幅し、そして単離し、そして本発 明に従って使用する。 実施例3 種々の生体異物薬剤に曝露されたラットの肝臓組織における 遺伝子発現プロフィールの変化 この実施例では、生体異物化合物への曝露の結果として誘導される遺伝子を検 出するための本発明の方法の能力をテストするために、ラット肝臓組織の遺伝子 発現プロフィールを、シトクロムP-450イソ酵素の発現を誘導することが公知で あるいくつかの化合物の以下の投与で検査する。本発明の方法から得られる結果 を、逆転写酵素PCR測定およびシトクロムP-450イソ酵素の免疫化学的測定から得 られる結果と比較する。後者のアッセイについてのプロトコルおよび材料は、Mo rrisら,Biochemical Pharmacology,52:781-792(1996)に記載される。 6〜8週齢および200〜300g体重の雄Sprague-Dawleyラットを使用し、そして 食餌および水を動物に任意に与える。テスト化合物は、フェノバルビタール(PB) 、メチラポン(MET)、デキサメタゾン(DEX)、クロフィブレート(CLO)、ト ウモロコシ油(CO)、およびβ-ナフトフラポン(BNF)であり、そしてSigma Ch emical Co.(St.Louis,MO)から入手可能である。特定のP-450酵素に対する抗 体は、以下の供給源から入手可能である:ウサギ抗ラットCYP3A1はHuman Biolog ics,Inc.(Phoenix,AZ)から;ヤギ抗ラットCYP4A1はDaiichi Pure Chemicals Co.(Tokyo,Japan)から;モノクローナルマウス抗ラットCYP1A1、モノクローナ ルマウス抗ラットCYP2C11、ヤギ抗ラットCYP2E1、およびモノクローナルマウス 抗ラットCYP2B1はOxford Biochemical Research,Inc.(Oxford,MI)からである 。二次抗体(ヤギ抗ウサギIgG、ウサギ抗ヤギIgG、およびヤギ抗マウスIgG)は 、Jackson ImmunoResearch Laboratories(West Grove,PA)から入手可能である 。 Wangら,Arch.Biochem.Biophys.290:355-361(1991)によって記載されるも のと同様の投与方法に従って、動物に、PB(100mg/kg)、BNF(100mg/kg)、MET (100mg/kg)、DEX(100mg/kg)、またはCLO(250mg/kg)のいずれかを、4日間 連続して腹腔内注射によって投与する。H2OおよびCOで処理した動物をコントロ ールとして使用する。最後の注射(4日目)後2時間で動物を屠殺し、そして肝 臓を取り出す。肝臓を直ちに凍結し、そして−70℃で保存する。 総RNAを、Xieら,Biotechniques,11:326-327(1991)に記載される方法の改変 を使用して、凍結した肝臓組織から調製する。約100〜200mgの肝臓組織を、Xie らに記載のRNA抽出緩衝液中でホモジナイズして、総RNAを単離する。得られるRN Aを、ジエチルピロカーボネート処理した水中で再構成し、260nmで分光光度法に よって定量し、そして100μg/mlの濃度に調整する。総RNAを、見かけ上の分解 を全く伴わずに−70℃にて1年までジエチルピロカーボネート処理した水中で保 存する。RT-PCRおよび配列決定を、これらの調製物からの試料で行う。 配列決定については、約0.5μgのポリ(A)+RNAに対応するRNAの試料を使用し て、以下の例外を含む「Attaching Tags to Polynucleotides for Sorting onto Sol id Phase Supports」という題の項に記載のプロトコルに従って、タグ-cDNA結合 体のライブラリーを構築する:タグレパートリーは、表IIからの6つの4ヌクレ オチド語から構築される。したがって、レパートリーの複雑性は、86または約2 .6×105である。構築された各タグ-cDNA結合体ライブラリーについては、約10,0 00クローンの10試料を、増幅およびソーティングのために採取する。増幅される 試料のそれぞれを、タグ相補物を含む約10610μm直径のGMAビーズの固定された 単層に、別々に適用する。すなわち、各単層におけるGMAビーズ群中のタグ相補 物の「試料」は、約4倍の総サイズのレパートリーであり、したがって、サンプ リングされたタグ-cDNA結合体のそれぞれが単層上でそのタグ相補物を見いだす 高い確率があることを確実にする。増幅された試料のオリゴヌクレオチドタグが 上記のように一本鎖になった後、試料のタグ-cDNA結合体を、オリゴヌクレオチ ドタグと完全に一致する二重鎖を形成するタグ相補物との間のみの特異的ハイブ リダイゼーションを可能にする条件下で、単層に別々に適用する。増幅される試 料の濃度およびハイブリダイゼーション時間を選択して、完全な一致が生じる各 ビーズ上での約5×104〜2×105タグ-cDNA結合体の装填を可能にする。連結の 後、付着したcDNAの9〜12ヌクレオチド部分を、Brenner,国際特許出願PCT/US9 5/03678に記載される単一塩基配列決定技法によって、並行して決定する。遺伝 子発現プロフィールについての頻度分布を、10試料のそれぞれから得られる配列 情報から構築する。 シトクロムP-450遺伝子および構成的に発現されるシクロフィリン遺伝子に対 応する選択されたmRNAのRT-PCRを、Morrisら(前出)に記載のように行う。簡単 にいえば、1×逆転写酵素緩衝液(Gibco BRL)、10nMジチオトレイトール、0.5 nM dNTP、2.5μMオリゴd(T)15プライマー、40ユニットRNasin(Promega,Madis on,WI)、200ユニットRNase H-逆転写酵素(Gibco BRL)、および400ngの総RNA (ジエチルピロカーボネート処理した水中)を含む20μl反応混合物を、調製す る。反応物を、37℃にて1時間インキュベートし、次いで95℃にて5分間で酵素 を不活性化する。得られるcDNAを、使用するまで−20℃で保存する。cDNAのPCR 増幅については、10×ポリメラーゼ反応緩衝液、2mM MgCl2、1ユニットTaq DNA ポリメラーゼ(Perkin-Elmer,Norwalk,CT)、20ng cDNA、およびMorrisら (前出)に記載の配列の5'および3'特異的PCRプライマーの200nM濃度を含む10μ L反応混合物を、調製する。PCRを、Perkin-Elmer 9600サーマルサイクラーで、 それぞれ94℃で30秒間、56℃で1分間、および72℃で1分間の融解、アニーリン グ、および伸長条件を使用する23サイクルで行う。増幅したcDNA産物を、5%未 変性ゲルを使用するPAGEによって分離する。バンドは、エチジウムブロミドで染 色することによって検出する。 肝臓タンパク質のウエスタンブロットを、SDS-PAGEによる分離後に標準的プロ トコルを使用して行う。簡単にいえば、タンパク質を、還元条件下で10%SDS-PA GEゲル上で分離し、そしてHarrisら,Proc.Natl.Acad.Sci.,88:1407-1410(1 991)に記載の方法の改変を使用して、P-450イソ酵素の検出のために免疫ブロッ トする。タンパク質を、50μg/レーンでロードし、そして2℃にて約4時間定 電流(250V)下で分離する。タンパク質を、120mMグリシンおよび20%(v/v)メタ ノールを含む15mM Tris緩衝液中で、ニトロセルロースメンブラン(Bio-Rad,He rcules,CA)に移す。ニトロセルロースメンブランを2.5%BSAでブロックし、そ して一次モノクローナルおよびポリクローナル抗体ならびに二次アルカリホスフ ァターゼ結合した抗IgGを使用して、P-450イソ酵素について免疫ブロットする。 免疫ブロットを、Bio-Radアルカリホスファターゼ基質キットで顕色する。 P-450イソ酵素誘導の測定の3つのタイプは、実質的な一致を示した。 付録Ia 最小で交差ハイブリダイズするセットを産生するための 例示的なコンピュータープログラム (一本鎖タグ/一本鎖タグ相補物) 付録Ib 最小で交差ハイブリダイズするセットを産生するための 例示的なコンピュータープログラム (一本鎖タグ/一本鎖タグ相補物) 付録Ic 最小で交差ハイブリダイズするセットを産生するための 例示的なコンピュータープログラム (二本鎖タグ/一本鎖タグ相補物) DETAILED DESCRIPTION OF THE INVENTION               Measurement of gene expression profiles in toxicity determination                               Field of the invention   The present invention generally provides methods for assessing and / or determining the toxicity of a chemical compound. Detect and monitor phenotypic changes in in vitro and in vivo systems The present invention relates to a method, and more particularly, to a method for determining the toxicity of a drug candidate. Detect changes in gene expression patterns in in vitro and in vivo systems And how to monitor.                                   background   The ability to quickly and conveniently assess the toxicity of a new compound is very important. Thousands New compounds are synthesized each year, and many develop new commercial products and processes Often have little knowledge of its short and long term health effects , Introduced into the environment. In developing new drugs, the safety and efficacy of candidate compounds The cost of assessing is becoming astronomical: the pharmaceutical industry markets new pharmaceutical compounds Spend about $ 300,000,000 on average to bring to the budget, e.g., 13: 226-228 (19 95). Most of these costs are spent on candidate compounds at a later stage in the development process. It was due to failure. In other words, the evaluation of candidate drugs is, for example, relatively inexpensive As a drug candidate by combination assay or in vitro screening assay Progresses from the identification of the compound of interest, for pharmacokinetic studies, toxicity studies, model systems The cost of testing and analysis related to preclinical studies, etc. Increase tremendously. As a result, once promising candidate compounds, Determined to have side effects or cross-reactivity that would make development commercially impractical It can cost tens of millions of dollars to be defined. Big challenge for pharmaceutical development Expose compounds that fail later in the drug test as soon as possible. From consideration.   A drug development program is clearly established for this subject; Increasing costs are an early step in identifying the wrong lead as soon as possible Has created the need to develop more stringent and less expensive screens You. Toxicity assessments indicate that such improvements may be useful for drug development and generally for new compounds. To assess the effects of environmental, health, and safety is there.   Typically, the toxicity of a compound is controlled in one or more test animals under controlled conditions. Monitor effects by administering compounds and on a wide range of parameters To be determined. Parameters include blood chemistry, weight gain or Things like decrease, various behavior patterns, muscle tone, body temperature, respiratory rate, mortality etc. These collectively provide a measure of the health of the test animal. Normal range The degree of deviation of such parameters of the type provides a measure of the toxicity of the compound. This Tests such as acute, prolonged, or chronic toxicity of the compound Can be designed to evaluate Generally, an acute test is one of the test chemicals. Administration in a single dose. The observation period for test animals is short, such as a few hours. But usually at least 24 hours, and in some cases longer than a week Period. In general, long-term testing involves multiple administrations of the test chemical. Include. Test chemicals may be irregular if incorporated into the diet at least once daily Given at specific times, such as during pregnancy, or in some cases regularly but every other week Can be done. Also, for long-term tests, experiments are usually 90 It takes place for less than a day or for a year in dogs. Acute and long-term type tests Conversely, a chronic toxicity test is one in which test chemicals This is a test administered during a portion. In the case of a mouse or rat, this is 2 It is a period of ~ 3 years. For dogs, it is 5-7 years.   Large groups of test animals are used for such assays, especially in chronic toxicity assays. Establishing and maintaining larger animals loses significant costs. Further Omission of such toxicity tests due to species-specific effects may also Does not guarantee that there will be no toxic effects when used in However, such te Strike provides a standardized set of information to determine the safety of new compounds And a database for preliminary evaluation of related compounds. Toxicity determination Break An important area for improvement is new and predictable results in expensive and boring animal assays. It is the identification of a remarkable thing.   In other medical fields, in biotechnology, especially in DNA sequencing Recent advances in the identification of differentially expressed genes in healthy and diseased organisms. I was very interested in applying it to research and research. For example, Adams et al., Scien ce, 252: 1651-1656 (1991); Matsubara et al., Gene, 135: 265-274 (1993); Rosenber. g et al., International Patent Application PCT / US95 / 01863. The target of such applications is the disease process Increase knowledge and identify genes that play important roles in disease processes And diagnostic and therapeutic approaches utilizing expressed genes or their products To provide services. Such an approach is attractive, but manifests itself Thorough or even sampled sequencing of selected genes The roach is accompanied by a lot more effort required: 30,000-35,000 different Is presumed to be expressed in representative lactating tissues at any given stage . For example, edited by Ausubel et al., Current Protocols, 5.8.1-5.8.4 (John Wiley & Sons , New York, 1992). To sequence smaller samples of a certain number of gene products Is a major project that requires an industrial-scale source. Therefore, expressed The application of robust sequencing routines for selected genes is still a Not exceed.   Candidate drug that provides broader and more accurate information about the health of the test animal The availability of new assays to assess the toxicity of compounds such as Is desired. Such additional assays are preferably based on current test procedures. Less expensive, faster, and more convenient, and at the same time, new compounds Provide sufficient information to make a quick decision on the safety of the                               Summary of the Invention   It is an object of the present invention to provide a gene in an in vitro or in vivo test system. A new approach to toxicity assessment based on examination of expression patterns or profiles It is to provide.   Another object of the invention is to provide a basic decision regarding the toxicological properties of chemicals, especially drug candidates. Is to provide a database to   It is a further object of the present invention to provide a gene expression protein in a selected tissue of a test animal. The purpose is to provide a way to analyze turns.   A still further object of the invention is to express differentially in response to exposure to a test compound. The purpose of the present invention is to provide a system for identifying genes to be identified.   The purpose of the present invention is to couple gene expression with short and long term toxicity in test animals. To provide a quick and reliable way to correlate.   Another object of the invention is to identify genes whose expression is predictive of detrimental toxicity. is there.   The present invention provides for expression in one or more selected tissues of an organism exposed to a test compound. Massively parallel sign sequencing of selected genes achievable these and other objectives by providing a method of I do. An important feature of the present invention is to align the sequence of portions of a number of different polynucleotides. Gene expression profile for selected tissue by determining in line Application of novel DNA sorting and sequencing methods that allow the formation of DNA. this Such profiles can be single or multiple to identify expression patterns that predict toxicity. Or can be compared to profiles from control organism tissues at multiple time points .   The sorting methodology of the present invention provides a minimal cross-reacting cell for oligonucleotides. Use oligonucleotide tags that are members of the kit. Such a set of The sequence of oligonucleotides is the same set of at least two nucleotides Is different from the sequence of other members. So each member of such a set -Double with the complement of any other member with less than two mismatches Cannot form a chain (or triplex). Complement of oligonucleotide tag of the present invention Is referred to herein as a “tag complement”, which is a naturally occurring nucleotide or non-natural nucleotide. Nucleotide analogs may be included. Preferably, the tag complement is a solid support Adhered to. When used with the corresponding tag complement, such oligos Nucleotide tags are used to sort polynucleotides, such as cDNA. Means are provided to enhance the specificity of hybridization.   Each sorted polynucleotide has a different polynucleotide It has oligonucleotide tags attached with different tags. less than As explained more fully, this condition is substantially less than the group of polynucleotides. By using a large tag repertoire, and tagged polynus Enough of tagged polynucleotides from a complete ensemble of nucleotides This is achieved by employing a small sample. After such sampling , The support and the group of polynucleotides are each When mixed under conditions that allow specific hybridization with the complement , The same polynucleotide sorts on a particular bead or region. The sorted groups of polynucleotides are then described in more detail below. `` Single-base '' or `` base-by-base '' sequencing It can be sequenced on a solid support by routine methodology.   In one aspect, the method of the invention comprises the following steps: (a) providing a test organism Administering the compound; (b) mRNA content from each of one or more tissues of the test organism. Extracting a group of offspring; (c) oligonucleotides to which each cDNA molecule of a separate group is attached CD from each group of mRNA molecules extracted from one or more tissues to have a Forming separate groups of NA molecules, wherein the oligonucleotide tags have the same minimum Selecting from a cross-hybridization set; (d) substantially eliminating All different cDNA molecules have different oligonucleotide tags attached Separately sampling each group of cDNA molecules; Each by specifically hybridizing it to its complement. Sorting of a group of cDNA molecules, wherein each complement comprises one or more Homogeneity of substantially identical complements in spatially distinct regions on the solid support (F) expressed for each of one or more tissues, attached as a group Sorted cD of each separate group to form frequency distribution of genes Determining the nucleotide sequence of a portion of each of the NA molecules; and (g) one or more The frequency distribution of the expressed genes in each of the above tissues was linked to the toxicity of the compound. Steps to be related.   An important aspect of the invention is the identification of genes whose expression is predictive of compound toxicity. . Once such genes are identified, they are used to reverse transcribe Yeast It can be used in conventional assays such as elementary polymerase chain reaction (RT-PCR).                             BRIEF DESCRIPTION OF THE FIGURES   FIG. 1 shows the generation of a minimally cross-hybridized set of oligonucleotides. 5 is a flowchart display of the algorithm of FIG.   FIG. 2 illustrates an apparatus for performing polynucleotide sequencing according to the present invention. .                                   Definition   As used herein with respect to oligonucleotide tags, a "complement" or Is the "tag complement", which means that the oligonucleotide tag specifically hybridizes , Oligonucleotides that form a perfectly matched duplex or triplex. Special In embodiments where the heterogeneous hybridization results in a triplex, the oligonucleotide The dotag can be selected to be either double-stranded or single-stranded. Thus the triplex Are formed, the term "complement" refers to two single-stranded oligonucleotide tags Includes either a strand complement or a single-stranded complement of a double-stranded Saori nucleotide tag That means.   As used herein, the term “oligonucleotide” includes Watson Quartz Rick-type base pairing, base stacking, Hoogsteen or reverse foo Modulation of monomer-monomer interactions such as Gusteen base pairing Deoxyribonucleic acid, which can specifically bind to a target polynucleotide by turns Nucleoside, ribonucleoside, its anomeric form, peptide nucleic acid (PNA), etc. And natural or modified monomers or linear oligomers of bonds . Usually, the monomers are linked by a phosphodiester bond or an analog thereof. To a small number of monomer units, for example, from 3 to 4 to tens of monomer units. To form a range of oligonucleotides. Oligonucleotide is "ATGCCTG" Whenever a nucleotide sequence is represented by a 5 '→ In the order of 3 ', and unless otherwise noted, "A" indicates deoxyadenosine , "C" indicates deoxycytidine, "G" indicates deoxyguanosine, and It is understood that "T" indicates thymidine. Analogue of phosphodiester bond Is phosphorothioate, phosphorodithioate, phosphoranilide, phosphate Foramidate and the like. Usually, four oligonucleotides of the invention However, these also include non-natural nucleotide analogs. May be included. Use oligonucleotides with natural or unnatural nucleotides When enzymatic processing is required, e.g. It is obvious to those skilled in the art that oligonucleotides consisting of nucleotides are required. Is.   An "exact match" for a duplex is any nucleotide in each strand Undergo Watson-Crick base pairing with nucleotides in other strands The poly- or oligonucleotide chains that make up the duplex have a double-stranded structure with each other Means to form. This term may also be used, deoxyinosine, A pair of nucleoside analogs, such as a nucleoside having a 2-aminopurine base Formation. With respect to triplex, this term means that the triplex is a perfectly matched double The strand and any nucleotides must have a perfectly matched duplex base pair and Hoog Or a third strand that undergoes an inverse Hoogsteen bond . Conversely, a "mismatch" in the duplex between the tag and the oligonucleotide is A nucleotide pair or triplet in a duplex or triplex Click and / or Hoogsteen and / or inverse Hoogsteen Means that it does not undergo binding.   As used herein, "nucleoside" includes, for example, Kornberg and As described in Baker, DNA Replication, 2nd Edition (Freeman, San Francisco, 1992) Include natural nucleosides, including 2'-deoxy and 2'-hydroxyl forms It is. "Analogs" for nucleosides include specific hybridization Except for what can be done, for example, Scheit, Nucleotide Analog (John Wiley, New York, 1980); Uhlman and Peyman, Chemical Reviews, 90: 543-584 (1990). Have a modified base moiety and / or a modified sugar moiety described in Synthetic nucleosides. Such analogs have enhanced binding properties Synthetic oligonucleotides designed to reduce complexity, increase specificity, etc. Leotide.   As used herein with respect to polynucleotides, "sequencing" or "sequencing" Determining the nucleotide sequence "includes the portion of the polynucleotide as well as the entire sequence. Determining column information. That is, the term includes the target polynucleotide Sequence comparison, fingerprinting, and target polynucleotides in otide Expression identification and sequencing of otides and nucleosides, usually each nucleoside The similarity level of information about is included. This term also refers to the target polynucleotide Identification, ordering of 1, 2, or 3 of the 4 types of nucleotides in the And location determination. For example, in some embodiments, the determination is By identifying the ordering and position of a single type of leotide, For example, cytosine in the target polynucleotide "CATCGC ..." The array is a binary code for "C- (not C)-(not C) -C- (not C) -C ..." For example, it is represented as "100101 ...".   As used herein, the term "complexity" refers to a group of polynucleotides. Means the number of different species of molecules present in the group.   As used herein, the term “gene expression profile,” which is equally used, ”And“ gene expression pattern ”are sampled from a group of tag-cDNA conjugates Means the frequency distribution of a part of the sequence of the cDNA molecule. Generally, part of the array is Some of them are long enough to uniquely identify the resulting cDNA. Preferably determined The total number of sequences to be performed is at least 1000; more preferably, the gene expression profile The total number of sequences determined by the tool is at least 10,000.   As used herein, a "test organism" is defined as an exposure to a test compound. Means any in vitro or in vivo system that provides a measurable response . Typically, the test organism is a mammalian cell culture, in particular, hepatocytes, kidney cells, A mammalian cell culture of a particular tissue, such as colony forming cells, or Test organisms are rats, mice, hamsters, guinea pigs, dogs, cats, rabbits , Pigs, monkeys and the like.                             Detailed description of the invention   The present invention provides for gene expression in selected tissues of a test organism exposed to a compound. Analyze changes in the current profile to determine how compounds are toxic provide. The present invention also relates to rapidly expressed and correlated with long-term or chronic toxicity. Provides a method for identifying a toxic marker consisting of an individual gene or group of genes Alternatively, it indicates that the compound has an undesirable reactivity. Genetic The current profile is extracted from the tissue of the test organism exposed to the compound being tested Generated by sequencing a portion of the cDNA molecule assembly from the mRNA obtained. As used herein, the term “tissue” refers to an in vitro tissue, such as a cell culture. With regard to the strain system, other than simply referring to a sample from the culture, Is used in a biological sense. The gene expression profile from the test organism is Tested against gene expression profiles from control organisms Determine differentially expressed genes in test organisms for exposure to the compound being tested . In both cases, the sequence information in the gene expression profile Obtained by parallel signature sequencing, which is performed in steps (c) to (f) of the method described above. Will be                                 Toxicity assessment   To design and perform toxicity tests in vitro and in vivo systems Procedures are well known, and Loomis et al., Loomis's Essentials of Toxicology, No. 4 Edition (Academic Press, New York, 1996); Echobichon, The Basics of Toxicity T esting (CRC Press, Boca Raton, 1992); Frazier, In Vitro Toxicity Testin g (Marcel Dekker, New York, 1992). Listed in the quist.   For toxicity testing, two groups of test organisms are usually used: one group is controlled And a single dose for the other group (for acute toxicity testing). Or several dose regimens (for long-term or chronic toxicity testing) Is administered. In most cases, tissue extraction as required by the method of the present invention Requires sacrifice of test animals, so control group and compound For both treatment groups, it was desirable to observe the kinetics of gene expression during the duration of the experiment. If sufficient to allow removal of animals to sample tissue Must be large.   In assembling a toxicity study, the compound being tested, the route of administration, and the Extensive guidance is provided in the literature for selecting appropriate test organisms for It is. Water or physiological saline (0.9% NaCl in water) is Selectable solutes for test compounds as they allow administration by different routes It is. If this is not possible due to solubility limits, propylene glycol is commonly used. Relies on the use of vegetable oils, such as corn oil or even organic solvents, commonly used There is a need. Whenever possible, use of suspensions of emulsifiers is recommended, except for oral administration. Should be avoided. Regardless of the route of administration, it is necessary to administer a given dose. The capacity is limited by the size of the animal used. Within and between groups of animals It is desirable to keep each dose volume uniform. Where rats or mice are used Where the volume administered by the oral route should not exceed 0.005 ml / gram animal. Absent. An aqueous or physiological saline solution is used for parenteral injection. Although the volume that can be tolerated is limited, such solutions are usually considered harmless. Can be Intravenous LD in distilled water in mice50Is about 0.044 ml / g, and LD with isotonic saline50Is 0.068 ml / gram mouse.   If a compound is to be administered by inhalation, a Special techniques are needed. Dose estimation is very complicated. This method is It usually involves the aerosolization or nebulization of a liquid containing the compound. Drugs tested If the agent is a liquid with a considerable vapor pressure, air is produced under controlled temperature conditions. It can be administered by passing through a solution. Under these conditions, the dose is From the volume of air inhaled, the temperature of the solution, and the vapor pressure of the drug involved. Is determined. Gas is metered from the reservoir. When particles of a solution are to be administered If the particle size is less than about 2 μm, the particles will not reach the terminal alveolar sac of the lung. Various devices and chambers, when administered by inhalation, may cause irritants or other It can be used to conduct studies to detect the effects of toxic endpoints. Move the drug The preferred method of administering to a product is by intubation or by incorporating the drug into the diet. Thus, it is by the oral route.   Preferably, metabolism, absorption, excretion, tissue storage, etc. in designing toxicity assessments Used by two or more species that treat test compounds as similar as possible to humans in terms of Should be done. Preferably, multiple doses or dosing schedules at various concentrations are Should be used to establish a dose-response relationship for toxic effects. So Preferably, the route of administration to the test animal is the same as the route of administration of the compound to humans Or as similar as possible. One route of administration to test animals The effects obtained are not empirically applicable to the effects of alternative routes of administration to humans. Absent. For example, food additives for humans are produced by mixing substances in the diet of test animals. Should be tested.   Acute toxicity testing consists of administering the compound to the test organism in one shot. this The purpose of such tests is to determine the symptomatology of the consequences of Determining the degree of lethality of an object. The first step involves compounding in a single species Is a series of range finding doses. This depends on the choice of route of administration, the choice Requires preparation of compound in a form suitable for administration by route and selection of appropriate species I do. Preferably, the initial acute toxicity study is based on its low cost, its availability, and Due to the availability of abundant toxicological reference data on Or with one of the mice. Long-term toxicity test spans 3-4 months The process of administering the compound to the test organism repeatedly, usually on a daily basis. Become. We come across two real factors that constrain the design of such tests: The selected route is appropriate for repeated administration without inducing adverse effects. The available routes of administration are limited. And second, blood Fluids, urine, and possibly other samples may induce significant harm in test animals No, and should be collected repeatedly. Preferably, the method of the present invention The offspring expression profile is based on traditional toxicological parameters as listed in the table below. Obtained with the measurement of the data:Hematology blood chemistry urine analysis Red blood cell count Sodium pH Total leukocyte count Potassium Specific gravity Differentiated leukocyte count Chlorine Total protein Hematocrit calcium sediment Hemoglobin carbon dioxide glucose                     Serum glutamine-pyruvate ketone                     Transaminase                     Serum glutamine-oxaloacetate bilirubin                     Transaminase                     Serum protein                     Electrophoresis                     Blood sugar                     Blood urea nitrogen                     Total serum protein                     Serum albumin                     Total serum bilirubin                 Oligonucleotide tags and tag complements   Oligonucleotide tags are used for minimal cross-hybridization of oligonucleotides. Members. The sequence of such a set of oligonucleotides is At least two nucleotides differ from the sequence of any other member of the same seven Become. Thus, each member of such a set has less than two mismatches Cannot form a duplex (or triplex) with the complement of any other member of. Book The complement of an oligonucleotide tag, referred to herein as a "tag complement", is naturally occurring. It may include nucleotides or unnatural nucleotide analogs. Preferably the tag The complement binds to the solid support. Such oligonucleotide tags are Molecules, especially polynucleotides, when used with a complementary tag complement. Specificity of hybridization for tracking, tracking, or labeling To provide a means for enhancing   The minimum cross-hybridization set for oligonucleotide tags and tag complements is The desired set size and minimal cross-hybridization To the extent required (or, in other words, increased specificity) Re Depending on the degree), can be synthesized either in combination or individually. . For example, a minimally cross-hybridized set has at least 4 nucleotides in each other. May consist of a set of individually synthesized 10-mer sequences that differ , With a maximum size of 332 (consisting of three nucleotides and in Appendix Ic If counted using a computer program as disclosed). There The minimally cross-hybridized set of oligonucleotide tags is also Are combined from subunits selected from the smallest intersection hybridisation set Can be assembled. For example, different from the other by at least 3 nucleotides The set of minimally cross-hybridizing 12-mers is a minimal set of three nucleotides that differ from each other. Assemble three subunits selected from a set of cross-hybridizing 4-mers Can be synthesized. Such an embodiment is described in 9ThreeI.e. 729, 12 Providing the largest set of mer. Number 9 is the computer program in Appendix Ia. The number of oligonucleotides listed in grams, which are as in 10 mer Assumes that only three of the four different types of nucleotides are used . The computer programs in Appendix Ia-c are provided with predetermined inputs (eg, length, composition, (The difference in the number of nucleotides between members). The cut is described as “maximum”. In addition, the smallest intersection hybrid set is Such a calculated set may be formed from a subset.   The oligonucleotide tag can be single-stranded and single-stranded due to duplex formation. For specific hybridization to tag complement or by triplex formation Designed for specific hybridization to a double-stranded tag complement. Oligonucleotide tags can also be double-stranded and single-stranded by triplex formation. It can be designed for specific hybridization to strand tag complement.   When synthesized in combination, the oligonucleotide tags are preferably multiple Subunits, each subunit being 3-9 nucleotides long. Each subunit has the same minimal cross-hybridization Selected from the set. In such embodiments, the available oligonucleotides Tag number depends on the number of subunits per tag and subunit length I do. In general, the number is much less than the number of all possible sequences and the length of the tag That is 4 for an n nucleotide long tag.nIt is.   The complement of the oligonucleotide tag attached to the solid support is For sorting polynucleotides from each mixture of nucleotides used. Oligonucleotide tag complements have identical sequences in specific regions. Unique in the alignment of synthetic sites on microbeads or on a single support as generated It is synthesized on the surface of a solid support, such as a target site. That is, in the case of beads Or in the case of each region, in the case of alignment, the surface of each support is a phase having a specific arrangement. It is derivatized by only one type of complement. Such beads or areas Group comprises a repertoire of complements with different sequences. Oligonucleotide tags And tag complement as used herein and the term "repertoire" Is the minimum crossover hybridization of the oligonucleotides that make up the tag in certain embodiments. A set of soy sets or a corresponding set of tag complements is meant.   Each sorted polynucleotide has a different polynucleotide Having an oligonucleotide tag attached, like having a different tag. Less than As explained more fully, this condition is substantially more than the group of polynucleotides. By using a large tag repertoire for Fully tagged polynucleotides from a complete ensemble of nucleotides Achieved by taking a small sample. After such sampling, The support and the group of polynucleotides are the respective complements and oligonucleotides When mixed under conditions that allow specific hybridization of the tags, One polynucleotide is sorted on a particular bead or region.   The nucleotide sequence of the oligonucleotide of the minimum crossover hybridization set is: As the source code is exemplified by the programs listed in Appendix Ia and Ib It is enumerated for convenience by a simple computer program. Appendix Ia Program Lamb minhx has a 4-mer subunit composed of three nucleotides Calculate all minimum intersection hybridization sets. The program tagN in Appendix Ib is List the longer oligonucleotides in the minimally cross-hybridizing set. Kind Similar algorithms and computer programs may be implemented in any embodiment of the invention. Easy to list oligonucleotides with minimal cross-hybridization set To Written. Table I below shows the minimum crossover hybridization for the indicated lengths. An indication of the size of the set of rigonucleotides and the number of nucleotide differences Provide a needle. The numbers were generated using the computer program described above.   For some embodiments of the invention, a very large repertoire of tags is required. If not required, the oligonucleotide tag of the minimally cross-hybridizing set , Can be synthesized separately. Contains hundreds to thousands or tens of thousands of oligonucleotides Sets can be synthesized directly by various parallel synthesis approaches, for example, No. 4,689,405; Frank et al., Nucleic Acids Res. earch, 11: 4365-4377 (1983); Matson et al., Anal. Biochem., 224: 110-116 (1995); Fodor et al., International Patent Application PCT / US93 / 04145; Pease et al., Proc. Natl. Acad. Sci., 91: 5022-5026 (1994); Southern et al. Biotechnology, 35: 217-227 (1994); Bren nan, International Application PCT / US94 / 05896; Lashkari et al., Proc. Natl. Acad. Scl., 92: 7912 -7915 (1995).   Preferably, the oligonucleotide tag of the invention has between 3 and 6 nucleotides And the same minimum crossing hybrid Is selected from the set. For oligonucleotides in this range, Members of a set such as Program.   The algorithm of FIG. 1 first sub-units the least-cross hybrid set. Define the characteristics of the parameters: length, number of base differences between members, and composition. For example, they consist of two, three and four bases . Table Mn, N = 1 consists of all possible sequences of a given length and composition (100) Is generated. First subunit S1Is selected and i for the end of the table = N + 1 consecutive subunits SiAnd (120). Consecutive sub The unit requires a mismatch that is a member of the smallest intersection hybridization set Whenever a new table Mn + 1In (125), step 120 is The inclusion of preselected subunits before passing is also omitted. For example, compare In the first set ofTwoIs S1; In a second set of comparisons, MThreeIs S1And And STwo; In a third set of comparisons, MFourIs S1, STwo, And SThreeIncluding It is. Similarly, Table MjThe comparison atjAnd MjAll successive services in Buunit. Subunits are eliminated in a continuous pass by step 130 So each successive table Mn + 1Note that is smaller than the previous one. table MnAfter every subunit of is compared to (140), the old table becomes the new table Mn + 1To Replaced, and the next round of comparison begins. Selected subunit SiWhen Table M without consecutive subunits for comparisonnIs achieved, Word, Mn= Mn + 1If, the process stops (160).   Preferably, the minimally cross-hybridized set is any other sub-set in the set. Contains subunits that make nearly equal contributions to duplex stability as a unit . Thus, a perfectly matched duplex between every subunit and its complement chain Are nearly equal in stability. Guidance for selecting such a set is based on optimal PCR Published on choosing primers and calculating duplex stability Provided by the following techniques: for example, Rychlik et al., Nucleic Acids Research, 1 7: 8543-8551 (1989) and 18: 6409-6412 (1990); Breslauer et al., Proc. Natl. Acad . Sci., 83: 3746-3750 (1986); Wetmur, Crit. Rev. Biochem. Mol. Biol., 26: 2 27-259 (1991). For shorter tags, e.g., about 30 nucleotides or less, The algorithm described in Rychlik and Wetmur is preferred, and longer For example, for more than about 30-35 nucleotides or more, see Suggs et al., Pp. 683-693, Brow. n, ICN-UCLA Symp. Dev. Biol. Opened in 23 volumes (Academic Press, New York, 1981) The algorithm shown can be used conveniently. Obviously, the best within the scope of the present invention. Many approaches were used to design a set of small cross-hybridizing subunits. Switches are available to those skilled in the art. For example, base sticks with different terminal nucleotides Sub-units are assembled to minimize the effects of switching energy , Subunits having the same terminal nucleotide may be provided. Thus, Subunits are linked, the base stacks of all linked terminal nucleotides are The sum of the king energies is the same, thereby reducing the variability of the tag melting point Or eliminate.   Terminal word "words", shown in italics below, also indicate exact matches. As always formed between it and a similar terminal "word" on any other tag complement Can be added to each end of the tag. Such augmented tags have the following form: Do: Here, primed W 'indicates the complement. Tags whose ends match exactly All mismatched words are internal mismatches because they always form a heavy chain. Thereby reducing the safety of the tag-complement duplex with the other mismatched terminus. Decrease qualitative. Duplex with internal mismatch, same mismatch at end It is well known that they are significantly less stable than duplexes having   A preferred embodiment of a minimally cross-hybridizing set has four subunits. A set made up of three of the natural nucleotides. Less than As discussed in one minute, one of the nucleotides in the oligonucleotide tag The absence of the type is due to the use of the 5 'to 3' exonuclease activity of DNA polymerase. Thus, it allows the target polynucleotide to be loaded on a solid support. The following includes four nucleotides selected from the group consisting of A, G, and T Here is a representative minimal intersection hybrid set for each subunit: In this set, each member has three misses with the complement of every other member. Form a duplex with matched bases.   Additional representative minimal cross-hybridization sets are listed below in Table III. Obviously, the additional set is by substituting different groups of nucleotides Or by using a subset of a known minimal crossover hybridization set. And can be generated.                                 Table III         Representative minimal cross hybridizing set of 4 mer subunits   The oligonucleotide tags of the present invention and their complements may be synthesized by phosphoramidite chemistry. Using standard chemical reactions such as reactions, an automated DNA synthesizer, e.g., Applied B iosystems, Inc. (Foster City, California) Model 392 or 394 DNA / RNA Synt  It is conveniently synthesized on a hesizer and is disclosed, for example, in the following references: Beaucage And Iyer, Tetrahedron, 48: 2223-2311 (1992); Molko et al., US Patent No. 4,980,46. No. 0; Koster et al., US Pat. No. 4,725,677; Caruthers et al., US Pat. No. 4,415,732; No. 4,458,066; and No. 4,973,679. The resulting oligonucleotide is Except for being able to specifically hybridize, for example, phosphorothio Alternative chemical reactions that produce non-natural backbone groups such as ate, phosphoramidite, etc. , Can be used. In some embodiments, the tag is processed by the enzyme Or may contain naturally occurring nucleotides that allow manipulation However, the corresponding tag complement promotes the formation of a more stable duplex during sorting Non-natural nucleotide analogs, such as peptide nucleic acids, or analogs I can see.   If microparticles are used as the support, oligonucleotide tags and tag phases The complement repertoire is based on subunit-related synthesis by "split and mix" technology. Thus, for example, Shortle et al., International Patent Application PCT / US93 / 03418 or Lyt tle et al., Biotechniques, 19: 274-280 (1995). Simply put, synthetic A basic unit is a subunit of an oligonucleotide tag. Preferably, Suphoramidite chemistry is used, and the 3 'phosphoramidite ribonucleotide Are prepared for each subunit in the minimally hybridized set. For example, for the first set listed above, eight 4-mer 3'-phospho There is lamidite. The synthesis may be performed as disclosed in Shortle et al. To generate different oligonucleotide libraries using sid monomers Proceeded in a direct analogy using the techniques used in, for example, Telenius et al. , Genomics, 13: 718-725 (1992); Welsh et al., Nucleic Acids Research, 19: 5275. -5279 (1991); Grothues et al., Nucleic Acids Research, 21: 1321-1322 (1993); Har. tley, European Patent Application 90304496.4; Lam et al., Nature, 354: 82-84 (1991); Zuckerman Et al., Int. J. Pept. Protein Research, 40: 498-507 (1992). one In general, these techniques simply involve growing oligonucleotides during the coupling step. Requires application of a mixture of activated monomers to the tide. Preferably, oligo Nucleotide tags and tag complements are different types of terms used in the construction of tags. On a DNA synthesizer with many synthesis chambers greater than or equal to Is done. That is, preferably, there is a synthesis chamber corresponding to each type of word. You. In this embodiment, each synthetic channel is as if the word consisted of 5 nucleotides. The term is appended to each nucleotide so that there are five monomer couplings in the Be added. After the words have been completely synthesized, the synthetic support is removed from the chamber. , Mixed, and redistributed into the chamber for the next cycle of word addition. Subsequent embodiments may include, for example, phosphoramidite chemistry, where the monomer addition is high. Utilize the coupling yield.   The double-stranded form of the tag allows the complementary strands to be synthesized separately, followed by duplex formation By mixing under the following conditions. Alternatively, double-stranded tags One linked to a known oligonucleotide sequence that serves as a primer binding site It can be formed by first synthesizing a chain repertoire. Then the second strand Combine single-stranded repertoire with primers and extend with polymerase Are synthesized by This latter approach is described in Oliphant et al., Gene, 44. : 177-183 (1986). Such double-stranded tags can then be used in accordance with the present invention. Standard for sorting and manipulation of target polynucleotides Together with the target polynucleotide.   Enhanced, such as PNA or oligonucleotide N3 '→ P5' phosphoramidite When tag complements made from nucleotides with different binding characteristics are used , Sorting is 3 '→ 5' exo of DNA polymerase to make the tag single-stranded As an alternative to the “stripping” reaction using nuclease activity, D-loop between tags, including otide and its PNA or phosphoramidite complement Can be performed.   Oligonucleotide tags of the invention can be 12-60 nucleotides or base pairs in length. Range. Preferably, the oligonucleotide tag comprises 18 to 40 nucleotides. Or base pair length range. More preferably, oligonucleotide tags Ranges in length from 25 to 40 nucleotides or base pairs. Good and good From a more favorable number standpoint, these ranges can be expressed as:                                   Table IV             Number of subunits in tag in preferred embodiment SubunitMonomer in Nucleotides in oligonucleotide tags                   (12-60) (18-40) (25-40)     3 4-20 subunit 6-13 subunit 8-13 subunit     4 3-15 subunit 4-10 subunit 6-10 subunit     5 2-12 subunit 3-8 subunit 5-8 subunit     6 2-10 subunit 3-6 subunit 4-6 subunit More preferably, the oligonucleotide tag is single stranded and specific high Hybridization occurs by Watson-Crick pairing with the tag complement. You.   Preferably, the repertoire of single-stranded oligonucleotide tags of the invention is low Comprises at least 100 members; more preferably, the repertoire of such tags And at least 1000 members; and most preferably Pa The tree contains at least 10,000 members.                               Triple chain tag   In embodiments where specific hybridization results from triplex formation, Coding sequence follows the same principles as for double-strand forming tags; There are further restrictions on the choice of the cut sequence. In general, Hoogsteen type The third strand due to binding is homopyrimidine-homoprint in the double-stranded target Most stable with racks. Usually, the base triplet is T-A*T or C-G*C Motif (where "-" indicates Watson-Crick pairing and "*Is Ho ogsteen type binding); however, other motifs are also possible is there. For example, Hoogsteen base pairing, depending on conditions and strand composition, can be a third Between the first strand (Hoogsteen strand) and the double-stranded purine-rich strand to which the third strand binds. Allows row and anti-parallel orientation. Triple-strand stability desired in certain embodiments Proper alignment, orientation, and conditions to maximize or otherwise adjust , Nucleoside type (eg, ribose or deoxyribose nucleoside Is used), base modification (for example, methylated cytosine, etc.) There are extensive guidelines in the literature to do this. See, for example, Roberts et al., Proc. Natl. Acad. S ci., 88: 9397-9401 (1991); Roberts et al., Science, 258: 1463-1466 (1992); Robert. s et al., Proc. Natl. Acad. Sci., 93: 4320-4325 (1996); Distefano et al., Proc. Natl . Acad. Sci., 90: 1179-1183 (1993); Mergny et al., Biochemistry, 30: 9791-9798 (1 991); Cheng et al. Am. Chem. Soc., 114: 4465-4474 (1992); Beal and Dervan Nucleic Acids Research, 20: 2773-2776 (1992); Beal and Dervan, J. Mol. Am. C hem. Soc., 114: 4976-4982 (1992); Giovannangeli et al., Proc. Natl. Acad. Sci. , 89: 8631-8635 (1992); Moser and Dervan, Science, 238: 645-650 (1987); McS. han et al. Biol. Chem., 267: 5712-5721 (1992); Yoon et al., Proc. Natl. Acad. Sc i., 89: 3840-3844 (1992); Blume et al., Nucleic Acids Research, 20: 1777-1784 (19 92); Thuong and Helene, Angew. Chem. Int. Ed. Engl. 32: 666-690 (1993); E scude et al., Proc. Natl. Acad. Sci., 93: 4365-4369 (1996)). Single stranded or Add a double-stranded tag to its single-stranded or double-stranded complement Conditions are well known (eg, Ji et al., Anal. Chem. 65: 1323-1328 (1). 993); Cantor et al., US Patent No. 5,482,836. The use of triple-stranded tags complements their complement 'Stripy' with the polymerase to expose the tag for annealing to the product It has the advantage that no "ging" reaction is required.   Preferably, the oligonucleotide of the invention using triplex hybridization Tide tags are double-stranded DNA, and the corresponding tag complement is single-stranded. Than Preferably, the range of pH stability of the triplex formed between the tag and its complement is broadened. 5-methylcytosine is used instead of cytosine in the tag complement You. Preferred conditions for forming triplex are well disclosed in the above references. You. Briefly, hybridization is less than 5.5 (or 5-methyl Strong salt solution (eg, 1.0 M NaCl, 1.0 M (Eg, potassium acetate). Hybridization temperature depends on tag length and Depending on composition; however, for longer 18-20 martags, hybridization at room temperature Distillation is appropriate. Washing is carried out at room temperature with a non-strong salt solution, e.g. mM sodium acetate, 100 mM MgClTwoPH 5.8. Tags are similar at pH 9.0 Can be eluted from these tag complements by incubation in salt solutions. You.   The minimum cross-hybridization set of oligonucleotide tags that form a triplex is Generated by the computer program of Attachment Ic or a similar program obtain. A representative set of double-stranded 8-mer languages is listed below in capital letters and the corresponding Complements are listed in lower case. Each of these words is represented by three base pairs Different from each of the other words in the set.Table V Exemplary minimal cross-hybridization set of double-stranded 8-mer tags                                   Table VI     Repertoire size of various double-stranded tags that form triplex with tag complement   Preferably, the repertoire of double stranded oligonucleotide tags of the invention is low. Contains at least 10 members; more preferably, the repertoire of such tags is small. Includes at least 100 members. Preferably, the word is a combination of two For a strand oligonucleotide tag, the length is between 4 and 8 nucleotides And the oligonucleotide tag is between 12 and 60 base pairs in length. Than Preferably, such tags are between 18 and 40 base pairs in length.                                 Solid support   Solid supports for use in the present invention include microparticles, beads, and membranes, slides , Plates, micromachined chips, etc. of It can have a form. Similarly, the solid supports of the present invention can be glass, plastic, silicon Con, alkanethioate derivatized gold, cellulose, low and high crosslinked polices A wide variety of compositions can be included, including styrene, silica gel, polyamide, and the like. Preferably, a uniform code of complementary sequences, each of the same tag (and not the other). Which of the separate particle groups is used to have Or a uniform coating of the complementary sequence on the same tag (and not others) Or a small number of supports, each having a spatially distinct area, each containing a group Is used. In later embodiments, the area of the region may vary according to the particular application. Usually, the area is several μmTwo, For example, 3-5 to several hundred μmTwo, For example, 100-500 The area is up to. Preferably, such a region is an event in an adjacent region ( For example, the signal generated by fluorescence Thus, they are spatially separated so that they can be analyzed. In some applications, for example, For simultaneous sequence analysis or to bring the tagged molecules separately proximally And have regions with a uniform coating of more than one tag complement. May be desired.   See, for example, Lund et al., Nucleic Acids Research, 16: 10861-10880 (1988); n et al., Anal. Biochem., 189: 40-50 (1990); Wolf et al., Nucleic Acids Research, 15 : 2911-2926 (1987); or Ghosh et al., Nucleic Acids Research, 15: 5353-5372 (19 As disclosed in 87), tag complements can be used with solid supports, The complement is synthesized there, or synthesized separately, and attached for use Can be done. Preferably, the tag complement is synthesized on the same solid support and used together. Used, which may include various forms and may include various connecting portions. Tag phase Such a support in the area where a uniform group of complement is synthesized may be finely divided or aligned, Alternatively, it may include a matrix. A wide variety of particulate supports can be used in the present invention. , This is controlled pore glass (CPG), highly crosslinked polystyrene, acrylic copoly Mer, cellulose, nylon, dextran, latex, polyacrolein And microparticles produced from such sources and are disclosed in the following exemplary references: Meth. En zymol., Section A, pp. 11-147, vol. 44 (Academic Press, New York, 1976); U.S. Pat. No. 4,413,070; and No. 4,046,720; and Pon, Chapter 19, Agrawal, Methods in Molecular Biology, Volume 20, (Humana Press, Totowa, NJ , 1993). Microparticle supports include commercially available nucleoside derivatized CPG and polystyrene Beads (eg, available from Applied Biosystems, Foster City, CA); Embedded magnetic beads; polystyrene grafted with polyethylene glycol (eg, For example, TentaGelTM, Rapp Polymere, Tubingen Germany). material Support characteristics such as, porosity, size, shape, etc., and the connections used The choice of the minute type depends on the conditions under which the tag is used. For example, a series of enzymes In applications involving continual processing, steric hindrance of the enzyme is minimized and Supports and linkers that facilitate access are preferred. Of the most appropriate particulate support Other important factors to consider in selection are size uniformity, synthetic support As well as known degrees of surface area, and optical properties. As a more complete explanation below, when handling large numbers of beads on a surface, Beads provide a mechanical advantage.   An exemplary linking moiety for attaching and / or synthesizing a tag on a microparticle surface is Pon et al., Biotechniques, 6: 768-775 (1988); Webb, U.S. Patent No. 4,659,774; Ba. rany et al., International Patent Application PCT / US91 / 06103; Brown et al. Chem. Soc. Commun., 1989 : 891-893; Damha et al., Nucleic Acids Research, 18: 3813-3821 (1990); Beattie et al. , Clinical Chemistry, 39: 719-722 (1993); Maskos and Southern, Nucleic Ac. ids Research, 20: 1679-1684 (1992).   As described above, the tag complement can also be uniformly coated with the tag complement. Can be synthesized on a single (or a small number) of solid supports to form an array of regions . That is, the same tag complement is synthesized in each region in such a sequence. This A technique for synthesizing such sequences is described in McGall et al., International Patent Application PCT / US93 / 03767. Pease et al., Proc. Natl. Acad. Sci., 91: 5022-5026 (1994); Southern and Mas. kos, International Patent Application PCT / GB89 / 01114; Maskos and Southern (supra); Southern Et al., Genomics, 13: 1008-1017 (1992); and Maskos and Southern, Nucleic Ac. ids Research, 21: 4663-4669 (1993).   Preferably, the invention relates to a microparticle uniformly coated with the complement of the same tag sequence. Done with particles or beads. Oligonucleotides on microparticle support and its surface Methods for covalently or non-covalently bonding a compound are exemplified by the following references: As is well known: Beaucage and Iyer (supra); Ed. Gait, Oligonucleotide Synthesis: A Practical Approach (IRL Press, Oxford, 1984); Literature. In general, the size and shape of the microparticles is not important; For example, one to two to several hundred, for example, 200 to 1000 μm diameter fine particles having a size range preferable. Because these are oligonucleotides with minimal reagent and sample usage Whether to facilitate the construction and manipulation of large repertoires of pseudotags It is.   In some preferred applications, commercially available controlled pore glass (CPG) or poly Styrene supports are used as solid supports in the present invention. Such a support The carrier has a base-labile linker and the first nucleotide to be attached. Will be available. For example, Applied Biosystems (Foster City, CA). Preferably Fine particles having a pore size of 500-1000 Angstroms are used.   In other preferred applications, non-porous microparticles are used for their optical properties. This is useful when tracking large numbers of particles on a flat support such as a microscope slide. Can be used to advantage. Particularly preferred non-porous microparticles are Bangs laboratories (Car Glycidal methacrylate (GMA) beads available from mel, IN). this Such microparticles are useful in a variety of sizes and combine tags or tag complements. Derivatized with various linking groups. Preferably, tagged microparticles 5 μm diameter GMA beads were used for a large number of parallel manipulations It is.       Tag to polynucleotide for sorting on solid support Attach process   Important aspects of the invention include, for example, polynucleotides from cDNA libraries, Grouping, and polynucleus to which each microparticle or region is attached to only one species Polynucleotides to discrete regions on a solid support to have substantial nucleotides This is the adhesion of tide. The purpose is to attach virtually all different polynucleotides. Achieved by ensuring that you have different tags worn. Next, Conditions include taking a sample of the complete set of tag-polynucleotide conjugates for analysis. Achieved by taking. (Manipulated or analyzed twice at two different locations Only obtain the same polynucleotide that is It is acceptable to have a tag. ) Such a sampling is After being attached to a polynucleotide, it becomes apparent--e.g., From a larger mixture to a smaller volume. By taking the amount--which can be done, or Can be done essentially as a secondary effect of the technology used to Or sampling is both obvious and as an inherent part of the processing process Either can be done.   Preferably, a cDNA library in which substantially all different cDNAs have different tags In building a tree, the complexity or number of different tags Uses a tag repertoire that greatly exceeds the total number of mRNAs extracted from tissue samples. It is. Preferably, the complexity of the tag repertoire is low for the population of polynucleotides. At least ten times; and more preferably, the complexity of the tag repertoire is At least 100 times the nucleotide population. The following is a complete review of an exemplary 9-word tag. About cDNA library constructs using primer mixtures containing parts Is disclosed. Such a mixture of tag-containing primers would9Ma Or 1.34 × 108With the complexity of Winslow et al., Nucleic Acids Research, 19: 325 As shown in 1-3253 (1991), mRNA for library construction is 10-100 It can be extracted from a small number of mammalian cells. Single mammalian cells can be prepared using standard techniques. About 3.4 × 10FourAbout 5 × 10 of different types of mRNA moleculesFiveAbout 100 cells, including copies MRNA from, ie (theoretically) about 5 × 107mRNA molecules can be isolated. This number Comparing with the complexity of the primer mixture, without any additional steps, In addition, mRNA is converted to cDNA with full efficiency (less than 1% is more accurate). The cDNA library construction protocol can be used to Shows that a population containing only 37% of the total number results. That is, With no clean sampling steps, this protocol is compatible with the tag repertoire. Essentially produces material containing 37% or less. Double stranded under these conditions Is about 5%, which is within the preferred range. From 10 cells MRNA has a fraction of only 3.7% of the tag repertoire sampled Reduced, and all processing steps are assumed to be performed at 100% efficiency You. In fact, the efficiency of the processing steps to construct a cDNA library is very And the "approximate guide" is that there are 10 good libraries6From mammalian cells About 10 from the extracted mRNA8CDNA clone should be included.   Larger use of mRNA in the above protocols, or generally polynucleotides Higher usage of tides (where the number of such molecules is more complex than the tag repertoire) Tag-polynucleotide conjugate mixture, Potentially includes pairing and mRNA or polynucleotide types. like this In cases where obvious sampling is the starting mixture of the tag-polynucleotide conjugate This can be done by removing the sample volume after serial dilution of Required dilution Depends on the amount of starting material and the efficiency of the processing step, which are easily Presumed.   mRNA is 106Cells (about 0.5 μg of poly (A)+Extracted from (corresponding to RNA) , And if the primers are present in about a 10-100 fold concentration excess--a representative protocol Col, for example, Sambrook et al., Molecular Cloning, 2nd edition, page 8.61 [10 mg / mL. μL 1.8 kb mRNA is about 1.68 × 10-11Equal to 10 mol / mL at 1 mg / mL -Primer is about 1.68 x 10-9Equivalent to a mole). The total number of tag-polynucleotide conjugates in the library is simply the start of mRNA Less than or equal to about 5x10, including tag-polynucleotide conjugate1 1 Vector--this is also the step in cDNA construction--first strand synthesis, second strand Strand synthesis, ligation to a vector--is assumed to occur with full efficiency. (This is a very conservative estimate). The actual number is significantly lower.   A sample of n tag-polynucleotide conjugates is randomly taken from the reaction mixture. If possible-use the same tag, as can be done by taking a sample volume The probability of collecting a conjugate having a Poisson distribution, P (r) = e- λ(λ)rDescribed by / r Where r is the number of conjugates with the same tag and λ = np, where Here, p is a probability of a predetermined tag to be selected. n = 106And p = 1 / (1.34 × 108 ), Then λ = 0.00746 and P (2) = 2.76 × 10-FiveIt is. Therefore, 1,000,000 A sample of molecules will yield the expected number of duplicate wells within the preferred range. this Such a sample is easily obtained as follows: 5 × 1011mRNA as insert 5 × 10 with tag-cDNA conjugate11Completely converted to vector and 5 × 1011 Assume that the vector is in a reaction solution having a volume of 100 μl. Four 10-fold reams Serial dilutions include 10 μl from the original solution containing 90 μl of the appropriate buffer (eg, TE). Can be carried out by transferring to a container. This process is 5 × 10Five Repeat for three additional dilutions to obtain a 100 μl solution containing vector molecules. Can be returned. A 2 μl aliquot from this solution was used as an insert for tag-cDNA 10 including conjugates6Get the vector. This sample is then used to competent host cells. Amplified by straight forward transformation, followed by culturing. It is.   Of course, as mentioned above, the steps in the above process do not proceed at full efficiency. No. In particular, vectors are used to amplify samples of tag-polynucleotide ligatures. When used, the process of transforming a host is very inefficient. Usually Up to 1% of the vector is adopted and replicated by the host. Therefore, For such a method of width, even less dilution is 106Obtain a sample of the conjugate Needed for   Oligonucleotide tag repertoire includes primers containing tag sequences, etc. Uses a number of methods, including direct enzymatic ligation, e.g., amplification by PCR. In a manner, it can be bound to a population of polynucleotides. The first ligating process is simply The tag is such that one tag is generally attached to many different polynucleotides. -Produces a very large population of polynucleotide conjugates. But as mentioned above By taking a sufficiently small sample of the conjugate, the "double" (ie, The probability of obtaining the same tag on two different polynucleotides) can be ignored You. In general, the larger the sample, the greater the probability of obtaining a double. But Thus, trade-off is a large sample of tag-polynucleotide conjugates. Selecting--this can be, for example, a target polynucleotide in a shotgun sequencing operation. Ensure proper coverage of nucleotides or proper representation of fast-changing mRNA pools -And select a small sample that ensures that the least number of doubles are present Exists between things. In most embodiments, the presence of the double is noisy. Only provide additional sources or, in the case of sequencing, multiple fireflies. Light sig Scanning and signal It only adds a small complexity in processing.   As used herein, a tag is attached to a molecule, especially a polynucleotide. The term “substantially all” in terms of -The statistical properties of the sampling procedure used to obtain the population of molecular conjugates Means to reflect. Substantially no change in the actual percentage of tag-molecule conjugate The meaning of all depends on how the tags are used. Preferably, the nucleic acid sequence For the decision, substantially all are at least 80% polynucleotides It means that the tide has a unique tag attached. More preferably, less At least 90% of polynucleotides have unique tags attached Means Even more preferably, at least 95 percent of the polynucleotides Means that the tag has a unique tag attached. And most preferably , At least 99% of polynucleotides have unique tags attached That means.   Preferably, the population of polynucleotides consists of messenger RNA (mRNA) If so, the oligonucleotide tag is preferably a set comprising the complement of the tag sequence. Can be attached by reverse transcribing the mRNA with the primers. Such a ply An exemplary set of mer may have the following sequence (SEQ ID NO: 1): Here, "W, W, W, C]9"" Indicates the orientation of nine subunits of each four nucleotides. Represents the sequence of the oligonucleotide tag, and “W, W, W, C] is the subunit listed above. Represents a knit arrangement (ie, “W” represents T or A). The underlined array is If one is used, polynucleotides from attachment to a solid support via biotin Identify any restriction endonuclease sites that can be used to release the tide I do. For the above primers, the complement attached to the microparticles has the following form Do:   After reverse transcription, mRNA is removed (eg, by RNase H digestion) and cDNA The second strand is synthesized using, for example, a primer having the following form (SEQ ID NO: 2). RU: Wherein N is any one of A, T, G, or C; R is a purine-containing nucleic acid. Otide and Y is a pyrimidine-containing nucleotide. This particular program The primer is used to bind the resulting double-stranded DNA (Sal I site to a vector (eg, Bam B) which facilitates cloning into (with HI and Xho I sites) Creates a st Y1 restriction site. After Bst Y1 and Sal I digestion, exemplary conjugates are: With form: The polynucleotide-tag conjugate is then converted using standard molecular biology techniques. Can be treated. For example, the conjugate above--which is actually a mixture-- Commercially available cloning vectors (for example, Stratagene Cloning System (La Jolla, CA)); transfected into a host (eg, a commercially available host bacterium). It is then cultured to increase the number of conjugates. Then clonin Vectors are constructed using standard techniques (eg, Sambrook et al., Molecular Cloning, 2nd edition). (Cold Spring Harbor Laboratory, New York, 1989)). . Alternatively, a suitable adapter such that the conjugate population can be increased by PCR And primers can be used.   Preferably, when a ligase-based method of sequencing is used, Bst Y1 and And the SalI digested fragment had the following single copy restriction site (SEQ ID NO: 3) Cloned into a Bam HI- / Xho I-digested vector with: This allows the start of the sequencing process, discussed more fully below, Add an I site.   Tags are ligated to the cDNA of an existing library using standard cloning methods. Can be combined. cDNAs are excised from those existing vectors, isolated and then Is linked to a vector containing the repertoire of tags. Preferably, the tag-containing vector The two restriction enzymes so that the excised cDNA can be ligated in a predetermined orientation. It is linearized by cutting. The concentration of the linearized tag-containing vector is CDNA inserts so that ligation provides the original sampling of tags Is substantially above the concentration.   A common method for exposing single-stranded tags after amplification is to use T4 DNA polymerase. Digestion of target polynucleotide-containing conjugate with 5 '→ 3' exonuclease activity Such as enzymes or enzymes. Single deoxynucleoside triphosphate When used in the presence, the complement of a single deoxynucleoside triphosphate is Until the template strand is reached, such polymerases Cleave nucleotides from the 3 'recessed end present on the non-template strand. When such nucleotides are achieved, the elongation activity of the polymerase increases 5 'because the sex adds nucleotides at a higher rate than it removes nucleotides. → 3 'digestion ends efficiently. As a result, for loading on solid supports In addition, single-stranded tags composed of three nucleotides are easily prepared.   This technique also preferentially methylates the internal Fok I site of the target polynucleotide. At the end of an unmethylated polynucleotide. Leave one Fok I site. First, the terminal Fok I site is associated with deoxycytidine triphosphate. Both are made single-stranded using a polymerase. Then the double strand of the fragment The moiety is methylated and then the single-stranded ends are replaced with all four nucleoside triphosphates In the presence of DNA polymerase, thereby regenerating the Fok I site. joy Anyway, this procedure can be generalized to endonucleases other than Fok I.   Oligonucleotide tags (eg, as described above, make these single-stranded) After being prepared for specific hybridization) Otides favor the formation of a perfectly matched duplex between the tag and its complement. Under the same conditions as microparticles containing the complementary sequence of the tag. In the literature these conditions There are extensive guidelines for producing Example references that provide such guidance Wetmur, Critical Reviews in Biochemistry and Molecular Biology, 26 : 227-259 (1991); Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd edition. (Cold Spring Harbor Laboratory, New York, 1989). Preferred Alternatively, hybridization conditions should be such that only perfectly matched sequences are stable duplexes. Is sufficiently stringent to form Under these conditions, it Polynucleotides specifically hybridized via these tags are attached to the microparticles. Can be ligated to the attached complementary sequence. Finally, the microparticles are washed and linked Polynucleotides with missing and / or mismatched tags are removed You.   When CPG microparticles that are conveniently used as a synthetic support are used, the microparticle surface The density of the above tag complement is typically the complement required for some sequencing operations. Greater than. That is, continuous processing of attached polynucleotides with various enzymes. Closely spaced polynucleotides in sequencing approaches that require Tend to block the access of relatively bulky enzymes to polynucleotides obtain. In such cases, the polynucleotide preferably has a tag complement, Significant excess over polynucleotides (eg, 10: 1 to 100: 1, or more) Is mixed with the microparticles so that This is due to the polynucleotide on the surface of the microparticles. Ensure that the density of the tide is not high enough to inhibit access of the enzyme. Preferably The average spacing between polynucleotides on the surface of the microparticle is about 30 to 100 nm. Standard CPG support and Ballotini beads (solid glass support type) Guidance for selecting the ratio can be found in Maskos and Southern, Nucleic Acids Research, 20: 167. See 9-1684 (1992). Preferably, for sequencing applications, a range of 20-50 μm is used. Standard CPG beads with a diameter ofFiveLoaded with a polynucleotide, and GMA beads having a diameter in the range of 5-10 μm can be used for tens of thousands of polynucleotides, for example, 4 × 1 0Four~ 6 × 10FourLoaded in.   In a preferred embodiment, the tag complement is synthesized in combination on a microparticle; Therefore, at the end of the synthesis, the sample loads the tagged polynucleotide To obtain a complex mixture of microparticles to be collected. What is the size of the particulate sample? This includes the size of the repertoire of tag complements, The nature of the device used to observe the particles that have fallen-for example, their capabilities, the same tag Resistance to multiple copies of the microparticles with complement (i.e., "bead dub And so on. The table below shows the particle sample size, particle diameter, and various The approximate physical size of a packed array of particulates of different diameters Provide guidance on what to do. The probability that the sample of microparticles contains the given tag complement or is present in multiple copies The rates are described by the Poisson distribution, as shown in the table below. Highly specific sorting and panning   The kinetics of selection is based on the hybridization of the oligonucleotide tag to the tag complement. Of the tag in the hybridization reaction. Depends on complexity. Therefore, trade off is a tradeoff between sorting speed and tag complexity. Increase in the sorting speed is associated with the hybridization reaction Can be achieved at the expense of reducing the complexity of the tag. As explained below, The effect of trade off can be recovered by "panning".   The specificity of hybridization can be obtained by collecting sufficiently small samples. So that a high percentage of tags in the sample are unique and in the sample The nearest neighbors of substantially all of the tags differ by at least two words. This latter Conditions are about 0.1% or less of the size of the repertoire used Attained by taking a sample containing multiple tag-polynucleotide conjugates. Can be For example, if the tag is constructed with 8 words selected from Table II, then 88(S That is, about 1.67 × 107Repertoire) tags, and tag complements are generated. Up For a library of tag-cDNA conjugates as described above, a 0.1 percent sample would be approximately 16,7 It means that there are 00 different tags. Repertoire equivalent of fine particles (sun In this example, 1.67 × 107If this is loaded directly on the A low-density subset of the charged microparticles is loaded. Of loaded particulates Density--for example, for more efficient sequencing--sampled tag-cDNA binding Used to separate loaded particulates from unloaded particulates It can be increased by performing a "panning" step that is performed. Therefore, above In the example above, even if the "0.1 percent" sample contains only 16,700 cDNA, The sampling and panning steps can be performed as many loaded granules as desired This can be repeated until children are accumulated.   The panning step can be performed by providing a sample of the tag-cDNA conjugate. , Each of which captures at the opposite end, or distal, of the oligonucleotide tag Including parts. Preferably, the capture moiety is a tie that can be released from the tag-cDNA conjugate. Therefore, the tag-cDNA conjugate was sequenced using the single nucleotide sequencing method. Can be determined. Such moieties may include biotin, digoxigenin, or similar In , Triplex binding regions, and the like. Preferably, such capture moieties are bioactive Contains chin component. Biotin is attached to the tag-cDNA conjugate by a number of standard techniques. Can be worn. A suitable adapter containing a PCR primer binding site is used for tag-cDNA binding. When attached to the body, biotin is biotinylated during amplification after sampling. Can be attached by using a primer. Alternatively, tag-cDNA binding If the body is an insert in a cloning vector, biotin Excising the tag-cDNA conjugate by enzymatic digestion and isolation; and Protrude distal to tag with DNA polymerase in the presence of biotinylated uridine triphosphate After filling the chain, it can be attached.   After the tag-cDNA conjugate is captured, it is cleaved by reduction (eg, Herman Et al., Anal. Biochem., 156: 48-55 (1986)) or photochemically cleaved (eg, Olejnik et al., Nucleic Acids Research, 24: 361-366 (1996)) or PCR By chemical bonds that are enzymatically cleaved by introducing restriction sites into the immer Can be released from the biotin moiety in a number of ways. The latter embodiment is based on the tag described above. -Can be exemplified by considering a library of polynucleotide conjugates : The following adapters are used to terminate these fragments to allow amplification by PCR. Can be concatenated to: Here, “ACTAGT” is the Spe I recognition site (this is the attachment site prepared for single nucleotide sequencing). X and Z are annealing of respective primers And nucleotides selected to have approximately the same dissociation temperature. Adap Ligation and amplification by PCR using biotinylated primers followed by ligation The body tag is single-stranded by the exonuclease activity of T4 DNA polymerase. And the conjugate, along with the attached tag complement, a sample of the microparticles (eg, Repertoire equivalent). (To minimize tag mis-adhesion ) After annealing under stringent conditions, the conjugate is preferably a tag phase. The microparticles linked to and loaded with complement can be avidinated magnetic beads, or Separation from unloaded particulates by capture with a similar capture technique.   Returning to the example, this process works for about 10,500 (= 16,700 × 0.63) with various tags. ), Resulting in the accumulation of loaded microparticles, which was cut by Spe I Can be released from A new sample of microparticles and tag-cDNA conjugate 4 to 5 × 10FivecDNA uses the released microparticles Can be accumulated by pooling. The pooled microparticles are then It can be sequenced simultaneously by base sequencing techniques.   Determine how many times the sampling and panning steps are repeated-or More generally, determining the number of cDNAs to be analyzed depends on the purpose. Purpose Monitor, for example, changes in the abundance of relatively common sequences that make up more than 5% of the population. If smaller, a relatively small sample, i.e., a small fraction of the entire It may allow for a statistically significant estimate of the relative richness. On the other hand, for example, If you want to monitor the abundance of rare sequences that make up less than 0.1% of the population , Large samples are needed. In general, sample size and relative abundance based on sample There is a direct relationship between the reliability of wealth estimates. Reliable statistical view Extensive literature describes how to determine the appropriate sample size to create a stack. What There are guidelines, for example, Koller et al., Nucleic Acids Research, 23: 185-191 (1994); Good, Biometrika, 40: 16-264 (1953); Bunge et al. Am. Stat. Assoc., 88: 364- 373 (1993). Preferably, 3.0-3.5 × 10Four10 of different arrays ofFive~Ten8German Changes in gene expression based on analysis of a series of cDNA libraries containing established clones At least 10 to monitorFourSequence samples are used to analyze each library. To be accumulated. More preferably, at least 10FiveSamples of the array are Accumulated for analysis of L .; and most preferably at least 5 × 10FiveArray Samples are accumulated for analysis of each library. Or sampling The number of sequences performed is preferably 0.1% with a 95% confidence limit of about 0.1% of the population size. Sufficient to estimate the relative abundance of sequences present at a frequency in the range of is there.                           Single base DNA sequencing   The present invention is described, for example, in Hultman et al., Nucleic Acids Research, 17: 4937-4946 (1989). ) Can be used in conventional methods of DNA sequencing. But parallel , Or for simultaneous sequencing of multiple polynucleotides, a similar size DN Electrophoretic separation of A fragments is also a separate analysis as in peptide sequencing DNA sequencing methodology that does not require analysis of truncated nucleothiol by procedures Is preferred. Preferably, the methodology is based on successive cycles of processing and detection. Allows for the stepwise identification of nucleotides in a sequence, usually one at a time. I do. Such a methodology is referred to herein as a "single base" sequencing method. A single base approach is disclosed in the following references: Cheeseman, US Pat. 02,509; Tsien et al., International Application WO 91/06678; Rosenthal et al., International Application WO 93/21340; Canard et al., Gene, 148: 1-6 (1994); and Metzker et al., Nucleic Acids Research, 22: 4259-4267 (1994).   Suitable for use in the present invention and requires electrophoretic separation of DNA fragments A "single base" method of DNA sequencing is described in International Application PCT / US95 / 03678. You. Briefly, the method comprises the following steps: (a) forming the linked complex Connecting a probe to the end of a polynucleotide having a protruding strand to form The probe has an overhanging strand that is complementary to the polynucleotide strand, and The step wherein the lever probe has a nuclease recognition site; (b) the linked complex Removing the unligated probe from (c) the identity of the ligated probe Identifying one or more nucleotides in the overhanging strand of the polynucleotide by gender (D) cleaving the complex linked by nuclease; and (e) polynucleic acid. Steps (a) through (d) until the nucleotide sequence of the reotide or a portion thereof is determined. Repeating the process.   A single signal-generating moiety, such as a signal fluorescent dye, can be used for parallel sequencing operations. Various spatially addressable (addressab) le) sequencing several different target polynucleotides attached to a solid support It is used when This is due to the large number of target polynucleotides in various microparticles. Achieved by providing four sets of probes that are applied sequentially to the ochides Can be achieved. A representative set of such probes is shown below: Here, each of the listed probes is therefore a 3 ' The identity of the tide is fixed, and the other positions of the overhanging strand are every three nucleotides of the nucleotide. Be filled by analogs with reduced permutation or complexity Una, 4Three= Represents a mixture of 64 oligonucleotides. The listed probes also , "T*Single-stranded polypeptides with a signal-generating moiety attached to terminal thymidine Shown with Re-T tail. "D" in unlabeled probe is linked 3 'to prevent ligation of unblocked or unlabeled probes - Hydroxyl indicates absence. Preferably, such a 3'-terminal nucleotide is Dideoxynucleotide. In this embodiment, the probes in set 1 Initially applied to multiple target polynucleotides and labeled 3 'end of probe A target polynucleotide with a thymidine complementary to the terminal adenosine will be ligated. And treated with ligase. Unlabeled probes should be Applied at the same time to minimize Along with probes ending in "A" The location of the target polynucleotide forming the ligated complex is Identified by the signal generated by the resulting label. After cleaning and cutting , Set 2 probes are applied. In this case, with a probe ending in "C" Target polynucleotides forming linked complexes are identified by position . Similarly, the probes of sets 3 and 4 were applied and a positive signal Is identified. This process of applying four sets of probes sequentially Continue until the desired number of nucleotides has been identified in the target polynucleotide . Obviously, one skilled in the art will recognize, for example, protruding strands of various lengths, Various parts to block the ligation of the probe, to label the probe A similar set of probes that can have many changes, such as having various means of Can build.               Apparatus for sequencing populations of polynucleotides   It is an object of the present invention to provide for specific hybridization of a tag and its complement. The same molecules, especially polynucleotides, on the surface of the microparticles. Is Rukoto. Once such sorting is performed, the molecules that are performed there Or the presence of the operation, whether the particulates are detected separately or in "batch", Depends on the nature of the tagged molecule, such as whether repeat measurements are desired And can be detected in many ways. Typically, the sorted molecules are For example, in drug development, exposure to ligands for binding or Subject to chemical or enzymatic processes in polynucleotide sequencing . In both of these uses, such events or processes in large numbers of microparticles It is often desirable to observe the signals corresponding to the processes simultaneously. Saw Te Microparticles with loaded molecules (referred to herein as "loaded" microparticles). For example, as demonstrated by Lam et al. (Supra). Can be adapted for concurrent operations.   Preferably, the light producing signal, e.g., chemiluminescence, fluorescence, etc., is In any case used to detect process, the loaded microparticles International Patent Applications PCT / US91 / 09217, PCT / NL90 / 00081, and PCT / US95 / 01886 For experiments with scanning systems, a flat substrate, e.g. Spread out on a slide. The scanning system scans the substrate reproducibly Scanning and defining the position of each particle in a given area by a coordinate system. Should be possible. For polynucleotide sequencing applications, It is important that the location identification be repeatable in successive scanning steps.   Such scanning systems include commercially available components (eg, one or more photoelectric A photomultiplier tube, or alternatively, a CCD array, and, for example, to excite and collect fluorescent signals Detection system including suitable optics for collection and sorting X-y conversion table controlled by digital computer used with ). In some embodiments, a confocal lens based system is desired Can be done. A typical scanning system suitable for use in four-color sequencing is This is illustrated in FIG. Substrate 300 (eg, microscope slide with immobilized microparticles ) Is placed on the x-y conversion table 302, which is a properly programmed digital Connected to and controlled by a computer 304, which For sale personal computers, such as 486-based machines or Apple Computer ( PowerPC model 7100 or 8100 available from Cupertino, CA) obtain. Computer software for table conversion and data collection functions Commercial laboratory software such as Lab Windows, available from National Instruments. Software.   The substrate 300 and the table 302 are connected to a microscope 306 having one or more objective lenses 308. Operationally coupled, this lens collects and directs light on the particles fixed to the substrate 300. Can be delivered. The excitation light 310 (preferably a laser) from the light source 312 A beam splitter 314 (eg, a dichroic mirror), which Redirect the beam through the objective lens 308 and then focus the beam onto the substrate 300 You. A lens 308 collects the fluorescent light 316 emitted from the microparticles, and It directs it through signal 314 to signal distribution lens system 318, and then One or more suitable for converting a property (eg, strength, lifetime, etc.) to an electrical signal Direct fluorescence to the upper photoelectric element. The signal distribution lens system 318 is standard in the art. Substantially various components, such as bandpass filters, fiber optics s), rotating mirrors, fixed position mirrors and lenses, diffraction gratings and the like. FIG. As shown, the signal distribution lens system 318 converts the fluorescence 316 into four separate photomultipliers. To tubes 330, 332, 334, and 336, and then the output is Photon counters 350, 352, 354, and 356. Photon counter Output is collected by computer 304, where it is stored and analyzed And displayed on video 360. Alternatively, the signal distribution lens system 318 It can be a diffraction grating that directs the light signal 318 to a CCD array.   Stability of positional localization in scanning And reproducibility are almost smelling resolution to separate nearby particles To decide. Preferably, the scanning system is located nearby (eg, Fine particles (which are separated by a particle diameter or less) should be able to be resolved. did Thus, for most applications, for example, the use of CPG microparticles The system should be capable of resolving objects of at least 10-100 μm. It is. Even higher resolutions may be desired in some embodiments, but increase Resolution increases the time required to completely scan the substrate; Thus, in some embodiments, a compromise must be made between speed and resolution Can be The increase in scanning time is due to the fact that particles A system that only scans locations that are known to be located) Thus, it can be achieved. Preferably, particle size and scanning system Resolution is cmTwoRandomly distributed on a plane at a density between about 10,000-100,000 particles per It is selected to allow resolution of the placed fluorescently labeled microparticles.   In sequencing applications, loaded microparticles are immobilized on the surface of a substrate in various ways. Can be Immobilization results in significant loss of microparticles over successive cycles of reagent exposure and washing Should be strong enough to be able to receive without. The substrate is glass In some cases, the surface can be prepared using commercially available reagents (eg, Pierce Chemical) Can be derivatized with an alkylamino linker, and then re-acquired using conventional chemistry. It can be crosslinked to vidin to form an avidinated surface. Biotin part is for many people Can be introduced into the loaded microparticles. For example, tag to polynucleotide The fraction of the cloning vector used to attach (eg, 10-15%) , Immediately adjacent to the polynucleotide insert at the end of the polynucleotide opposite the tag Engineered to include a unique restriction site flanking (providing cohesive ends during digestion) You. This site is used for loading polynucleotides and tags for loading onto microparticles. Cut out by After loading, about 10-15% of loaded polynucleo Tide has a unique restriction site distal from the microparticle surface. Combined restriction endonu After digestion with creatase, a suitable double-stranded adapter containing a biotin moiety is Connected to the end. The resulting microparticles are then ligated by biotin-avidin ligation. Spread on the avidinized glass surface to be fixed.   Alternatively and preferably, when sequencing by ligation is used In the first ligation step, a mixture of probes is applied to the loaded microparticles Yes: Some fractions of the probe are type IIs restricted, as required for sequencing Contains recognition sites and some fractions of the probe do not have such recognition sites But instead contains a biotin moiety at its non-linked end. Preferably, the mixture is Contains about 10-15 percent of the otylated probes.   In yet another alternative, when DNA loaded microparticles are applied to a glass substrate DNA is non-specific on glass surface after several hours (eg, 24 hours) incubation Adsorption to reagents and washing solutions without significant loss of particulates Produces a bond strong enough to allow exposure of Preferably, such a gala The substrate is a flow cell, which is a chamber etched into a glass slide. Flannel. Preferably, such channels allow liquid to pass through them. Closed so that it can be sucked out with a pump, and a monolayer of particulates within the defined viewing area Has a depth close enough to the diameter of the microparticles to be captured bycDNA Identification of novel polynucleotides in libraries   Novel polynucleotides in the cDNA library, as described above, It can be identified by constructing a library of attached cDNA molecules. live A large fraction of the rally, or even the entire library, is then partially distributed in parallel. Columns can be determined. Isolation of mRNA, and possibly, Soares et al., Proc. Natl. Acad. After population normalization as taught in references such as Sci., 91: 9228-9232 (1994). The following primers were used for first strand synthesis with reverse transcriptase using conventional protocols. Can be hybridized to a poly A tail for formation (SEQ ID NO: 1): Where [W, W, W, C]9Represents a tag as described above, and “ACCAGCTGATC” is a double-stranded An arbitrary sequence that forms a restriction site in the form, and a "primer site" To amplify the target polynucleotide by using the primer binding site later. It is an ordinary sequence for all members of the library used.   After reverse transcription and second strand synthesis by conventional techniques, the double-stranded fragment Inserted into a cloning vector and amplified as described. Then amplified The library obtained is sampled and the sample is amplified. Amplified trial The cloning vector from the source was isolated and tagged cDNA fragment Are cut out and purified. One tag with polymerase as above After chaining, the fragments are methylated and, according to the invention, are solubilized on microparticles. Will be Preferably, as described above, the cloning vector comprises a tag So that the attached cDNA can be cut out with an endonuclease such as Fok I. Once constructed and sorted and coupled to microparticles, the preferred single base method Allows for immediate sequencing.   Then a sufficient number of nucleotides are found in the genome of the organism from which the library is derived. Until identified in each cDNA for a unique expression of According to the invention, the entire library or one or more large fractions of the library At the same time. For example, if the library is derived from mammalian mRNA, The 14-15 nucleotide length chosen for the sequence is between 2000 and It is predicted to have a unique designation of 3000 megabases. Of course, much less Identification of nucleotides not found in bacterial or other lower animal derived libraries Sufficient for a unique display. Preferably, at least 20-30 nucleotides are unique Labeling and allows for the construction of appropriate primers as described below. To be identified. The tabulated sequences are then used to identify unique cDNAs. It can be compared to known sequences.   The unique cDNA is then determined by conventional techniques, e.g., by priming and sequencing. PCR amplicon generated with primers directed to the selected cDNA portion By constructing a probe from Then the probe is To identify cDNAs in a library using our screening protocol Can be used for   The above methods for identifying new cDNAs are also useful in isolated assays. Fingerprint the mRNA population, either in terms of Can be used to The partial sequence information is obtained as described in the method above. Large samples attached to separate, e.g., 10,000 to 100,000 or more cDNAs Are obtained at the same time.                                 Example 1                           Building a tag library   A representative tag library comprises nucleotides A, G, defined by the following formula: Construct as follows to form a chemically synthesized 9-word tag of T and T: here,"[Four(A, G, T)9] "Indicates a tag mixture, where each tag is A, G, and T And "p" indicates 5 'phosphate. This mixture is Ligation to lower right and left primer binding regions (SEQ ID NO: 4 and SEQ ID NO: 5) : The right and left primer binding regions are ligated to the above tag mixture and then ligated. The single-stranded portion of the isolated structure is filled with DNA polymerase and then And the left primer and amplify to obtain a tag library (SEQ ID NO: No. 6). The underlined portion of the left primer binding region indicates the Rsr II recognition site. Right ply The leftmost underlined regions of the mer-binding regions are Bsp120I, ApaI, and Eco01. The recognition site for 09I and the cleavage site for HgaI are shown. Right primer The rightmost underlined region of the binding region indicates the recognition site for HgaI. If necessary, the right or left primer can be used for purification after amplification and / or cleavage. (For example, available from Clontech Laboratories, Palo Alto, CA) Functional (using conventional reagents) with biotin attached. The plasmid is cut with Ppu MI and Pme I (Rsr so that the insert is oriented).  II to obtain compatible and blunt ends) and then use DAM methylase Chill. The tag-containing construct is cut with Rsr II and then ligated into the open plasmid. The conjugate was then cut with Mbo I and Bam HI to ligate and plasmid Enables the closure of The plasmid is then amplified and isolated, and Use as specified.                                 Example 3         In rat liver tissue exposed to various xenobiotic drugs Changes in gene expression profiles   In this example, genes induced as a result of exposure to xenobiotic compounds were detected. To test the ability of the method of the present invention to produce Expression profiles are known to induce the expression of cytochrome P-450 isoenzymes. The following doses of some compounds are tested. Results obtained from the method of the invention Was obtained from the reverse transcriptase PCR assay and the immunochemical assay for cytochrome P-450 isozymes. Compare with the results obtained. Protocols and materials for the latter assay are rris et al., Biochemical Pharmacology, 52: 781-792 (1996).   Using male Sprague-Dawley rats 6-8 weeks of age and 200-300 g body weight, and Food and water are provided ad libitum to the animals. The test compound was phenobarbital (PB) , Metyrapone (MET), dexamethasone (DEX), clofibrate (CLO), Corn oil (CO), and β-naphthoflapon (BNF); emical Co. (St. Louis, MO). Anti-specific P-450 enzyme Bodies are available from the following sources: Rabbit anti-rat CYP3A1 is available from Human Biolog ics, Inc. (Phoenix, AZ); Goat anti-rat CYP4A1 is from Daiichi Pure Chemicals Co. (Tokyo, Japan); Monoclonal mouse anti-rat CYP1A1, Monoclona Mouse anti-rat CYP2C11, goat anti-rat CYP2E1, and monoclonal mouse Anti-rat CYP2B1 is available from Oxford Biochemical Research, Inc. (Oxford, MI) . Secondary antibodies (goat anti-rabbit IgG, rabbit anti-goat IgG, and goat anti-mouse IgG) Available from Jackson ImmunoResearch Laboratories (West Grove, PA) .   Wang et al., Arch. Biochem. Biophys. 290: 355-361 (1991) Following the same administration method as above, animals were given PB (100 mg / kg), BNF (100 mg / kg), MET (100mg / kg), DEX (100mg / kg) or CLO (250mg / kg) for 4 days Administer by continuous intraperitoneal injection. HTwoControl animals treated with O and CO Used as a tool. Animals were sacrificed 2 hours after the last injection (day 4) and liver Remove the offal. Livers are immediately frozen and stored at -70 ° C.   Total RNA was modified by the method described in Xie et al., Biotechniques, 11: 326-327 (1991). Prepared from frozen liver tissue using About 100-200 mg of liver tissue, Xie Homogenize in the RNA extraction buffer described above to isolate total RNA. RN obtained A was reconstituted in diethyl pyrocarbonate-treated water and subjected to spectrophotometry at 260 nm. Therefore, quantify and adjust to a concentration of 100 μg / ml. Total RNA, apparent degradation In water treated with diethyl pyrocarbonate at -70 ° C for up to one year without any Exist. RT-PCR and sequencing are performed on samples from these preparations.   For sequencing, about 0.5 μg of poly (A)+Use an RNA sample corresponding to the RNA `` Attaching Tags to Polynucleotides for Sorting onto  Sol tag-cDNA binding according to the protocol described in the section entitled “id Phase Supports”. Build a body library: The tag repertoire contains the six 4 nucleotides from Table II. Constructed from Otide. Therefore, the complexity of the repertoire is 86Or about 2 .6 × 10FiveIt is. For each tag-cDNA conjugate library constructed, about 10,0 Ten samples of the 00 clone are taken for amplification and sorting. Amplified Each of the samples contains approximately 106Immobilized 10 μm diameter GMA beads Apply separately to single layer. That is, the tag complementation in the GMA beads group in each monolayer The “sample” of an object is a repertoire of about four times the total size, Each Ringed Tag-cDNA Conjugate Finds Its Tag Complement on a Monolayer Make sure there is a high probability. The oligonucleotide tag of the amplified sample is After being single-stranded as described above, the tag-cDNA conjugate of the sample is Specific hive only between the tag and the tag complement forming a perfectly matched duplex Applied separately to the monolayer under conditions that allow for redidation. Amplified trial Select the concentration of the reagents and the hybridization time About 5 × 10 on beadsFour~ 2 × 10FiveAllows loading of tag-cDNA conjugate. Consolidation Later, the 9-12 nucleotide portion of the attached cDNA was replaced by Brenner, International Patent Application PCT / US9. Determined in parallel by the single base sequencing technique described in 5/03678. Heredity The frequency distribution for the offspring expression profile was determined from the sequence obtained from each of the 10 samples. Build from information.   For cytochrome P-450 gene and constitutively expressed cyclophilin gene RT-PCR of the corresponding selected mRNA is performed as described in Morris et al., Supra. Simple Speaking of 1x reverse transcriptase buffer (Gibco BRL), 10 nM dithiothreitol, 0.5 nM dNTP, 2.5 μM oligo d (T)15Primer, 40 units RNasin (Promega, Madis on, WI), 200 units RNase H-reverse transcriptase (Gibco BRL), and 400 ng of total RNA A 20 μl reaction mixture containing (diethyl pyrocarbonate-treated water) is prepared. You. The reaction was incubated at 37 ° C. for 1 hour and then at 95 ° C. for 5 minutes Inactivate. The resulting cDNA is stored at -20 C until use. cDNA PCR For amplification, 10x polymerase reaction buffer, 2mM MgClTwo, 1 unit Taq DNA Polymerase (Perkin-Elmer, Norwalk, CT), 20 ng cDNA, and Morris et al. 10 μl containing 200 nM concentrations of 5 ′ and 3 ′ specific PCR primers of the sequence described above An L reaction mixture is prepared. PCR was performed on a Perkin-Elmer 9600 thermal cycler. Thaw at 94 ° C for 30 seconds, 56 ° C for 1 minute, and 72 ° C for 1 minute, respectively, annealing And 23 cycles using elongation and extension conditions. 5% less cDNA product Separate by PAGE using a denaturing gel. Band stained with ethidium bromide Detect by color.   Western blots of liver proteins were run on standard Perform using tocol. Briefly, proteins were reduced to 10% SDS-PA under reducing conditions. Separation on GE gels and Harris et al., Proc. Natl. Acad. Sci., 88: 1407-1410 (1 Using a modification of the method described in 991), immunoblotting for detection of P-450 isoenzymes To The protein was loaded at 50 μg / lane and incubated at 2 ° C. for about 4 hours. Disconnect under current (250V). Proteins are converted to 120 mM glycine and 20% (v / v) meta Nitrocellulose membrane (Bio-Rad, He- rcules, CA). Block the nitrocellulose membrane with 2.5% BSA and Primary monoclonal and polyclonal antibodies and secondary alkaline phosphatase Immunoblot for P-450 isoenzymes using tatase-conjugated anti-IgG. Immunoblots are developed with the Bio-Rad alkaline phosphatase substrate kit.   The three types of P-450 isoenzyme induction measurements showed substantial agreement.                                 Appendix Ia           To produce minimally cross-hybridizing sets Exemplary computer program                   (Single-stranded tag / single-stranded tag complement)                                 Appendix Ib           To produce minimally cross-hybridizing sets Exemplary computer program                   (Single-stranded tag / single-stranded tag complement)                                 Appendix Ic           To produce minimally cross-hybridizing sets Exemplary computer program                   (Double-stranded tag / single-stranded tag complement)

Claims (1)

【特許請求の範囲】 1.化合物の毒性を決定する方法であって、該方法が、 テスト生物に該化合物を投与する工程; 該テスト生物の1つ以上の組織のそれぞれからmRNA分子の群を抽出する工程; 別の群の各cDNA分子が付着されたオリゴヌクレオチドタグを有するように、該 1つ以上の組織からのmRNA分子の各群から、cDNA分子の別々の群を形成する 工程であって、該オリゴヌクレオチドタグが同じ最小交差ハイブリダイズセット から選択される、工程; 別々の群内の実質的にすべての異なるcDNA分子が付着された異なるオリゴヌク レオチドを有するように、cDNA分子の各群を別々にサンプリングする工程; 該オリゴヌクレオチドタグをそのそれぞれの相補物と特異的にハイブリダイズ することによって各別々の群のcDNA分子をソーティングする工程であって、該そ れぞれの相補物が、1つ以上の固相支持体上で空間的に異なる領域における実質 的に同一の相補物の均一な群として付着される、工程; 該1つ以上の組織のそれぞれについて発現された遺伝子の頻度分布を形成する ために、各別々の群の該ソーティングされたcDNA分子のそれぞれの一部のヌクレ オチド配列を決定する工程;および 該1つ以上の組織のそれぞれにおける発現された遺伝子の該頻度分布を、該化 合物の毒性と相互関連させる工程、 を包含する、方法。 2.前記オリゴヌクレオチドタグおよび該オリゴヌクレオチドタグの前記相補 物が、一本鎖である、請求項1に記載の方法。 3.請求項2に記載の方法であって、前記オリゴヌクレオチドタグが、多数の サブユニットからなり、各サブユニットが、3〜9ヌクレオチド長のオリゴヌク レオチドからなり、そして各サブユニットが、同じ最小交差ハイブリダイズセッ トから選択される、方法。 4.請求項3に記載の方法であって、前記1つ以上の固相支持体が微粒子であ り、そして前記cDNA分子を該微粒子上でソーティングする前記工程が、ロードさ れた微粒子のサブ群およびロードされていない微粒子のサブ群を生じる、方法。 5.前記ロードされていない微粒子から前記ロードされた微粒子を分離する工 程をさらに包含する、請求項4に記載の方法。 6.請求項5に記載の方法であって、前記ロードされた微粒子の数が少なくと も10,000で蓄積されるまで、サンプリング、ソーティング、および分離の前記工 程を繰り返す工程をさらに包含する、方法。 7.前記ロードされた微粒子の数が、少なくとも100,000である、請求項6に 記載の方法。 8.前記ロードされた微粒子の数が、少なくとも500,000である、請求項7に 記載の方法。 9.請求項5に記載の方法であって、前記群の0.1%くらいの95%信頼限界で0 .1%〜5%の範囲内の頻度で該群に存在するcDNA分子の相対的豊富さを見積もる ために十分である、前記ロードされた微粒子の数が蓄積されるまで、サンプリン グ、ソーティング、および分離の前記工程を繰り返す工程をさらに包含する、方 法。 10.前記テスト生物が、哺乳動物組織培養物である、請求項4に記載の方法 。 11.前記哺乳動物組織培養物が肝細胞を含む、請求項10に記載の方法。 12.前記テスト生物が、ラット、マウス、ハムスター、モルモット、ウサギ 、 ネコ、イヌ、ブタ、およびサルからなる群より選択される動物である、請求項4 に記載の方法。 13.前記1つ以上の組織が、肝臓、腎臓、脳、心臓血管、甲状腺、脾臓、副 腎、大腸、小腸、膵臓、膀胱、胃、卵巣、精巣、および腸間膜リンパ腺からなる 群より選択される、請求項12に記載の方法。 14.化合物での処理後にテスト動物の選択された組織で区別して発現される 遺伝子を同定する方法であって、該方法が、 該化合物をテスト動物に投与する工程; 該テスト動物の該選択された組織からmRNA分子の群を抽出する工程; 各cDNA分子が付着されたオリゴヌクレオチドタグを有するように、mRNA分子の 群からcDNA分子の群を形成する工程であって、該オリゴヌクレオチドタグが、同 じ最小交差ハイブリダイズセットから選択される、工程; 実質的にすべての異なるcDNA分子が、付着された異なるオリゴヌクレオチドタ グを有するように、cDNA分子の該群をサンプリングする工程; 該オリゴヌクレオチドタグをそのそれぞれの相補物と特異的にハイブリダイズ することによって、該cDNA分子をソーティングする工程であって、該それぞれの 相補物が、1つ以上の固相支持体上の空間的に異なる領域で実質的に同一の相補 物の均一な群として付着される、工程; 発現された遺伝子の頻度分布を形成するために、該ソーティングされたcDNA分 子のそれぞれの一部のヌクレオチド配列を決定する工程;および 該テスト動物の該選択された組織の発現された遺伝子の該頻度分布を、コント ロール動物の選択された組織の発現された遺伝子の頻度分布と比較することによ って、該化合物を投与することに応じて発現される遺伝子を同定する工程、 を包含する、方法。 15.前記オリゴヌクレオチドタグおよび該オリゴヌクレオチドタグの相補物 が一本鎖である、請求項14に記載の方法。 16.請求項15に記載の方法であって、前記オリゴヌクレオチドタグが多数 のサブユニットからなり、各サブユニットが、3〜9ヌクレオチド長のオリゴヌ クレオチドからなり、そして各サブユニットが、同じ最小交差ハイブリダイズセ ットから選択される、方法。 17.請求項16に記載の方法であって、前記1つ以上の固相支持体が微粒子 であり、そして前記cDNA分子を該微粒子上でソーティングする前記工程が、ロー ドされた微粒子のサブ群およびロードされていない微粒子のサブ群を生じる、方 法。 18.前記ロードされていない微粒子から前記ロードされた微粒子を分離する 工程をさらに包含する、請求項17に記載の方法。 19.請求項18に記載の方法であって、前記ロードされた微粒子の数が少な くとも10,000で蓄積されるまで、サンプリング、ソーティング、および分離の前 記工程を繰り返す工程をさらに包含する、方法。 20.前記ロードされた微粒子の数が、少なくとも100,000である、請求項1 9に記載の方法。 21.前記ロードされた微粒子の数が、少なくとも500,000である、請求項2 0に記載の方法。 22.請求項18に記載の方法であって、前記群の0.1%くらいの95%信頼限 界で0.1%〜5%の範囲内の頻度で該群に存在するcDNA分子の相対的豊富さを見 積もるために十分である、前記ロードされた微粒子の数が蓄積されるまで、サン プリング、ソーティング、および分離の前記工程を繰り返す工程をさらに包含す る、方法。 23.前記テスト生物が、ラット、マウス、ハムスター、モルモット、ウサギ 、ネコ、イヌ、ブタ、およびサルからなる群より選択される、請求項17に記載 の方法。 24.前記選択された組織が、肝臓、腎臓、脳、心臓血管、甲状腺、脾臓、副 腎、大腸、小腸、膵臓、膀胱、胃、卵巣、精巣、および腸間膜リンパ腺からなる 群より選択される、請求項23に記載の方法。 25.テスト生物における化合物の毒性を決定するための、しっかりした並行 のサイン配列決定の技法の使用であって、該使用が、 テスト生物に該化合物を投与する工程; 該テスト生物の1つ以上の組織のそれぞれからmRNA分子の群を抽出する工程お よび該1つ以上の組織からのそれぞれについて、cDNA分子の群を形成する工程; 別々の群内の実質的にすべての異なるcDNA分子が付着された異なるオリゴヌク レオチドを有するように、cDNA分子の各群を別々にサンプリングする工程; 該1つ以上の組織のそれぞれについて発現された遺伝子の頻度分布を形成する ために、しっかりした並行サイン配列決定を使用して、各別々の群のcDNA分子の それぞれの一部のヌクレオチド配列を決定する工程;および 該1つ以上の組織のそれぞれにおける発現された遺伝子の該頻度分布を、該化 合物の毒性と相互関連させる工程、 を包含する、使用。 26.前記テスト生物が哺乳動物組織培養物である、請求項25に記載の使用。 27.前記哺乳動物組織培養物が肝細胞を含む、請求項26に記載の使用。 28.前記テスト生物が、ラット、マウス、ハムスター、モルモット、ウサギ 、ネコ、イヌ、ブタ、およびサルからなる群より選択される動物である、請求項 2 5に記載の使用。 29.前記1つ以上の組織が、肝臓、腎臓、脳、心臓血管、甲状腺、脾臓、副 腎、大腸、小腸、膵臓、膀胱、胃、卵巣、精巣、および腸間膜リンパ腺からなる 群より選択される、請求項28に記載の使用。 30.化合物での処理後にテスト生物で区別して発現され、そして該化合物の 毒性と関連される遺伝子を同定するための、しっかりした並行サイン配列決定の 技法の使用であって、該使用が、 該化合物を該テスト生物に投与する工程; 該テスト生物の選択された組織からmRNA分子の群を抽出し、cDNA分子の群を形 成する工程; 発現された遺伝子の頻度分布を形成するために、しっかりした並行サイン配列 決定を使用して、該cDNA分子のそれぞれの一部のヌクレオチド配列を決定する工 程; 該テスト生物の該選択された組織の発現された遺伝子の該頻度分布を、コント ロール生物の選択された組織の発現された遺伝子の頻度分布と比較することによ って、該化合物を投与することに応じて発現される遺伝子を同定する工程;およ び 該化合物を投与することに応じて発現される該遺伝子が、該テスト生物におけ る該化合物の毒性と相互関連するかどうかを決定する工程、 を包含する、使用。[Claims]   1. A method for determining the toxicity of a compound, comprising:   Administering the compound to a test organism;   Extracting a group of mRNA molecules from each of one or more tissues of the test organism;   A separate group of each cDNA molecule has an oligonucleotide tag attached to it. Form a separate group of cDNA molecules from each group of mRNA molecules from one or more tissues Step, wherein the oligonucleotide tags have the same minimum crossover hybridization set. A process selected from:   Different oligonucleotides attached to substantially all different cDNA molecules in separate groups Separately sampling each group of cDNA molecules to have leotide;   Specifically hybridize the oligonucleotide tag with its respective complement Sorting the cDNA molecules of each separate group. Each complement is substantially identical to a spatially distinct region on one or more solid supports. Attached as a homogeneous group of essentially identical complements;   Forming a frequency distribution of the expressed genes for each of the one or more tissues For each of the separate groups of each of the sorted cDNA molecules, Determining the nucleotide sequence; and   Transforming the frequency distribution of the expressed genes in each of the one or more tissues Correlating the toxicity of the compound, A method comprising:   2. The oligonucleotide tag and the complement of the oligonucleotide tag 2. The method of claim 1, wherein the object is single-stranded.   3. 3. The method of claim 2, wherein the oligonucleotide tag comprises a plurality of oligonucleotide tags. Subunits, each subunit being an oligonucleotide 3-9 nucleotides in length Leotide, and each subunit has the same minimal crossover hybridization set. Method selected from the list.   4. 4. The method of claim 3, wherein said one or more solid supports are microparticles. And the step of sorting the cDNA molecules on the microparticles is loaded. A method of producing a subgroup of loaded microparticles and a subgroup of unloaded microparticles.   5. A process for separating the loaded particles from the unloaded particles. 5. The method of claim 4, further comprising the step of:   6. 6. The method of claim 5, wherein the number of loaded microparticles is at least The above steps of sampling, sorting, and separation until also accumulated at 10,000 The method further comprising the step of repeating the steps.   7. 7. The method of claim 6, wherein the number of loaded microparticles is at least 100,000. The described method.   8. 9. The method of claim 7, wherein the number of loaded microparticles is at least 500,000. The described method.   9. 6. The method of claim 5, wherein the 95% confidence limit of about 0.1% of the group is zero. Estimate the relative abundance of cDNA molecules present in the group with a frequency in the range of 1% to 5% Sampling until the number of loaded microparticles is sufficient to accumulate Further comprising the step of repeating said steps of sorting, sorting and separating. Law.   10. 5. The method of claim 4, wherein said test organism is a mammalian tissue culture. .   11. 11. The method of claim 10, wherein said mammalian tissue culture comprises hepatocytes.   12. The test organism is a rat, mouse, hamster, guinea pig, rabbit , 5. An animal selected from the group consisting of cats, dogs, pigs, and monkeys. The method described in.   13. The one or more tissues may be liver, kidney, brain, cardiovascular, thyroid, spleen, Consists of kidney, large intestine, small intestine, pancreas, bladder, stomach, ovary, testis, and mesenteric lymph glands 13. The method of claim 12, wherein the method is selected from a group.   14. Differentially expressed in selected tissues of test animals after treatment with compound A method for identifying a gene, comprising:   Administering the compound to a test animal;   Extracting a group of mRNA molecules from the selected tissue of the test animal;   So that each cDNA molecule has an oligonucleotide tag attached to it. Forming a group of cDNA molecules from the group, wherein the oligonucleotide tag comprises Selected from the same minimum intersection hybridization set;   Virtually all different cDNA molecules have different oligonucleotide tags attached to them. Sampling said group of cDNA molecules to have   Specifically hybridize the oligonucleotide tag with its respective complement Thereby sorting the cDNA molecules, wherein the respective Complements are substantially identical at spatially distinct regions on one or more solid supports; Attached as a uniform group of objects;   To form a frequency distribution of the expressed genes, the sorted cDNA Determining the nucleotide sequence of a portion of each of the offspring; and   The frequency distribution of the expressed genes in the selected tissue of the test animal is By comparing the frequency distribution of expressed genes in selected tissues of roll animals Thus, identifying a gene expressed in response to administering the compound, A method comprising:   15. The oligonucleotide tag and the complement of the oligonucleotide tag 15. The method of claim 14, wherein is single-stranded.   16. 16. The method of claim 15, wherein the number of oligonucleotide tags is multiple. And each subunit is an oligonucleotide having a length of 3 to 9 nucleotides. And each subunit has the same minimal crossover hybridization sequence. Method selected from the set.   17. 17. The method of claim 16, wherein said one or more solid supports are microparticles. And the step of sorting the cDNA molecules on the microparticles comprises: To produce a subgroup of loaded microparticles and a subgroup of unloaded microparticles. Law.   18. Separating the loaded microparticles from the unloaded microparticles 18. The method of claim 17, further comprising the step of:   19. 19. The method of claim 18, wherein the number of loaded microparticles is low. Before sampling, sorting, and separation until accumulated at least 10,000 A method further comprising the step of repeating the above steps.   20. 2. The method of claim 1, wherein the number of loaded microparticles is at least 100,000. 10. The method according to 9.   21. 3. The method of claim 2, wherein the number of loaded microparticles is at least 500,000. The method according to 0.   22. 19. The method of claim 18, wherein the group has a 95% confidence limit of as much as 0.1%. The relative abundance of cDNA molecules present in the group with a frequency in the range of 0.1% to 5% Until the number of loaded particulates is sufficient to accumulate, Further comprising repeating the steps of pulling, sorting, and separating How.   23. The test organism is a rat, mouse, hamster, guinea pig, rabbit 18. The composition of claim 17, wherein the composition is selected from the group consisting of, cats, dogs, pigs, and monkeys. the method of.   24. The selected tissues may be liver, kidney, brain, cardiovascular, thyroid, spleen, Consists of kidney, large intestine, small intestine, pancreas, bladder, stomach, ovary, testis, and mesenteric lymph glands 24. The method of claim 23, wherein the method is selected from a group.   25. Robust parallel determination of compound toxicity in test organisms Using the technique of signature sequencing of   Administering the compound to a test organism;   Extracting a group of mRNA molecules from each of one or more tissues of the test organism. And forming a group of cDNA molecules for each from the one or more tissues;   Different oligonucleotides attached to substantially all different cDNA molecules in separate groups Separately sampling each group of cDNA molecules to have leotide;   Forming a frequency distribution of the expressed genes for each of the one or more tissues In order to use robust parallel signature sequencing, each separate group of cDNA molecules Determining a partial nucleotide sequence of each; and   Transforming the frequency distribution of the expressed genes in each of the one or more tissues Correlating the toxicity of the compound, Use, including. 26. 26. The use according to claim 25, wherein said test organism is a mammalian tissue culture. 27. 27. The use according to claim 26, wherein said mammalian tissue culture comprises hepatocytes.   28. The test organism is a rat, mouse, hamster, guinea pig, rabbit An animal selected from the group consisting of, cats, dogs, pigs, and monkeys. 2 Use according to 5.   29. The one or more tissues may be liver, kidney, brain, cardiovascular, thyroid, spleen, Consists of kidney, large intestine, small intestine, pancreas, bladder, stomach, ovary, testis, and mesenteric lymph glands 29. Use according to claim 28 selected from the group.   30. Differentially expressed in the test organism after treatment with the compound, and Robust parallel signature sequencing to identify genes associated with toxicity A use of the technique, wherein the use comprises:   Administering the compound to the test organism;   Extracting a group of mRNA molecules from the selected tissue of the test organism to form a group of cDNA molecules Forming step;   Tight parallel signature sequences to create a frequency distribution of expressed genes Using the determination to determine the nucleotide sequence of a portion of each of the cDNA molecules. About;   Controlling the frequency distribution of the expressed genes of the selected tissue of the test organism. By comparing the frequency distribution of expressed genes in selected tissues of the rolled organism Identifying a gene that is expressed in response to administering the compound; And   The gene expressed in response to administering the compound is expressed in the test organism. Determining whether it is correlated with the toxicity of the compound, Use, including.
JP51524097A 1996-10-11 1996-10-11 Measurement of gene expression profiles in toxicity determination Expired - Lifetime JP4105764B2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1996/016342 WO1997013877A1 (en) 1995-10-12 1996-10-11 Measurement of gene expression profiles in toxicity determination

Publications (3)

Publication Number Publication Date
JP2000511045A true JP2000511045A (en) 2000-08-29
JP2000511045A5 JP2000511045A5 (en) 2004-10-07
JP4105764B2 JP4105764B2 (en) 2008-06-25

Family

ID=22255943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51524097A Expired - Lifetime JP4105764B2 (en) 1996-10-11 1996-10-11 Measurement of gene expression profiles in toxicity determination

Country Status (2)

Country Link
EP (1) EP0931165A4 (en)
JP (1) JP4105764B2 (en)

Also Published As

Publication number Publication date
EP0931165A4 (en) 2001-08-22
EP0931165A1 (en) 1999-07-28
JP4105764B2 (en) 2008-06-25

Similar Documents

Publication Publication Date Title
US6228589B1 (en) Measurement of gene expression profiles in toxicity determination
WO1997013877A1 (en) Measurement of gene expression profiles in toxicity determination
JP4293634B2 (en) Oligonucleotide tags for classification and identification
US6060240A (en) Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
JP4712822B2 (en) Molecular tagging system
US20200370105A1 (en) Methods for performing spatial profiling of biological molecules
US5763175A (en) Simultaneous sequencing of tagged polynucleotides
US7022479B2 (en) Sensitive, multiplexed diagnostic assays for protein analysis
AU783689B2 (en) Sensitive, multiplexed diagnostic assays for protein analysis
US20020172965A1 (en) Methods for measuring relative amounts of nucleic acids in a complex mixture and retrieval of specific sequences therefrom
EP1021563A2 (en) Collections of uniquely tagged molecules
JP2007502116A (en) Methods and kits for preparing nucleic acid samples
EP1127161B1 (en) Method for making complementary oligonucleotide tag sets
JP4105764B2 (en) Measurement of gene expression profiles in toxicity determination
US20220025430A1 (en) Sequence based imaging
JP3103806B1 (en) Nucleic acid detection method
EP0840803B1 (en) Simultaneous sequencing of tagged polynucleotides
JP4789294B2 (en) DNA extension and analysis using rolling primers
US20040121331A1 (en) Methods of amplifying signals in multiplexed protein analysis
CN114921533A (en) Methods and adaptors for characterising a target polynucleotide

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070424

A72 Notification of change in name of applicant

Free format text: JAPANESE INTERMEDIATE CODE: A721

Effective date: 20070719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20071212

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080128

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080328

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110404

Year of fee payment: 3

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080328

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080328

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120404

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130404

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140404

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term