JP2001505780A - Quick gap closure method - Google Patents

Quick gap closure method

Info

Publication number
JP2001505780A
JP2001505780A JP52692898A JP52692898A JP2001505780A JP 2001505780 A JP2001505780 A JP 2001505780A JP 52692898 A JP52692898 A JP 52692898A JP 52692898 A JP52692898 A JP 52692898A JP 2001505780 A JP2001505780 A JP 2001505780A
Authority
JP
Japan
Prior art keywords
sequence
sequences
library
overlapping ends
spanning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP52692898A
Other languages
Japanese (ja)
Inventor
ムーニー,ジェフリー・エル
ドゥブーク,クリスティーヌ・マリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SmithKline Beecham Corp
Original Assignee
SmithKline Beecham Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SmithKline Beecham Corp filed Critical SmithKline Beecham Corp
Publication of JP2001505780A publication Critical patent/JP2001505780A/en
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation

Abstract

(57)【要約】 選択した生物の単離したDNAから調製した一連のランダムゲノムライブラリー由来の高密度グリッドを用いる生物のギャップ閉鎖および隣接配列アセンブリーの方法が提供される。   (57) [Summary] Methods for gap closing and flanking sequence assembly of organisms using high density grids from a series of random genomic libraries prepared from isolated DNA of selected organisms are provided.

Description

【発明の詳細な説明】 迅速なギャップ閉鎖法 関連する出願 本出願は、1996年12月12日出願の米国仮出願60/032,555の 権利を主張する。 発明の分野 本発明は、ゲノムライブラリーの高密度アレイまたはグリッドの使用による全 ゲノムランダム塩基配列決定の際に生じるギャップの閉鎖のための、簡単で、コ スト的に有効な方法に関する。該方法は、部分遺伝子配列から得られた全長ゲノ ム配列の迅速な単離にも有用である。それゆえ、かかるゲノム配列は、全長コー ディング領域を含む。本発明の方法はコンピューター作成アセンブリーの確認に も有用である。すなわち、隣接配列の順序またはアセンブリーの確認に有用であ る。本方法は、染色体歩行に代わる方法を提供する。 発明の背景 DNA塩基配列決定技術およびコンピューター方法論における進歩は、ゲノム 塩基配列決定プロジェクトが進行可能な速度を抜本的に変化させた。特に、Flei schmannら(Science,1995,269:496-512)は、全ゲノムランダム塩基配列決定およ び完全な生物のアセンブリーを、わずか数ヶ月で行えることを示している。この ランダム「ショットガン」アプローチの方法は、配列決定したライブラリーの挿 入サイズ、生物のゲノムサイズ、配列決定したクローン数および配列決定した塩 基の全数に基づいてアセンブルさせた隣接配列間の若干数の配列ギャップを予想 する。これらのギャップは、ランダム塩基配列決定により同定されていない遺伝 子内または遺伝子間領域に対応する(例えば、E.S.Lander and M.S.Waterman,” Genomicmapping by fingerprinting random clones: a mathematical analysis ”,Genomics, (1988),2:231-239を参照のこと)。隣接配列の整列およびギャップ閉鎖の完了は 、典型的には、物理的なギャップ末端のすべての組み合わせを意図とするプライ マーに基づくゲノムPCRにより行われる。しかしながら、この方法は、非常に 時間を消費し、労力がかかり、ランダム塩基配列決定そのものよりも5〜10倍 もの長い時間がかかりうる。 したがって、生物の全ゲノムランダム塩基配列決定において、隣接配列を整列 し、ギャップ閉鎖を完了するためのより効率的な方法が必要とされている。 発明の要約 一態様において、本発明は、ゲノムライブラリーの高密度グリッドを用いる、 ゲノム塩基配列決定プロジェクトにおける、高処理塩基配列決定およびギャップ 閉鎖および隣接配列アセンブリーまたはクローン整列のための方法を提供する。 該方法は、選択した生物について一連のランダムゲノムライブラリーを構築する こと、および、各ライブラリーにっいてのグリッドを調製することを含み、各グ リッドは、その表面の所定の領域に、ライブラリー由来の複数のクローンを固定 する、一の表面を有する。このギャップ閉鎖により、最初のランダム配列決定工 程において見られなかった部分遺伝子または遺伝子に関する完全な配列が得られ る。部分遺伝子配列の隣接配列をアセンブリーした後、公知の配列の非−重複末 端に対応するハイブリダイゼーションプローブを作成する。ついで、プローブを グリッド化したライブラリーにハイブリダイズさせ、アセンブルしたヌクレオチ ド配列の非−重複末端に及ぶヌクレオチド配列を同定する。 本発明の他の目的、特徴、利点および態様は、以下の記載から当業者に明らか となるであろう。しかしながら、以下の記載および特定の実施例は、本発明の好 ましい具体例を示しているが、単に例示としてあげられていることを理解すべき である。開示された発明の精神および範囲内で、種々の変形および修飾が、以下 の記載を読むことから、および、本開示の他の部分を読むことから、当業者に容 易に理解されるであろう。 発明の詳説 遺伝子の同定、塩基配列決定および解析は、現在の科学研究の主な目標である 。遺伝予を同定すること、その配列を決定すること、および、その生化学的機能 を解析することにより、組換え技術を適用して、価値のある遺伝子産物、例えば 、タンパク質およびペプチドを大量に製造することが可能である。さらに、遺伝 子配列の知識は、選択された遺伝子の不適当な発現および/または抑制により、 または外部因子、例えば、発癌物質もしくは催奇物質の遺伝子機能に対する影響 により特徴付けられる植物および動物における種々の病態の診断、予測および治 療に対するカギを提供できる。 現在、全ランダム塩基配列決定および完全な生物のアセンブリーのための方法 が存在する。しかしながら、ゲノム配列ギャップ閉鎖および隣接配列の整列を完 了するために必要な方法は、時間を消費し、労力を要する。 本発明は、全ゲノムランダム塩基配列決定において有用な、高処理ギャップ閉 鎖および隣接配列アセンブリーのための方法を提供する。本発明は、選択した生 物のゲノムライブラリーから調製した複数の高密度グリッドを用い、配列反応、 ギャップ閉鎖および隣接配列アセンブリーを行う。本発明の方法は、生物の全ゲ ノムを塩基配列決定するための、より迅速でコスト的に有効な手段を提供する。 該方法はまた、部分配列のみがランダム配列決定により得られる遺伝子の全長ゲ ノム配列を得るための迅速な手段もまた提供する。 I.定義 本明細書において用いるいくつかの単語およびフレーズを以下のように定義す る: 本明細書において用いる「遺伝子」なる用語は、cDNA配列が由来するゲノ ムヌクレオチド配列を意味する。遺伝子なる用語は、古典的には、プロセシング 時に、例えばスプライシングにより異なるcDNAを産生できるゲノム配列を意 味する。しかしながら、理解を簡単にするため、全長対応cDNA配列のいずれ をも本明細書において簡略して遺伝子と称する。 「単離された」とは、「ヒトの手により」、その天然の状態から変えられるこ と、すなわち、天然物の場合、その本来的な環境から変化または除去あるいは両 方されたことを意味する。例えば、生体に天然に存在するポリヌクレオチドまた はポリペプチドは「単離された」ものではないが、その天然状態で共存する物質 から分離された同じポリヌクレオチドまたはポリペプチドは、本明細書で用いる 用語としての「単離された」ものである。例えば、ポリヌクレオチドに関して、 単離されたなる用語は、天然の染色体および細胞から分離されていることを意味 する。 「生物」なる用語は、限定するものではないが、細菌(グラム陰性およびグラ ム陽性の両方を含む)、ウイルス、低級真核細胞(真菌、酵母および糸状菌など) 、単多細胞生物(粘菌類など)およびヒトを含む複合多細胞生物などのいずれの 生存生物をも包含することを意味する。 本明細書において用いる「固形支持体」なる用語は、ゲノムライブラリー由来 の複数の限定された材料をいずれか利用可能な方法により固定化し、固体化ポリ ヌクレオチド配列と試料中の他のポリヌクレオチドとのハイブリダイゼーション を検出可能とするのに有用な、いずれか公知の基体を意味する。多くの利用可能 な固形支持体のうち、望ましい例の1つが、1991年5月30日公開の国際特 許出願番号WO91/07087に記載される支持体である。他の有用な支持体 の例には、限定するものではないが、ニトロセルロース、ナイロン、ガラス、シ リカおよびPall BIODYNECが包含される。慣用の固形支持体にさらになされる改 良が、本発明において適用されてもよい。 「グリッド」なる用語は、ゲノムライブラリーの限定された材料を固着するか 固定化する固形支持体上についての2次元構造物を意味する。 本明細書において用いる「所定の領域」なる用語は、特定のクローンの1つま たは複数のコピーがその上に固定化され、そのクローンの試料ヌクレオチドに対 するハイブリダイゼーションが起こる場合にその位置においてそのクローンのハ イブリダイゼーションを可能とする、固形支持体の表面上の局在化領域を意味す る。 「固定化」は、固形支持体への遺伝子の固着を意味する。固定化の手段は当業 者に公知で慣用であり、用いる支持体の種類に依存する。 II.本発明の組生物 本発明は、ゲノム塩基配列決定における全長ゲノム配列および隣接配列アセン ブリーを含め、高処理ギャップ閉鎖の手段としてのゲノムライグラリーの高密度 アレイの使用に基づく。 A.ゲノムライブラリーの調製 この解析のため、選択した生物についての一連のランダムゲノムライブラリー を調製する。各ライブラリーは選択された一連のインサートの大きさの、分画さ れ、連結されたゲノムDNAを含む。これらのライブラリーを構築するため、Sa mbrook et al.,MOLECULAR CLONING,A LABORATORY MANUAL,2nd Ed.;Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York,1989に開示される ような分子生物学で標準的な方法を用いて、選択した生物由来のゲノムDNAを はじめに単離する。ついで、Fleischmann et al.Science,1995,269:496-512 に記載される方法にしたがって、単離されたDNAをランダムにせん断し(例え ば、超音波処理、部分制限酵素消化、部分DNAase消化などにより)、修飾 し、プラスミドまたはファージベクター中に連結する。 例えば、一具体例において、インサートの平均的大きさが1.0および5.0 kbの間であるように、ゲノムDNAを分画し、プラスミドまたはファージベー スのベクター中に連結することにより小さなインサートライブラリーを調製する 。この小さなインサートライブラリーを構築するのに有用なプラスミドベクター の例には、限定するものではないが、pBLuescript、Lambda ZAPII(Stratagene, LaJolla,CA)、pUC19およびM13mp18/19(New England BIOLABS,Beverly,MA)が包 含される。 この具体例において、インサートの大きさが平均10および100kbの間に なるように、大きなインサートライブラリーをまたコスミドベクターにて構築す る。この大きなインサートライブラリーを構築するのに有用なコスミドベクター の例には、限定するものではないが、pLorist、pWEIS(Statagene,La Jolla,CA )、lambda DASH2(Statagene)およびlambda GEM-12(Promega,Madison,WI)が包含される。 加えて、平均して約5.0〜10kbの一連のインサートの大きさの中程度のイ ンサートライブラリーもまた、コスミドベクター中にゲノムDNAを分画するこ とにより調製できる。 各ライブラリーに関する最終的なトランスフオーマントの数が、Lander-Water man理論(E.S.Lander and M.S.Waterman,Genomics,(1988),2:231-239)により 推定される数の4〜6倍の適用範囲に達するように、最終連結産物をイー.コリ( E.coli)などの細菌にエレクトロポレーションする。トランスフォーマントをマ イクロタイタープレート中に置き、特定の細菌について通常であると認識される 標準的なインビトロ培養条件下で一晩生育させる。複製プレートを作成し、配列 決定用のグリッディングまたは鋳型製造に用いる。 B.グリッドの調製 インサートライブラリーのそれぞれを、高密度アレイ内の所定の位置に置かれ ている、各トランスフォーマント宿主細胞(インサートを含み、PCRにより増 幅される)またはクローンの核酸とともに、固体支持体上にグリッドする。 種々の固形支持体の表面にクローンを固定化するのに、多くの慣用の方法を用 いる。例えば、Affinity Techniques,Enzyme Purification:Part P,Methods in Enzymology,Vol.34,ed.W.B.Jakoby,M.Wilcheck,Acad.Press,NY(1971 );Immobilized Biochemicals and Affinity Chromatography,Advances inExper imental Medicine and Biology,Vol.42,ed.R.Dunlap,Plenum Press,NY(1 974);米国特許第4,762,881号;米国特許第4,542,102号;欧州特許公開第391,60 8号(1990年10月10日);または米国特許第No.4,992,127号(1989年 11月21日)などを参照のこと。 クローンを固形支持体に固着するのに望ましい一方法は、国際出願番号PCT/US 90/06607号(1991年3月30日公開)に記載される。簡単に言えば、この方 法は、固形支持体の表面上に、クローンの固定化能を有する所定の領域を形成す ることを包含する。この方法は、所定の領域の選択的活性化を可能とする表面に 固着した結合基体の使用を形成する。活性化すると、これらの結合基体は、ゲ ノムライブラリー由来のクローンと結合し固定化能を有するようになる。 ハイブリダイゼーションのためのその表面上の所定の領域にてヌクレオチド配 列を結合するのに適したいずれか公知の固形基体およびそれにヌクレオチド配列 を固着させるための方法は、本発明に係る分野の当業者であれば用いることがで きる。同様に、固定化クローンのハイブリダイゼーションを検出可能とするため の公知の慣用の方法、たとえば、蛍光、放射活性、光活性化、エネルギー移動色 素、ビオチニル化、固相状態回路形成などを本発明において用いてもよい。 III.本発明の方法 本発明は、ギャップ閉鎖、その後のコンピューター作成アセンブリーの確立の ための高処理塩基配列決定のための方法、および、全長コーディング配列を作成 するための方法において、上記した組成物を使用する。 A.高処理塩基配列決定 本発明において、小さなインサートライブラリーを高処理塩基配列決定に用い ることができる。好ましい具体例においては、標準的な塩基配列決定法により得 られる範囲の2〜3倍の適用範囲まで、塩基配列決定反応を行う(例えば、Flei schmann et al.(Science,(1995),269:p.496)を参照のこと)。得られた配列を、 Genetics Computer Group,Inc.of Madison,WI(UWGCG)から利用可能なGELMERGE A ssemblerなどの標準的なコンピュータープログラムを用いて、アセンブルする。 該Assemblerは、アヤンブリー間の非−重複領域、またはギャップを同定する。 これらのギャップは、不完全なサンプリングおよびライブラリー由来クローンの 欠失による配列フラグメントの集合における非−ランダム性の統計学的な結果に より生じる。 B.1 ギャップ閉鎖 ギャップ閉鎖の一具体例において、プライマー対をそれぞれアセンブルした隣 接配列の非−重複末端から調製し、選択した生物から単離した全ゲノムDNAに 対する個々のPCR反応に用いる。3つのタイプのプローブをアセンブルした配 列の公知の非−重複末端から調製できる:(1)アセンブルした配列の末端を含 む クローンを標識できる(すなわち、クローンを直接プローブとして使用できる) ;(2)PCRフラグメントをアセンブルした配列の末端由来のプライマー対を 用いて増幅できる;および(3)アセンブルした配列の末端由来のオリゴヌクレ オチドをハイブリダイゼーションプローブとして用いることができる。これらの 反応の産物を好ましくは放射性同位体または蛍光標識で直接的に標識化し、グリ ッドしたライブラリーに対する別々のハイブリダイゼーション反応において、プ ローブとして用いる。 B.2 全長コーディング領域を含むクローンの単利 隣接する配列を、積極的にハイブリダイズするプローブにより同定し、配列分 析およびコンピューターアセンブリーにより確認する。加えて、2つの別々のギ ャップ末端からのプローブが同じグリッドしたクローンにハイブリダイズする場 合、ギャップに及ぶ領域はすぐに同定される。プライマー歩行を、全体のクロー ンが終了するまで、または、ギャップが閉じるまで行う。新たなプローブおよび ハイブリダイゼーションを必要に応じ行う。 C.隣接配列アセンブリーまたは整列 この開示を読む際に当業者により認識されるように、配列したクローンを塩基 配列決定の前に大体の順序に置くことができる。例えば、一具体例において、1 00kbのコスミドインサートを小さなインサートライブラリーに対してハイブ リダイズし、塩基配列決定の前に隣接クローンを同定できる。クローンのより正 確な整列を、切断部位の少ない酵素(イー.コリのNotI、PacI、Spe Iなど、しかしながら、生物の塩基組成により変化する。好ましくは、該酵素は 10〜100kb毎に一度切断する。)でのゲノムDNAの消化、またはより頻 繁に切断する酵素(好ましくは10〜100kb毎に一度切断する。)での部分消 化、パルスフィールドゲル電気泳動による消化により得られた大きなDNAフラ グメントの分離および単離、単離したフラグメントのグリッドに対するハイブリ ダイゼーションにより行う。 D.本発明の他の方法 本開示を読む際に当業者に明らかなように、本発明の組成物および方法は、他 の類似するプロセスにも用いてもよい。例えば、一具体例において、大きなイン サートライブラリーの第一通過塩基配列決定を、コスミドベクター配列に対する 普遍的なフォワードおよびリバースプライマーの両方を用いて行う。m13配列 などに対するプライマーなどの普遍的なプライマーは、当該分野で周知である。 少ない数の配列決定を開始し、GELMERGE Assemblerなどの標準的なコンピュータ ーアプローチを用いて隣接配列中にこれらの大きなインサートクローンを配列す る。ヌクレオチドデータの他のコンピュータ−アシストアセンブリーは、当該分 野で公知である。例えば、”Automated DNA Sequencing and Ana1ysis”,Adams et al.eds., Academic Press(1995),(E.W.Myers presents a discussion of s oftware systems for fragment assembly in Chapter 32);およびJ.D.Kececiog lu et al.,”Combinatorial Algorithms for DNA Sequence Assembly”,Algori thmica,13:7-51(1995))を参照のこと。ついで、適当なクローン(すなわち、他 のものと重複しないもの)を小さなインサートライブラリーグリッドに対するプ ローブとして用いるために選択できる。同定したクローンを普遍的プライマーを 用いて塩基配列決定し、配列データをアセンブルする。この具体例において、大 きなインサートライブラリーにおける第2の歩行についてプライマーを設計し、 構築するための経費および時間を排除する。 以下の限定するものではない実施例により、本発明をさらに説明する。 実施例 実施例1: スタフィロコッカス・アウレウスのゲノムライブラリーをベクター、ラムダZ APIIにて構築した。このライブラリーのインサートの平均的な大きさは約5k bである。一次配列分析を普遍的フォワードおよびリバースプライマーを用いて このライブラリー由来の約10000個のクローンに対して行った。ついでアン ノテーティング(annotating)およびグループ化のプレプロセッシング工程を最終 アセンブリーの前に行う以外、機能的にGELMERGE Assemblerに類似するアセンブ リーを用いて、誘導DNA配列をアセンブルした。 アンノテーティングは、2つの非類似の配列を類似するとみなすか、さもなけ ればグループ化またはアセンブリー工程において誤った結果をもたらすかもしれ ない、部分遺伝子配列および推定遺伝子アセンブリーの領域を同定する方法であ る。これらの領域は本発明の方法のその後のグループ化およびアセンブリー工程 の正確性を妨げるようである。残りの同定されていない領域は、(グループ化お よびアセンブリーの目的のための)有用な情報を含んでいると考えられ、その後 のグループ化およびアセンブリー工程に用いられる。その後の工程を妨げる可能 性があると同定される領域はこれらの工程において無視する。 例えば、アンノテーティング工程にて同定できる領域は、目的とする種以外の 種類由来の配列ならびにリボソームおよびミトコンドリアなどの細胞構造由来の 核酸またはDNAである。ポリヌクレオチドラン、単純縦列反復配列(STR)お よびゲノム反復配列、ALUなどの配列において複数回起こる低情報領域を同定 することができる。さらに、あいまいな領域および実験的エラーまたは人為的に 生じる領域もまた同定できる。 アンノテーティングした後、アンノテーティングした部分遺伝子配列を他のア ンノテーティングした部分遺伝子配列とグループ化する。アンノテーティングし た部分遺伝子配列をグループ化する工程は、アンノテーティングした部分遺伝子 配列と他に存在するアンノテーティングした部分遺伝子配列の間の結合関係に基 づくものであって、その他の存在するアンノテーティングした部分遺伝子配列の いくつかは前に同定した推定遺伝子アセンブリーの構成成分であってもよい。こ の工程は部分遺伝子配列からのアンノテーティング領域および前に同定した推定 遺伝子アセンブリーを無視することで開始する。ついで、アンノテーティングし た領域を無視して部分遺伝子配列を、アンノテーティングした領域を無視して前 に同定した推定遺伝子アセンブリーのコンセンサス配列と比較する。次に部分遺 伝子配列をアンノテーティングした領域を無視して相互に比較する。該部分遺伝 子配列をこれら比較にて判別される類似性に基づいてグループを定める。こうし て得られたグループは、互いに属すると思われる部分遺伝子配列の集合体を含み 、すなわち、グループ化工程は一緒になってアセンブルすると思われる部分遺伝 子 配列のグループを形成する。 前工程の各グループについて、相互に関連する部分遺伝子配列の位置的整列は 、すべての部分遺伝子配列が同じ推定遺伝子アセンブリーに属するとの仮定に基 づき一のグループとして行う。その整列の結果の一は1以上の推定遺伝子アセン ブリーがもたらすものであってもよく、その整列工程が部分遺伝子配列のグルー プの間の不一致を暴露するものであってもよい。 一度位置的整列が各推定遺伝子アセンブリーについて完了したら、隣接配列を 当業者に公知の種々のコンティグアセンブリーにより作成する。例えば、GELMER GE(UWGCG,Madison,WI)である。 アンノテーティング、グループ化、およびアセンブリー工程が終了したら、推 定遺伝子アセンブリーをデータベース中に保存する。推定遺伝子アセンブリーを 、その配列、構造、生物化学的機能または他の関連する特徴に基づいて解析して もよい。一度分類すると、データベースをその潜在的な生物化学的機能、構造ま たはその他の特徴に関する推定遺伝子アセンブリーに関連する情報に展開できる 。 例えば、推定遺伝子アセンブリーを解析する一方法は、他の公知の遺伝子への ホモロジーによる。公知の遺伝子との推定遺伝子アセンブリーの共有ホモロジー は、類似する生物化学的役割または機能を示唆してもよい。 推定遺伝子アセンブリーを解析する他の典型的な方法は、公知の配列モチーム に基づく。特定の配列パターンが、シグナル配列、膜貫通ドメイン、SH2ドメ インなどの特定の生物化学的特性を有するタンパク質領域をコードすることが知 られている。 アセンブリープロセス後、非−重複隣接配列末端を同定した。このライブラリ ーからの対応する数の配列決定したクローンを固形支持体の所定の位置にグリッ ドし、高密度アレイを調製した。 2つのクローン、2AU2142および2AU0165は、隣接配列末端にあ る非−重複配列を含むことが観察された。PCRプライマーをこれらの非−重複 隣接配列末端のそれぞれについて250bpフラグメントを増幅するように設計 し、スタフィロコッカス・アウレウスのゲノムDNAに対して別々のPCR反応 に用いた。PCR産物を精製し、放射標識し、高密度グリッドに対して別々のハ イブリダイゼーション反応に用いた。クローン2AU2142についてのPCR フラグメントは、3つのクローンに対してハイブリダイズすることが見出された 。制限酵素消化分析により、これらの3つのクローンが重複配列を有することが 示された。配列分析によりこの結果が確認され、さらに、隣接配列の末端から伸 びるさらに450bpが示された。フラグメント由来の2AU0165は、2つ のクローンに対してハイブリダイズすることが示された。制限フラグメントおよ び配列分析はまた、これらのクローンの重複する性質を確認した。 本発明の範囲または精神から逸脱することなく、部分遺伝子配列を分析するた めの本発明の方法に種々の修飾を行い得ることは、当業者に明らかであろう。DETAILED DESCRIPTION OF THE INVENTION                           Quick gap closure method Related applications   This application is related to US Provisional Application No. 60 / 032,555, filed December 12, 1996. Claim your rights. Field of the invention   The present invention provides for the use of high density arrays or grids of genomic libraries A simple, cost-effective method for closing gaps that occur during genome random sequencing. It is a method that is effective in terms of cost. The method uses a full-length genome obtained from a partial gene sequence. It is also useful for rapid isolation of sequence sequences. Therefore, such a genomic sequence is Including the coding region. The method of the invention can be used to validate computer-generated assemblies. Is also useful. That is, it is useful for confirming the order or assembly of adjacent sequences. You. The method provides an alternative to chromosome walking. Background of the Invention   Advances in DNA sequencing technology and computer methodology are The speed at which a sequencing project could proceed was drastically changed. In particular, Flei schmann et al. (Science, 1995, 269: 496-512) describe whole-genome random sequencing and It shows that complete and complete organism assembly can be done in just a few months. this The random “shotgun” approach involves inserting a sequenced library. Input size, organism genome size, number of clones sequenced and salt sequenced Predict some sequence gaps between assembled sequences based on total number of groups I do. These gaps represent genetic gaps not identified by random sequencing. Corresponding to the intra- or intergenic region (eg, E.S.Lander and M.S.Waterman, " Genomicmapping by fingerprinting random clones: a mathematical analysis ”, Genomics, (1988), 2: 231-239). Alignment of adjacent sequences and completion of gap closure Typically, primers intended for all combinations of physical gap ends Performed by mer-based genomic PCR. However, this method is very Time consuming, labor intensive, 5-10 times more than random sequencing It can take a long time.   Therefore, adjacent sequences are aligned in random sequencing of the whole genome of an organism. There is a need for a more efficient way to complete gap closure. Summary of the Invention   In one aspect, the invention uses a high density grid of a genomic library, High-throughput sequencing and gaps in genome sequencing projects Methods for closed and flanking sequence assembly or clone alignment are provided. The method constructs a series of random genomic libraries for the selected organism And preparing a grid for each library, Lid immobilizes multiple clones from the library in a given area on its surface Have one surface. With this gap closure, the first random sequencing The complete sequence of the partial gene or gene not found in You. After assembling the flanking sequences of the partial gene sequence, the non-overlapping A hybridization probe corresponding to the end is prepared. Then, remove the probe Nucleotide hybridized to gridded library and assembled The nucleotide sequence spanning the non-overlapping ends of the nucleotide sequence is identified.   Other objects, features, advantages and aspects of the present invention will be apparent to those skilled in the art from the following description. It will be. However, the following description and specific examples will be helpful in understanding the present invention. Although a specific example is shown, it should be understood that the example is merely given as an example. It is. Within the spirit and scope of the disclosed invention, various changes and modifications may be made From reading the description of, and from reading other parts of the disclosure, It will be easily understood. Detailed description of the invention   Gene identification, sequencing and analysis are major goals of current scientific research . Identifying genetic sequences, determining their sequences, and their biochemical functions By applying recombinant technology, valuable gene products, such as , Proteins and peptides can be produced in large quantities. In addition, genetic Knowledge of the offspring sequence can be attributed to inappropriate expression and / or repression of the selected gene. Or the effects of external factors, such as carcinogens or teratogens, on gene function Diagnosis, prediction and cure of various disease states in plants and animals characterized by Can provide the key to treatment.   Currently, a method for whole random sequencing and assembly of complete organisms Exists. However, genomic sequence gap closure and flanking sequence alignments are not complete. The method required to complete is time consuming and labor intensive.   The present invention provides a high throughput gap closure useful in whole genome random sequencing. Methods are provided for strand and flanking sequence assembly. The present invention provides Sequence reactions, using multiple high-density grids prepared from genomic libraries Perform gap closure and flanking sequence assembly. The method of the present invention It provides a faster and more cost-effective means for sequencing nom. The method also provides for the full-length gene of a gene in which only a partial sequence is obtained by random sequencing. It also provides a quick means to obtain nome sequences. I. Definition   Some words and phrases used in this specification are defined as follows. RU:   As used herein, the term “gene” refers to the genome from which the cDNA sequence is derived. Nucleotide sequence. The term gene is, classically, processing Sometimes it refers to a genomic sequence that can produce different cDNAs, for example, by splicing. To taste. However, for the sake of simplicity, some of the full-length Is also referred to simply as a gene in this specification.   "Isolated" is defined as being changed "by the hand of man" from its natural state. That is, in the case of a natural product, it is changed or removed from its natural environment or both. Meaning that For example, a polynucleotide naturally occurring in a living organism or Is a substance that is not "isolated" but coexists in its natural state As used herein, the same polynucleotide or polypeptide separated from The term is "isolated". For example, for a polynucleotide, The term isolated means isolated from natural chromosomes and cells I do.   The term “organism” includes, but is not limited to, bacteria (gram negative and Virus, lower eukaryotic cells (e.g., fungi, yeast and filamentous fungi) , Single multicellular organisms (such as slime molds) and complex multicellular organisms including humans It is meant to include living organisms.   As used herein, the term “solid support” is derived from a genomic library. Immobilized by any available method, the solidified poly Hybridization of nucleotide sequence with other polynucleotides in sample Means any known substrate that is useful for making Many available One of the preferred solid supports is the International Patent Publication published May 30, 1991. A support described in Patent Application No. WO91 / 07087. Other useful supports Examples of, but not limited to, nitrocellulose, nylon, glass, silicone Rica and Pall BIODYNEC are included. Further modifications to conventional solid supports Good may be applied in the present invention.   The term "grid" refers to the anchoring of limited material in a genomic library It means a two-dimensional structure on the solid support to be immobilized.   As used herein, the term “predetermined region” refers to one or more specific clones. Or multiple copies are immobilized thereon and correspond to the sample nucleotides of the clone. When hybridization occurs, the clone Means a localized area on the surface of the solid support that allows hybridization You.   "Immobilized" refers to the anchoring of a gene to a solid support. The means of immobilization is our business Are known and customary to the individual and depend on the type of support used. II. Organism of the present invention   The present invention relates to a full-length genomic sequence and adjacent sequence assembly in genome sequencing. Genome ligature densification as a means of high-throughput gap closure, including brie Based on array usage.   A. Preparation of genomic library   For this analysis, a series of random genomic libraries for selected organisms Is prepared. Each library is a fraction of the size of the selected set of inserts. And ligated genomic DNA. To build these libraries, Sa mbrook et al., MOLECULAR CLONING, A LABORATORY MANUAL, 2nd Ed .; Cold Spring  Harbor Laboratory Press, Cold Spring Harbor, New York, 1989 Genomic DNA from the selected organism is obtained using standard methods in such molecular biology. First isolate. Then, Fleischmann et al. Science, 1995, 269: 496-512 The isolated DNA is randomly sheared according to the method described in (For example, by sonication, partial restriction enzyme digestion, partial DNAase digestion, etc.), modification And ligated into a plasmid or phage vector.   For example, in one embodiment, the average size of the insert is 1.0 and 5.0. The genomic DNA is fractionated to be between kb and A small insert library by ligation into a vector . A plasmid vector useful for constructing this small insert library Examples of, but not limited to, pBLuescript, Lambda ZAPII (Stratagene, LaJolla, CA), pUC19 and M13mp18 / 19 (New England BIOLABS, Beverly, MA) Included.   In this embodiment, the insert size is between 10 and 100 kb on average. Large insert libraries are also constructed with cosmid vectors. You. Cosmid vectors useful for constructing this large insert library Examples of, but not limited to, pLorist, pWEIS (Statagene, La Jolla, CA ), Lambda DASH2 (Statagene) and lambda GEM-12 (Promega, Madison, WI) are included. In addition, a medium series of inserts averaging about 5.0-10 kb in size. Insert libraries can also be used to fractionate genomic DNA into cosmid vectors. And can be prepared by   The final number of transformants for each library is Lander-Water According to the man theory (E.S.Lander and M.S.Waterman, Genomics, (1988), 2: 231-239) The final ligation product is transformed into E. coli (4-6 times the estimated number of coverages). Electroporate bacteria such as E. coli. Transformants Placed in microtiter plate and recognized as normal for certain bacteria Grow overnight under standard in vitro culture conditions. Create duplicate plates and arrange Used for gridding or mold making for determination.   B. Preparation of grid   Place each of the insert libraries in place in the high-density array. Each transformant host cell (including inserts, increased by PCR) ) Or with the nucleic acids of the clones on a solid support.   Many conventional methods are used to immobilize clones on the surface of various solid supports. I have. For example, Affinity Techniques, Enzyme Purification: Part P, Methods in Enzymology, Vol. 34, ed. W. B. Jakoby, M .; Wilcheck, Acad. Press, NY (1971 ); Immobilized Biochemicals and Affinity Chromatography, Advances inExper Imental Medicine and Biology, Vol. 42, ed. R. Dunlap, Plenum Press, NY (1 974); U.S. Pat. No. 4,762,881; U.S. Pat. No. 4,542,102; EP 391,60. No. 8 (October 10, 1990); or US Pat. No. 4,992,127 (1989 November 21).   One desirable method for anchoring clones to a solid support is described in International Application No.PCT / US 90/06607 (published March 30, 1991). Simply put, this one The method comprises forming a predetermined region capable of immobilizing clones on the surface of a solid support. It includes. This method applies to surfaces that allow selective activation of a given area. The use of a bonded substrate is formed. Upon activation, these binding substrates are It binds to clones derived from the nome library and has immobilization ability.   Nucleotide alignment at predetermined regions on its surface for hybridization. Any known solid substrate suitable for binding a sequence and its nucleotide sequence The method for fixing the can be used by those skilled in the art according to the present invention. Wear. Similarly, to enable detection of hybridization of immobilized clones Known methods such as fluorescence, radioactivity, photoactivation, energy transfer colors Elemental, biotinylation, solid state circuit formation, and the like may be used in the present invention. III. The method of the present invention   The present invention relates to the closure of a gap and subsequent establishment of a computer-generated assembly. For high-throughput sequencing and full-length coding sequences In one embodiment, the composition described above is used.   A. High-throughput sequencing   In the present invention, a small insert library is used for high-throughput nucleotide sequencing. Can be In a preferred embodiment, it is obtained by standard sequencing. The base sequencing reaction is performed up to the application range of 2 to 3 times the range (for example, Flei schmann et al. (See Science, (1995), 269: p.496). The resulting sequence is GELMERGE A available from Genetics Computer Group, Inc. of Madison, WI (UWGCG) Assemble using a standard computer program such as ssembler. The Assembler identifies non-overlapping regions, or gaps, between the yangmburi. These gaps account for incomplete sampling and library-derived clones. The statistical consequences of non-randomness in the collection of sequence fragments due to deletion Arises.   B. 1 Gap closure   In one embodiment of gap closure, the primer pairs are assembled next to each other. Prepared from the non-overlapping ends of the tangent sequence and added to the total genomic DNA isolated from the selected organism For each individual PCR reaction. Assembled three types of probes Can be prepared from known non-overlapping ends of a sequence: (1) including the ends of the assembled sequence M Clones can be labeled (ie clones can be used directly as probes) (2) a primer pair derived from the end of the sequence obtained by assembling the PCR fragment; And (3) an oligonucleotide derived from the end of the assembled sequence. Otides can be used as hybridization probes. these The product of the reaction is preferably directly labeled with a radioisotope or fluorescent label and In separate hybridization reactions on the loaded library Use as lobe.   B. 2 Simple interest of clones containing the full-length coding region   Adjacent sequences were identified by positively hybridizing probes and sequence Confirm by analysis and computer assembly. In addition, two separate gis If the probe from the end of the cap hybridizes to the same gridded clone, In that case, the region spanning the gap is immediately identified. Primer walking the whole claw Until the gap is closed or the gap is closed. New probes and Hybridization is performed as needed.   C. Adjacent sequence assembly or alignment   As will be appreciated by those of skill in the art upon reading this disclosure, It can be placed in approximate order prior to sequencing. For example, in one specific example, 1 Hybridize a 00 kb cosmid insert against a small insert library Rediscover and identify adjacent clones prior to sequencing. More positive of clones Precise alignment is performed with enzymes with few cleavage sites (E. coli NotI, PacI, Spe However, it varies depending on the base composition of the organism. Preferably, the enzyme is Cut once every 10-100 kb. ) Digestion of genomic DNA, or more often Partial digestion with an enzyme that frequently cleaves (preferably once every 10-100 kb) Large DNA fragments obtained by digestion by pulse field gel electrophoresis Separation and isolation of fragments, hybridization to grids of isolated fragments This is performed by dicing.   D. Other methods of the invention   As will be apparent to those of skill in the art upon reading this disclosure, the compositions and methods of the present invention May be used for similar processes. For example, in one embodiment, a large The first pass sequencing of the desert library was performed on the cosmid vector sequence. This is done using both universal forward and reverse primers. m13 array Universal primers, such as primers for etc., are well known in the art. Start a small number of sequencing and use a standard computer such as GELMERGE Assembler Sequence these large insert clones in adjacent sequences using the You. Other computer-assisted assemblies of nucleotide data are It is known in the field. For example, "Automated DNA Sequencing and Ana1ysis", Adams et al. eds., Academic Press (1995), (E.W. Myers presents a discussion of s. oftware systems for fragment assembly in Chapter 32); and J.D.Kececiog lu et al., “Combinatorial Algorithms for DNA Sequence Assembly”, Algori thmica, 13: 7-51 (1995)). Then, the appropriate clone (ie, other To a small insert library grid. Can be selected for use as a lobe. Identify clones with universal primers To determine the nucleotide sequence and assemble the sequence data. In this example, Designing primers for the second walk in the insert library Eliminate the expense and time to build.   The present invention is further described by the following non-limiting examples. Example Example 1   A genomic library of Staphylococcus aureus was used as a vector, Lambda Z Built with APII. The average size of the inserts in this library is about 5k b. Primary sequence analysis using universal forward and reverse primers Performed on approximately 10,000 clones from this library. Then Ann Finalize the preprocessing steps for notating and grouping Functional assembly similar to GELMERGE Assembler except before assembly The derived DNA sequence was assembled using Lie.   Annotating considers two dissimilar sequences to be similar or otherwise May produce incorrect results in the grouping or assembly process Method for identifying partial gene sequences and regions of putative gene assembly. You. These areas are then grouped and assembled in the method of the invention. Seems to hinder the accuracy of the The remaining unidentified regions are grouped and And useful information (for assembly and assembly purposes) Grouping and assembly processes. Can interfere with subsequent steps Regions identified as potential are ignored in these steps.   For example, the region that can be identified in the annotating step is a region other than the target species. Sequences from cell types and from cell structures such as ribosomes and mitochondria It is a nucleic acid or DNA. Polynucleotide runs, simple tandem repeats (STR) and Of low-information regions that occur multiple times in sequences such as genomic repeats and ALUs can do. In addition, ambiguous areas and experimental errors or artificial The resulting region can also be identified.   After annotating, the annotated partial gene sequence is Group with the annotated partial gene sequence. Annotating The step of grouping the partial gene sequences Based on the binding relationship between the sequence and other unannotated partial gene sequences Of other existing annotated partial gene sequences Some may be components of the putative gene assembly identified earlier. This Steps are annotating regions from partial gene sequences and previously identified inferences Start by ignoring gene assembly. Then annotating The partial gene sequence is ignored, ignoring the Is compared with the consensus sequence of the putative gene assembly identified above. Then the partial remains The gene sequences are compared with each other, ignoring the annotated regions. The partial heredity Groups are determined based on the similarities determined by these comparisons in the child sequences. Like this The resulting group contains a set of partial gene sequences that are considered to belong to each other. I.e., the grouping process is likely to be assembled together Child Form a group of arrays.   For each group in the previous step, the positional alignment of the related partial gene sequences Based on the assumption that all subgene sequences belong to the same putative gene assembly. This is done as a group. One of the results of the alignment is one or more putative gene assembly May be the result of the alignment, the alignment step of which is the glue of the partial gene sequence. It may expose inconsistencies between loops.   Once positional alignment has been completed for each putative gene assembly, Prepared by various contig assemblies known to those skilled in the art. For example, GELMER GE (UWGCG, Madison, WI).   Once the unnotating, grouping, and assembly steps are complete, Save the constant gene assembly in a database. Putative gene assembly Analyze based on its sequence, structure, biochemical function or other relevant characteristics Is also good. Once categorized, the database is organized into its potential biochemical functions, structures, Or information related to putative gene assembly for other characteristics .   For example, one method of analyzing putative gene assembly is to analyze for other known genes. By homology. Shared homology of putative gene assembly with known genes May suggest a similar biochemical role or function.   Another typical method for analyzing putative gene assembly is to use the known sequence based on. Specific sequence patterns include signal sequence, transmembrane domain, SH2 domain Encoding protein regions with specific biochemical properties, such as Have been.   After the assembly process, non-overlapping flanking sequence ends were identified. This library The corresponding number of sequenced clones from the To prepare a high-density array.   Two clones, 2AU2142 and 2AU0165, are located at the ends of adjacent sequences. Containing non-overlapping sequences. PCR primers are used for these non-overlapping Designed to amplify a 250 bp fragment for each of the adjacent sequence ends And a separate PCR reaction on the genomic DNA of Staphylococcus aureus. It was used for. The PCR product was purified, radiolabeled and separated into separate Used for the hybridization reaction. PCR for clone 2AU2142 The fragment was found to hybridize to three clones . Restriction digest analysis indicated that these three clones had overlapping sequences. Indicated. Sequence analysis confirmed this result, and further extended from the end of the adjacent sequence. An additional 450 bp was shown. 2 AU0165 derived from the fragment Hybridized to the clone. Restriction fragments and Sequence analysis also confirmed the overlapping nature of these clones.   Analyzing a partial gene sequence without departing from the scope or spirit of the invention It will be apparent to those skilled in the art that various modifications may be made to the methods of the present invention for

Claims (1)

【特許請求の範囲】 1. 選択した生物を高処理塩基配列決定し、隣接配列をアセンブルして、ゲノ ムのギャップを閉鎖する方法であって: (a)選択した生物の第一のランダムゲノムライブラリーを調製し; (b)工程(a)のライブラリーを配列決定し、隣接ヌクレオチド配列を同定 し; (c)隣接配列をアセンブルし、非−重複末端またはグリッドを同定し; (d)選択した生物からのアセンブルしたヌクレオチド配列の非−重複末端に 対応する標識ハイブリダイゼーションプローブを作成し; (e)選択した生物の第二のランダムゲノムライブラリーを調製し; (f)その表面の所定の領域に工程(e)のゲノムライブラリー由来の複数の 限定された材料を固定する表面を有するグリッドを得; (g)グリッドに対して工程(d)のプローブをハイブリダイズし、非−重複 末端に及ぶ配列を同定し; (h)非−重複末端に及ぶ配列のヌクレオチド配列を決定し; (i)非−重複末端に及ぶ配列がアセンブルした隣接配列間のギャップを閉じ ない場合、工程(h)により同定した新たに同定した非−重複末端に対応するさ らなる標識ハイブリダイゼーションプローブを調製し、該さらなるプローブを用 いて工程(f)のグリッドに対してハイブリダイゼーション工程(g)を繰り返 し、非−重複末端に及ぶ配列のヌクレオチド配列を決定することを含む方法。 2. 第一のランダムゲノムライブラリーが小さなインサートライブラリーを含 む請求項1記載の方法。 3. 第二のランダムゲノムライブラリーが中程度のインサートライブラリーを 含む請求項1記載の方法。 4. 第二のランダムゲノムライブラリーが大きなインサートライブラリーを含 む請求項1記載の方法。 5. 工程(g)が: (g1)グリッドに対して工程(d)のプローブをハイブリダイズさせ、非− 重複末端に及ぶ配列を同定し; (g2)非−重複末端に及ぶ工程(g1)において同定した配列を検出可能に 標識し; (g3)工程(a)のゲノムライブラリー由来の複数の限定された材料をその 表面の所定の領域に固定する表面を有するグリッドを得; (g4)第二のグリッドに対して工程(g2)において同定した配列をハイブ リダイズさせ、非−重複末端に及ぶ配列を同定する ことを含み、 工程(h)が: (h1)非一重複末端に及ぶ工程(g4)において同定した配列のヌクレオチ ド配列を決定し; (h2)隣接配列をアセンブルする ことを含む、請求項1記載の方法。 6. 工程(d)のハイブリダイゼーションプローブが、非−重複末端を有する ゲノムライブラリー(a)由来の材料を含む請求項1記載の方法。 7. 工程(d)のハイブリダイゼーションプローブが、プライマー対から非− 重複末端を有するアセンブルした配列の末端までのPCR増幅されたフラグメン トを含む請求項1記載の方法。 8. 工程(d)のハイブリダイゼーションプローブが、非−重複末端を有する アセンブルした配列の末端に対応するオリゴヌクレオチドを含む請求項1記載の 方法。 9. 請求項1記載の方法により同定された単離された全長遺伝子配列。 10. 請求項9記載の遺伝子配列の発現により産生された単離されたタンパク 質。 11. 生物の成長に関連する疾患の治療における使用のための請求項9記載の 遺伝子配列の発現を調節することのできる治療用化合物。 12. 生物の成長に関連する疾患の治療における使用のための請求項10記載 のタンパク質の活性を調節することのできる治療用化合物。 13. 請求項9記載の遺伝子配列を標的として検出可能な試薬を含む疾患また は感染の診断に有用な診断用組成物。[Claims] 1. High-throughput sequencing of selected organisms, assembly of flanking sequences, The method of closing the system gap is:   (A) preparing a first random genomic library of the selected organism;   (B) sequencing the library of step (a) to identify adjacent nucleotide sequences And;   (C) assembling adjacent sequences and identifying non-overlapping ends or grids;   (D) at the non-overlapping end of the assembled nucleotide sequence from the selected organism Creating a corresponding labeled hybridization probe;   (E) preparing a second random genomic library of the selected organism;   (F) a plurality of regions derived from the genomic library of step (e) Obtaining a grid having a surface to which the limited material is fixed;   (G) hybridizing the probe of step (d) to the grid, non-overlapping Identifying the sequence spanning the termini;   (H) determining the nucleotide sequence of the sequence spanning the non-overlapping ends;   (I) Close gaps between adjacent sequences assembled by sequences spanning non-overlapping ends If not, the length corresponding to the newly identified non-overlapping end identified in step (h) A labeled hybridization probe, and use the additional probe. And repeating the hybridization step (g) for the grid of step (f). And determining the nucleotide sequence of the sequence spanning the non-overlapping ends. 2. The first random genomic library contains a small insert library The method of claim 1. 3. The second random genomic library provides a medium insert library The method of claim 1 comprising: 4. The second random genome library contains a large insert library The method of claim 1. 5. Step (g) is:   (G1) The probe of step (d) is hybridized to a grid, Identifying sequences spanning the overlapping ends;   (G2) detectable sequence identified in step (g1) spanning non-overlapping ends Label;   (G3) the plurality of restricted materials from the genomic library of step (a) Obtaining a grid having a surface that is fixed to a predetermined area of the surface;   (G4) hybridizing the sequence identified in step (g2) to the second grid Rediscover and identify sequences spanning non-overlapping ends Including   Step (h) is:   (H1) Nucleotide of the sequence identified in step (g4) spanning non-overlapping ends Determine the sequence of the sequence;   (H2) Assemble adjacent sequences   The method of claim 1 comprising: 6. The hybridization probe of step (d) has non-overlapping ends 2. The method according to claim 1, comprising material from the genomic library (a). 7. When the hybridization probe in step (d) is non- PCR amplified fragment to the end of assembled sequence with overlapping ends 2. The method of claim 1, wherein the method comprises: 8. The hybridization probe of step (d) has non-overlapping ends 2. The method according to claim 1, comprising an oligonucleotide corresponding to the end of the assembled sequence. Method. 9. An isolated full-length gene sequence identified by the method of claim 1. 10. An isolated protein produced by expression of the gene sequence according to claim 9. quality. 11. 10. The method of claim 9 for use in treating a disease associated with growth of an organism. A therapeutic compound capable of regulating the expression of a gene sequence. 12. 11. The method according to claim 10, for use in the treatment of a disease associated with the growth of an organism. A therapeutic compound capable of modulating the activity of a protein. 13. A disease comprising a reagent capable of detecting the gene sequence according to claim 9 as a target or Is a diagnostic composition useful for diagnosing infection.
JP52692898A 1996-12-12 1997-12-11 Quick gap closure method Pending JP2001505780A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US3255596P 1996-12-12 1996-12-12
US60/032,555 1996-12-12
PCT/US1997/022655 WO1998026096A1 (en) 1996-12-12 1997-12-11 Method for rapid gap closure

Publications (1)

Publication Number Publication Date
JP2001505780A true JP2001505780A (en) 2001-05-08

Family

ID=21865561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52692898A Pending JP2001505780A (en) 1996-12-12 1997-12-11 Quick gap closure method

Country Status (3)

Country Link
EP (1) EP0958381A1 (en)
JP (1) JP2001505780A (en)
WO (1) WO1998026096A1 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005218301A (en) * 2002-03-06 2005-08-18 Takara Bio Inc Method for base sequencing of nucleic acid
GB0518585D0 (en) 2005-09-12 2005-10-19 Electrophoretics Ltd Mass labels
WO2013078623A1 (en) * 2011-11-29 2013-06-06 深圳华大基因科技有限公司 Method and device for gap closure in nucleotide sequence assembly
WO2013078619A1 (en) * 2011-11-29 2013-06-06 深圳华大基因科技有限公司 Method and device for identifying extension conflict and determining confidence level of seed read in nucleotide sequence assembly

Also Published As

Publication number Publication date
EP0958381A1 (en) 1999-11-24
WO1998026096A1 (en) 1998-06-18

Similar Documents

Publication Publication Date Title
Hauser et al. Transcriptional profiling on all open reading frames of Saccharomyces cerevisiae
Van Hal et al. The application of DNA microarrays in gene expression analysis
Freeman et al. Fundamentals of DNA hybridization arrays for gene expression analysis
Williams Genomes and proteomes: towards a multidimensional view of biology
US7691614B2 (en) Method of genome-wide nucleic acid fingerprinting of functional regions
Ross et al. Screening large‐insert libraries by hybridization
Clark et al. [13] Construction and analysis of arrayed cDNA libraries
Smith et al. Genomic sequence sampling: a strategy for high resolution sequence–based physical mapping of complex genomes
US20020127571A1 (en) Method for simultaneous identification of differentially expressed mRNAs and measurement of relative concentrations
Winzeler et al. Functional analysis of the yeast genome
US6975943B2 (en) Clone-array pooled shotgun strategy for nucleic acid sequencing
CA2288988A1 (en) Methods for rapid cloning of full length cdnas
JP2001505780A (en) Quick gap closure method
Drmanac et al. DNA sequencing by hybridization with arrays of samples or probes
EP0948646B1 (en) Methods for identifying genes essential to the growth of an organism
Tagu et al. Techniques for molecular biology
Wu et al. Whole‐Genome Physical Mapping: An Overview on Methods for DNA Fingerprinting
US20060121461A1 (en) Methods for identifying and isolating unique nucleic acid sequences
CA2309371A1 (en) Gene sequence tag method
US20020155488A1 (en) Novel method for the preselection of shotgun clones of the genome or a portion thereof of an organism
Maheshwari et al. Genomics, DNA chips and a revolution in plant biology
Milosavljevic et al. Shotgun sequencing, clone pooling, and comparative strategies for mapping and sequencing
Jordan The microarray paradigm and its various implementations
US20220162685A1 (en) Method for analyzing cell sample heterogeneity
US20080076672A1 (en) Methods for Identifying Genes Essential to the Growth of an Organism