JP2014064578A - Aflpを使用したハイスループット物理地図 - Google Patents
Aflpを使用したハイスループット物理地図 Download PDFInfo
- Publication number
- JP2014064578A JP2014064578A JP2013230904A JP2013230904A JP2014064578A JP 2014064578 A JP2014064578 A JP 2014064578A JP 2013230904 A JP2013230904 A JP 2013230904A JP 2013230904 A JP2013230904 A JP 2013230904A JP 2014064578 A JP2014064578 A JP 2014064578A
- Authority
- JP
- Japan
- Prior art keywords
- adapter
- pool
- restriction
- ligated
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Thin Film Transistor (AREA)
- Catalysts (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
- Ultra Sonic Daignosis Equipment (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
Abstract
【課題】本発明は、制限断片を生成するとともに、(試料特異的)識別子を含む好適なアダプタをライゲートする、分子マーカーを同定及び検出するハイスループットな方法を提供する。
【解決手段】アダプタとライゲートした制限断片は、その3’末端に選択的ヌクレオチドを担持するアダプタ適合プライマーで選択的に増幅され得る。増幅したアダプタとライゲートした制限断片は、ハイスループットシークエンシング方法を使用して、少なくとも部分的にシークエンシングされ、試料特異的識別子とともに、制限断片の配列部分は分子マーカーとして働く。
【選択図】図1
【解決手段】アダプタとライゲートした制限断片は、その3’末端に選択的ヌクレオチドを担持するアダプタ適合プライマーで選択的に増幅され得る。増幅したアダプタとライゲートした制限断片は、ハイスループットシークエンシング方法を使用して、少なくとも部分的にシークエンシングされ、試料特異的識別子とともに、制限断片の配列部分は分子マーカーとして働く。
【選択図】図1
Description
本発明は、分子生物学及びバイオテクノロジーの分野に関する。特に、本発明は、核酸の検出及び同定の分野に関する。より詳細には、本発明は、ハイスループットシークエンシング技術を使用した、ゲノム又はその一部の物理地図の作製に関する。
統合された遺伝的且つ物理的なゲノム地図は、地図に基づく遺伝子単離、比較ゲノム解析に、及びゲノムシークエンシングプロジェクトのための配列対応(sequence-ready)クローンの供給源として非常に貴重である。ゲノム研究用の種の物理的且つ遺伝的マーカーの統合地図が利用可能であることの影響は非常に大きい。統合地図によって、正確且つ迅速な遺伝子マッピング、並びにマイクロサテライト遺伝子座及びSNPマーカーの正確なマッピングが可能になる。複雑性が様々なゲノムの物理地図をアセンブリするのに様々な方法が開発されている。より良好な特徴を示すアプローチの1つは、制限酵素を使用してゲノムのサブクローンから大量のDNA断片を生成することである(非特許文献1、非特許文献2、非特許文献3)。これらのフィンガープリントを比較して、関連クローンを同定し、コンティグにおいて重複するクローンをアセンブリする。しかし、ゲル間のDNA移動の変動、反復DNAの存在、制限部位の異常な分布及びクローン提示の歪みのために、複雑なゲノムの大きい挿入クローンの順番の決定(ordering)に対するフィンガープリントの有用性は制限されている。したがって、フィンガープリントと、PCRベース又はハイブリダイゼーションベースの方法との組合せを用いて、複雑なゲノムの最も高品質な物理地図を構築している。しかし、フィンガープリント技術の利用の欠点の1つは、間接的な方法である断片パターンマッチング法に基づいていることである。
実際の配列データに基づきコンティグを作製すること、即ちより直接的な方法によって、物理地図を作製することが好ましい。配列を基にした物理地図はより正確であるだけでなく、同時に対象の種の全ゲノム配列の決定にも寄与する。近年、より効率的且つ費用効果的にクローンの完全ヌクレオチド配列の決定を可能にするハイスループットシークエンシング法が利用可能になっている。
しかしながら、制限断片全体のシークエンシングによる検出は、依然として比較的不経済である。さらに、例えば本明細書中の他の部分で開示される、現行技術水準のシークエンシング技術(454 Life Sciences、www.454.com、Solexa、www.solexa.com及びHelicos、www.helicosbio.comによる)は、その圧倒的なシークエンシング能にも関わらず、制限長断片のシークエンシングしか提供することができない。また、現行方法は1回の操作で多くの試料を同時に処理することができない。
本発明の目的は、制限消化、プーリング、非常に正確な増幅、及びハイスループットシークエンシングの組合せに基づいた、物理地図のハイスループットな作製を可能にする戦略を発明するとともに説明することである。この方法を使用すれば、複雑なゲノムであっても物理地図を作製することができる。
定義
以下の説明及び実施例において、多くの用語が使用される。かかる用語に与えられる範囲を含む、明細書及び特許請求の範囲についての明確で且つ一貫した理解を提供するために、以下の定義が提供される。本明細書中で特に規定しない限り、使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって共通に理解されるものと同一の意味を有する。すべての刊行物、特許出願、特許及び他の参考文献の開示内容全体が、参照により本明細書中に援用される。
以下の説明及び実施例において、多くの用語が使用される。かかる用語に与えられる範囲を含む、明細書及び特許請求の範囲についての明確で且つ一貫した理解を提供するために、以下の定義が提供される。本明細書中で特に規定しない限り、使用されるすべての技術用語及び科学用語は、本発明が属する技術分野の当業者によって共通に理解されるものと同一の意味を有する。すべての刊行物、特許出願、特許及び他の参考文献の開示内容全体が、参照により本明細書中に援用される。
核酸:本発明に記載の核酸は、ピリミジン塩基及びプリン塩基、好ましくはシトシン、チミン及びウラシル、並びにアデニン及びグアニンの任意のポリマー又はオリゴマーをそれぞれ含み得る(非特許文献4(この全体がすべての目的のために参照により本明細書中に援用される)を参照されたい)。本発明では、任意のデオキシリボヌクレオチド、リボヌクレオチド又はペプチド核酸成分、及びそれらの任意の化学的な変形(例えばこれらの塩基のメチル化形態、ヒドロキシメチル化形態又はグリコシル化形態)等が考えられる。ポリマー又はオリゴマーは、組成物中で不均質であっても又は均質であってもよく、天然の供給源から単離してもよく、又は人為的若しくは合成的に生成してもよい。また核酸は、DNA若しくはRNA、又はそれらの混合物であってもよく、恒久的に又は一時的に、一本鎖形態、又はホモ二重鎖、ヘテロ二重鎖、及びハイブリッド状態を含む、二本鎖形態で存在してもよい。
AFLP:AFLPとは、1つ又は複数の制限エンドヌクレアーゼにより核酸を消化して制限断片を生成すること、アダプタを制限断片にライゲートすること、及びアダプタと(一部)相補的であり、制限エンドヌクレアーゼの残部と(一部)相補的であり、A、C、T又はG(又は場合によってはU)の中からランダムに選択される少なくとも1つのヌクレオチドをさらに含有する少なくとも1つのプライマーを用いて、アダプタとライゲートした制限断片を増幅することに基づく核酸の選択的増幅法を指す。AFLPには事前配列情報は全く必要なく、AFLPは任意の開始DNAで実施し得る。概してAFLPは、
(a)核酸、特にDNA又はcDNAを1つ又は複数の特異的な制限エンドヌクレアーゼで消化する工程であって、対応する一連の制限断片へとDNAを断片化する、消化する工程と、
(b)こうして得られた制限断片を、一端が制限断片の一端又は両端と適合する二本鎖合成オリゴヌクレオチドアダプタとライゲートする工程であって、それによりアダプタとライゲートした(好ましくは、タグ付けした)開始DNAの制限断片を生成する、ライゲートする工程と、
(c)アダプタとライゲートした(好ましくは、タグ付けした)制限断片を、ハイブリダイズ条件下で、その3’末端に選択ヌクレオチドを含有する1つ又は複数のオリゴヌクレオチドプライマーと接触させる工程と、
(d)プライマーとハイブリダイズした、アダプタとライゲートした(好ましくは、タグ付けした)制限断片を、PCR又は同様の技法によって増幅する工程であって、プライマーがハイブリダイズする開始DNAの制限断片に沿って、ハイブリダイズしたプライマーのさらなる伸長を引き起こす、増幅する工程と、
(e)こうして得られた増幅又は伸長したDNA断片を、検出、同定、又は回収する工程とを含む。
(a)核酸、特にDNA又はcDNAを1つ又は複数の特異的な制限エンドヌクレアーゼで消化する工程であって、対応する一連の制限断片へとDNAを断片化する、消化する工程と、
(b)こうして得られた制限断片を、一端が制限断片の一端又は両端と適合する二本鎖合成オリゴヌクレオチドアダプタとライゲートする工程であって、それによりアダプタとライゲートした(好ましくは、タグ付けした)開始DNAの制限断片を生成する、ライゲートする工程と、
(c)アダプタとライゲートした(好ましくは、タグ付けした)制限断片を、ハイブリダイズ条件下で、その3’末端に選択ヌクレオチドを含有する1つ又は複数のオリゴヌクレオチドプライマーと接触させる工程と、
(d)プライマーとハイブリダイズした、アダプタとライゲートした(好ましくは、タグ付けした)制限断片を、PCR又は同様の技法によって増幅する工程であって、プライマーがハイブリダイズする開始DNAの制限断片に沿って、ハイブリダイズしたプライマーのさらなる伸長を引き起こす、増幅する工程と、
(e)こうして得られた増幅又は伸長したDNA断片を、検出、同定、又は回収する工程とを含む。
したがって、AFLPはアダプタとライゲートした断片の再現可能なサブセットを提供する。AFLPはとりわけ特許文献1、特許文献2、及び非特許文献5に記載されている。AFLPに関するさらなる詳細に関しては、これらの刊行物が参照される。AFLPは複雑度低減技法及びDNAフィンガープリント技術として一般に使用される。AFLPをフィンガープリント技術として使用する状況の中で、AFLPマーカーの概念が発展してきた。
選択塩基:選択塩基は、アダプタと相補的な部分、及び制限部位の残部と相補的な部分を含有するプライマーの3’末端に位置し、A、C、T又はGの中からランダムに選択される。選択塩基を用いてプライマーを伸長することにより、続く増幅ではアダプタとライゲートした制限断片の再現可能なサブセットのみ、即ち、選択塩基を担持するプライマーを使用して増幅し得る断片のみが生成される。選択ヌクレオチドは1個〜10個の数でプライマーの3’末端に付加され得る。典型的には、1個〜4個で十分であり、且つ好ましい。両プライマーは様々な数の選択塩基を含有し得る。それぞれ付加された選択塩基によって、サブセット中の増幅したアダプタとライゲートした制限断片(単位複製配列)の量を約4分の1に低減させる。典型的には、AFLPで使用される選択塩基の数は+N+Mで示される(この場合、1つのプライマーがN個の選択ヌクレオチドを担持するとともに他のプライマーがM個の選択ヌクレオチドを担持する)。したがって、Eco/Mse +1/+2 AFLPとは、開始DNAのEcoRI及びMseIによる消化、適切なアダプタのライゲーション、並びに1つの選択塩基を担持するEcoRI制限位置を対象とする1つのプライマー、及び2つの選択ヌクレオチドを担持するMseI制限部位を対象とするもう1つのプライマーを用いる増幅の省略表現である。少なくとも1つの選択ヌクレオチドをその3’末端に担持する、AFLPで使用されるプライマーもAFLPプライマーとして示される。選択ヌクレオチドをその3’末端に担持せず、且つ実際はアダプタ及び制限部位の残部と相補的なプライマーは、AFLP+0プライマーとして示されることもある。
クラスタリング:「クラスタリング」という用語は、短く又は長く続く同一又は類似のヌクレオチドの存在に基づいて、2つ以上のヌクレオチド配列を比較すること及び短く(又は長く)続く同一又は類似の配列に基づいて、或る特定の最小レベルの配列相同性を有する配列をグループ化することを意味する。
アセンブリ:(部分)重複配列の一群の順番決定に基づくコンティグの構築であり、「コンティグ構築」とも呼ばれる。
アライメント:例えばギャップを導入することによって、アライメント中の様々な配列にわたって配列同一性を有する領域を得る可能性を最大にするための図面における複数の配列の位置決め。以下でさらに説明されるように、幾つかのヌクレオチド配列のアライメント法が当該技術分野で既知である。
識別子:アダプタ若しくはプライマーに付加され得るか、又はその配列内に含まれ得るか、又はそうでなければ標識として使用されて一意の識別子を提供し得る短い配列。かかる配列識別子(タグ)は、特異的な核酸試料を同定するために一意的に使用される、多様であるが規定された長さを有する一意の塩基配列であり得る。例えば、4bpのタグにより、44=256個の異なるタグができる。典型例は、ハイブリダイゼーションによる一意的な検出に一般に使用されるタグとして当該技術分野において既知のZIP配列である(非特許文献6)。かかる識別子を使用することによって、さらなる処理時にPCR試料の起源が求められ得る。異なる核酸試料に由来する処理産物を組合せる場合には、概して、異なる核酸試料は異なる識別子を使用して同定される。
シークエンシング:「シークエンシング」という用語は、核酸試料、例えばDNA又はRNA中のヌクレオチドの順番(塩基配列)を決定することを指す。
ハイスループットスクリーニング:HTSと略されることの多いハイスループットスクリーニングは、特に生物学及び化学の分野に関連した科学実験用の方法である。現代のロボット工学及び他の専門化した実験ハードウェアの組合せによって、研究者は大量の試料を同時に効率的にスクリーニングすることが可能となる。
制限エンドヌクレアーゼ:制限エンドヌクレアーゼ又は制限酵素は、二本鎖DNA分子中の特異的なヌクレオチド配列(標的部位)を認識し、すべての標的部位又はその近くでDNA分子の両鎖を切断する酵素である。
制限断片:制限エンドヌクレアーゼによる消化によって生成するDNA分子は制限断片と称される。任意の所定のゲノム(又はその起源に関わらず核酸)は、特定の制限エンドヌクレアーゼによって制限断片の別個の組へと消化される。制限エンドヌクレアーゼ切断に由来するDNA断片は、多様な技法でさらに使用することができ、例えばゲル電気泳動によって検出することができる。
ライゲーション:2つの二本鎖DNA分子を相互に共有結合させるリガーゼ酵素によって触媒される酵素反応は、ライゲーションと称される。概して、両方のDNA鎖は相互に共有結合するが、鎖の一端の化学的修飾又は酵素的修飾を通じて、2つの鎖のうちの1つの鎖のライゲーションを防ぐことも可能である。その場合には、共有結合が2つのDNA鎖のうち1つのみで生じる。
合成オリゴヌクレオチド:化学的に合成することができる、好ましくは約10塩基〜約50塩基を有する一本鎖DNA分子は、合成オリゴヌクレオチドと称される。概して、これらの合成DNA分子は、一意又は所望のヌクレオチド配列を有するように設計されるが、関連配列を有し、且つヌクレオチド配列内の特定位置に異なるヌクレオチド組成を有する分子のファミリーを合成することが可能である。「合成オリゴヌクレオチド」という用語は、設計した又は所望のヌクレオチド配列を有するDNA分子を指すために使用される。
アダプタ:制限断片末端にライゲートすることができるように設計されている、限られた数の塩基対、例えば約10塩基対長〜約50塩基対長を有する短い二本鎖DNA分子。アダプタは概して、互いに一部が相補的なヌクレオチド配列を有する2つの合成オリゴヌクレオチドから構成される。適切な条件下、溶液中で2つの合成オリゴヌクレオチドを混合すると、これらは互いにアニーリングして二本鎖構造を形成する。アニーリング後、アダプタ分子の一端は、制限断片の末端と適合し、それとライゲートすることができるように設計される。アダプタのもう一方の端は、ライゲートすることができないように設計することができるが、そうである必要はない(二重にライゲートしたアダプタ)。
アダプタとライゲートした制限断片:アダプタでキャッピングした制限断片。
プライマー:概して、「プライマー」という用語は、DNAの合成をプライムすることができるDNA鎖を指す。DNAポリメラーゼは、プライマーなしではDNAをde novo合成することができない。即ち、アセンブリするヌクレオチドの順番を指示するための鋳型として相補鎖が使用される反応において、DNAポリメラーゼは既存のDNA鎖しか伸長することができない。本発明者らは、プライマーとして、ポリメラーゼ連鎖反応(PCR)で使用される合成オリゴヌクレオチド分子を指す。
DNAの増幅:「DNAの増幅」という用語は、典型的には、PCRを使用する二本鎖DNA分子のin vitroでの合成を指し示すために使用される。他の増幅方法が存在し、それらが趣旨を逸脱することなく、本発明で使用され得ることに留意されたい。
Brenner et al., Proc. Natl. Acad. Sci., (1989), 86, 8902-8906
Gregory et al., Genome Res. (1997), 7, 1162-1168
Marra et al., Genome Res. (1997), 7, 1072-1084
Albert L. Lehninger著「生化学の原理(Principles of Biochemistry)」、793-800(Worth Pub. 1982)
Vos et al., Nucleic Acid Research, 1995, 23, 21, 4407-4414
Iannone et al. Cytometry 39:131-140, 2000
本発明者らは、ライブラリにおけるクローンの制限酵素による消化、得られた配列のアダプタ−ライゲーション、(選択的)増幅、ハイスループットシークエンシング及びデコンボリューションの組合せを使用することによって、大きくて複雑なゲノムであっても物理地図をアセンブリするのに使用することができるコンティグが得られることを見出している。
一態様において、本発明は、ゲノムの少なくとも一部の物理地図を作製する方法であって、
(a)試料DNAを準備する工程と、
(b)人工染色体(BAC、YAC)のクローンバンクを作製する(各人工染色体のクローンは、試料DNAの一部を含有する)工程と、
(c)人工染色体のクローンを1つ又は複数のプールで組合せる(各クローンは、2つ以上のプールに存在する)工程であって、ライブラリを作製する、組合せる工程と、
(d)1つ又は複数のプールのDNAを1つ又は複数の制限エンドヌクレアーゼで消化し、各プールに対して制限断片の組が得られる、消化する工程と、
(e)制限断片の片側又は両側にアダプタをライゲートする(少なくとも1つのアダプタがそれぞれ、プール特異的識別子区間又は縮重識別子区間を含有する)工程であって、アダプタとライゲートした制限断片が得られる、ライゲートする工程と、
(f)任意選択で、アダプタとライゲートした制限断片を組合せる工程と、
(g)工程(e)のアダプタとライゲートした制限断片を少なくとも1つのプライマーで増幅し(プライマーはそれぞれ、アダプタのプール特異的識別子区間に対応するプール特異的区間を含有するか、又は縮合識別子区間の位置でプール特異的識別子を含有する)、タグ付けされ増幅したアダプタとライゲートした制限断片(単位複製配列)が得られる、増幅する工程と、
(h)任意選択で、組合せた単位複製配列の組において単位複製配列を組合せる工程と、
(i)少なくともプール特異的識別子、及び単位複製配列の制限断片部分又は組合せた単位複製配列の組の配列を決定する工程と、
(j)プール特異的識別子を使用して、対応するクローンに対して、工程(i)の単位複製配列で決定される制限断片配列を割り当てる工程と、
(k)同じクローン由来の制限断片の順番を決定し、コンティグを構築する、順番を決定する工程と、
(l)工程(k)のクローンのコンティグの順番を決定し、それによって、クローン−コンティグを構築し、物理地図を作製する、順番を決定する工程とを含む、ゲノムの少なくとも一部の物理地図を作製する方法に関する。
(a)試料DNAを準備する工程と、
(b)人工染色体(BAC、YAC)のクローンバンクを作製する(各人工染色体のクローンは、試料DNAの一部を含有する)工程と、
(c)人工染色体のクローンを1つ又は複数のプールで組合せる(各クローンは、2つ以上のプールに存在する)工程であって、ライブラリを作製する、組合せる工程と、
(d)1つ又は複数のプールのDNAを1つ又は複数の制限エンドヌクレアーゼで消化し、各プールに対して制限断片の組が得られる、消化する工程と、
(e)制限断片の片側又は両側にアダプタをライゲートする(少なくとも1つのアダプタがそれぞれ、プール特異的識別子区間又は縮重識別子区間を含有する)工程であって、アダプタとライゲートした制限断片が得られる、ライゲートする工程と、
(f)任意選択で、アダプタとライゲートした制限断片を組合せる工程と、
(g)工程(e)のアダプタとライゲートした制限断片を少なくとも1つのプライマーで増幅し(プライマーはそれぞれ、アダプタのプール特異的識別子区間に対応するプール特異的区間を含有するか、又は縮合識別子区間の位置でプール特異的識別子を含有する)、タグ付けされ増幅したアダプタとライゲートした制限断片(単位複製配列)が得られる、増幅する工程と、
(h)任意選択で、組合せた単位複製配列の組において単位複製配列を組合せる工程と、
(i)少なくともプール特異的識別子、及び単位複製配列の制限断片部分又は組合せた単位複製配列の組の配列を決定する工程と、
(j)プール特異的識別子を使用して、対応するクローンに対して、工程(i)の単位複製配列で決定される制限断片配列を割り当てる工程と、
(k)同じクローン由来の制限断片の順番を決定し、コンティグを構築する、順番を決定する工程と、
(l)工程(k)のクローンのコンティグの順番を決定し、それによって、クローン−コンティグを構築し、物理地図を作製する、順番を決定する工程とを含む、ゲノムの少なくとも一部の物理地図を作製する方法に関する。
この方法の工程(a)では、試料DNAを準備する。例えばSambrook et al(Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual(3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press)によって開示されたような当該技術分野における任意の方法でこれを達成することができる。試料DNAは、任意の種、特にヒト、植物又は動物由来であり得る。本明細書の他の部分に記載されるように、本発明はまた、例えばAFLPに基づく選択的増幅を介した再現可能なサブセットの作製によって、任意のサイズのゲノムに合わせた方法を提供するので、ゲノムの一部のみを使用することが可能であるが、これは必須という訳ではない。したがって典型的には、本発明は全ゲノムを使用する。
工程(b)では、人工クローンバンクを作製する。ライブラリは、細菌人工染色体ライブラリであり得るか(BAC)、又は酵母に基づき得る(YAC)。コスミド、PAC、TAC又はMAC等に基づく他のライブラリも可能である。BACライブラリが好ましい。ライブラリは、高品質であることが好ましく、挿入サイズが大きいゲノムライブラリが好ましい。これは、個々のBACが、研究中のゲノムDNAに大きい挿入を含有することを意味する(典型的には、125kbp超)。好ましい大きい挿入のサイズは、種によって異なる。本願を通して、人工染色体の例として、BACに対して言及が為されている。しかし、本発明はそれらに限定されず、本発明の要旨を逸脱することなく、他の人工染色体を使用することができることに留意されたい。好ましくは、ライブラリは、少なくとも5ゲノム当量、より好ましくは少なくとも7ゲノム当量、最も好ましくは少なくとも8ゲノム当量を含有する。特に好ましくは、少なくとも10ゲノム当量である。ライブラリにおけるゲノム当量数が高くなれば、得られるコンティグ及び物理地図の信頼性が高くなる。
ライブラリにおける個々のクローンをプールし、多くの人工染色体又はクローンを含有するプールを形成する。プーリング(pooling)は、1つの試料への多くの個々のクローン(例えば、10個のプールへの100個のクローン(それぞれが10個のクローンを含有する))の単純な組合せであり得るが、より精密なプーリング戦略を用いてもよい。プールにわたるクローン分布は、各クローンが少なくとも2つ以上のプールに存在するようなものが好ましい。プールは、1つのプール当たり10個〜10000個、好ましくは100個〜1000個、より好ましくは250個〜750個のクローンを含有することが好ましい。1つのプール当たりのクローンの数は大いに異なり得ることが観察され、このばらつきは、例えば研究中のゲノムのサイズに関係がある。典型的には、プール又はサブプールの最大サイズは、識別子の組によってプール中のクローンを一意的に同定する能力によって支配される。以下でさらに詳述されるように、プールにおけるゲノム当量の典型的な範囲は、約0.2〜0.3であり、これも1つのゲノム当たりで異なり得る。プールは、当該技術分野で既知のプーリング戦略に基づいて作製される。当業者は、ゲノムサイズ等の要因に基づき、最適なプーリング戦略を選択することができる。得られるプーリング戦略は環境に依存し、その例は、プレートプーリング、N次元プーリング(例えば2次元プーリング、3次元プーリング、6次元プーリング)、又は複雑なプーリングである。多くのプールの操作を容易にするために、3次元プーリングを示す添付の図1で例示されるように、プールは順番にスーパープール(即ちスーパープールは、クローンプールのプールである)に組合せられるか、又はサブプールに分けられ得る。プーリング戦略及びそのデコンボリューション(即ち1つ又は複数のプール又はサブプールにおけるクローンの既知の関連指標(即ち標識又は識別子)の存在検出による、ライブラリにおける個々のクローンの正確な同定)の他の例は、例えば米国特許第6975943号又はKlein et al. in Genome Research,(2000), 10, 798-807に記載される。プーリング戦略は、ライブラリにおけるあらゆるクローンがプールの一意的な組合せがあらゆるクローンに適合するプール全体に分布するようなものが好ましい。その結果、或る特定の(サブ)プールの組合せがクローンを一意的に同定する。
制限エンドヌクレアーゼでプールを消化して、制限断片を得る。各プールが別々にエンドヌクレアーゼ消化に供されるのが好ましい。各プールを同じ(組合せ)のエンドヌクレアーゼ(複数可)で処理する。原則として、あらゆる制限エンドヌクレアーゼを使用することができる。制限エンドヌクレーゼは、フリークエントカッター(MseI又はPstI等の4又は5カッター)又はレアカッター(EcoRI、HindIII等の6以上のカッター)であり得る。典型的には、平均して或る量で存在するか、又はその後の工程に適している或る特定の長さ分布を有する制限断片が得られるように、制限エンドヌクレアーゼが選択される。或る特定の実施の形態では、2つ以上の制限エンドヌクレアーゼを使用することができ、また或る特定の実施の形態では、レアカッターと、フリークエントカッターとの組合せを使用することができる。大きいゲノムには、例えば3つ以上の制限エンドヌクレアーゼを有利に使用することができる。
制限断片の一端又は両端に対して、工程(e)でアダプタをライゲートし、アダプタとライゲートした制限断片を得る。典型的に、本明細書の他の部分で規定されるように、アダプタは合成オリゴヌクレオチドである。本発明で使用されるアダプタは、本明細書の他の部分で規定されるように、本質的に識別子区間を含有することが好ましい。或る特定の実施の形態では、アダプタは、プール特異的識別子を含有する、即ち各プールに対して、プールを明確に示す一意の識別子を含有するアダプタを使用する。或る特定の実施の形態では、アダプタは、プール特異的識別子を含有するプライマーと組合せて使用される縮重識別子区間を含有する。
或る特定の実施の形態では、特にアダプタがプール特異的識別子を含有するときに、アダプタとライゲートした制限断片をより大きいグループに組合せることができる。より大きいグループへのこの組合せは、プールから得られるアダプタとライゲートした制限断片の各組の並行増幅数を低減させるのに役立ち得る。
プライマーの組(少なくとも1つのプライマーが、アダプタにおけるプール特異的な位置又は縮重識別子の位置にプール特異的識別子を含有する)を使用して、アダプタとライゲートした制限断片を増幅することができる。この実施の形態は、上記で概説したように、増幅前にアダプタとライゲートした制限断片のグループ化も可能にする。代替的な実施の形態では、別々にプライマーの組(少なくとも1つのプライマーがプール特異的な区間を含有する)を使用することによって一意的にプールを同定して、各プールのアダプタとライゲートした制限断片(アダプタが縮重識別子区画を含有していた)を増幅する。
どちらにしても、結果として、それが由来するプールと結び付く、アダプタとライゲートした制限断片(単位複製配列とも表される)の組が単位複製配列におけるプール特異的識別子の存在により増幅される。或る特定の実施の形態では、本質的に本明細書の他の部分で記載されるように、その3’末端で選択的ヌクレオチドを担持するプライマーを用いて、選択的増幅によって、単位複製配列のサブセットを作製してもよい。
或る特定の実施の形態では、単位複製配列を、組合せた単位複製配列又はいわゆる配列ライブラリと組合せてもよい。
この方法の工程(i)では、単位複製配列は、本明細書中の下記に記載されるようにシークエンシング、好ましくはハイスループットシークエンシングにかけられる。シークエンシング中に、単位複製配列のヌクレオチド配列の少なくとも一部が決定される。好ましくは、少なくともプール特異的識別子の配列及び単位複製配列の制限断片の一部が決定される。好ましくは、制限断片の少なくとも10ヌクレオチドの配列が決定される。或る特定の実施の形態では、制限断片の少なくとも11、12、13、14又は15ヌクレオチドが決定される。また、決定する最小のヌクレオチド数はゲノムに依存する。例えば、植物にはより反復性のある配列が存在し、これによってより長い配列(25bp〜30bp)が決定される。例えば、既知のシロイヌナズナゲノムの計算では、シークエンシング工程で6bpの制限部位を含む場合、1つの制限断片当たり約20bpを決定する必要があることが示されている。全制限断片の配列を決定することが可能であるが、これはBACクローンのコンティグ構築に絶対必要なものではない。
シークエンシング工程では、精度の増大を得るために、少なくとも5の包括度で、配列ライブラリをシークエンシングしてもよい。これは、1つの特異的なアダプタとライゲートした制限断片の単位複製配列の増幅から得られる少なくとも5つの単位複製配列を有する配列を決定することを意味する。言い換えれば、各制限断片は、(統計的に)少なくとも5回シークエンシングされる。さらに精度が高まるので、包括度の増大は好ましく、好ましくは包括度は少なくとも7であり、より好ましくは少なくとも10である。包括度の増大を利用して、「サンプリング変動」として知られる現象を補う。
以下の工程では、コンピュータ制御方法によって、典型的にコンピュータ内では、(一部)シークエンシングされた単位複製配列は、対応するクローンと相関がある。制限断片由来の部分においてヌクレオチドの同一区間を含有する単位複製配列が選択される。その後、これらの単位複製配列に存在する様々なプール特異的識別子を同定する。様々なプール特異的識別子の組合せ、及びしたがって制限断片の配列は、特定のクローンに一意的に割り当てることができる(上記で「デコンボリューション」として記載されたプロセス)。例えば、3次元プーリング戦略(X、Y、Z)の場合、3つのプールに特異的な識別子の組合せによって、ライブラリにおける各プールが一意的に扱われる。各クローンがライブラリにおいて2回以上発生するので、ライブラリにおけるクローンの各発生に対して、同じ制限断片由来の区画と組合せて、3つのプールに特異的な識別子を組合せることができる。言い換えれば、クローンに起因する制限断片由来の区画は、3つの異なる識別子でタグ付けされる。3つの識別子と組合せて観察される場合、一意の制限断片由来の区画を単一のBACクローンに割り当てることができる。制限断片由来部分で他の一意のヌクレオチド区画を含有する各単位複製配列に対して、これを繰り返すことができる。1つのプール当たりのゲノム当量を比較的低く(0.3未満、好ましくは0.2未満)維持し、それにより同じ断片が、異なるクローンに由来する同じプールで2回存在する確率を減らすことによって、このデコンボリューションプロセスを簡易にすることができる。
プーリング概念の例示的な図面が図1に与えられる。試料DNAを、BACライブラリに変換する。BACライブラリをプールの組(M)にプールする(3つのプールが示され、各プールが約0.3GEを含有する)。各プールは、(X+Y+Z)サブプール(典型的にはマイクロタイタープレート束)に分けられる。
ライブラリにおいて特定のクローンと結び付くシークエンシングされた単位複製配列が、制限断片由来の区画の配列マッチングに基づき、コンティグを構築するのに使用される。次いで、各クローンのコンティグをアライメントして、物理地図を作製する。
本方法の利点は、とりわけBACコンティグ構築に関する従来技術に比べて、BACコンティグ構築に関する精度の向上にある。さらに、配列情報に基づく物理地図の構築はより正確である。これは、本方法が物理地図の構築の直接的な方法であるとともに、ゲノム配列の決定に寄与し、さらにSTS開発及び比較マッピング目的に好適な配列情報を与えるためである。
本発明で使用されるハイスループットシークエンシングは、特に生物学及び化学の分野に関連した科学実験用の方法である。現代のロボット工学及び他の専門化した実験ハードウェアの組合せによって、研究者は大量の試料を同時に効率的にスクリーニングすることが可能となる。
シークエンシングは、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、及び同第WO2005/003375号(すべて454 Life Sciences名義)、Seo et al.(2004)による、Proc. Natl. Acad. Sci. USA 101:5488-93、並びにHelicos、Solexa、US Genomics等の技術(これらは参照により本明細書中に援用される)で開示されている方法等のハイスループットシークエンシング法を使用して実施されることが好ましい。
454 Life sciences技術
或る特定の実施の形態において、シークエンシングは、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、及び同第WO2005/003375号(すべて454 Life Sciences名義)(これらは参照により本明細書中に援用される)に開示されている装置及び/又は方法を使用して実施されることが好ましい。記載されている技術は、1回の操作での2000万〜4000万塩基のシークエンシングを可能にし、競合技術よりも100倍速く、且つ安価である。シークエンシング技術は、大まかには5工程:1)一本鎖DNA(ssDNA)のライブラリを作製するための、DNAの断片化及び特定のアダプタのライゲーション、2)ssDNAのビーズへのアニーリング、油中水型マイクロリアクタにおけるビーズの乳化、及び個々のssDNA分子をビース上で増幅するためのエマルションPCRの実施、3)表面上に増幅したssDNA分子を含有するビーズの選択/濃縮、4)PicoTiter(商標)プレートにおける、DNA担持ビーズの沈着、並びに5)ピロリン酸光シグナルの発生による100000ウェルでの同時シークエンシングから構成される。以下、本方法をより詳細に説明する。
或る特定の実施の形態において、シークエンシングは、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、及び同第WO2005/003375号(すべて454 Life Sciences名義)(これらは参照により本明細書中に援用される)に開示されている装置及び/又は方法を使用して実施されることが好ましい。記載されている技術は、1回の操作での2000万〜4000万塩基のシークエンシングを可能にし、競合技術よりも100倍速く、且つ安価である。シークエンシング技術は、大まかには5工程:1)一本鎖DNA(ssDNA)のライブラリを作製するための、DNAの断片化及び特定のアダプタのライゲーション、2)ssDNAのビーズへのアニーリング、油中水型マイクロリアクタにおけるビーズの乳化、及び個々のssDNA分子をビース上で増幅するためのエマルションPCRの実施、3)表面上に増幅したssDNA分子を含有するビーズの選択/濃縮、4)PicoTiter(商標)プレートにおける、DNA担持ビーズの沈着、並びに5)ピロリン酸光シグナルの発生による100000ウェルでの同時シークエンシングから構成される。以下、本方法をより詳細に説明する。
好ましい実施の形態において、シークエンシングは、
(a)アダプタと結合した(adapted)断片をビーズにアニーリングする(各ビーズは単一のアダプタと結合した断片とアニーリングする)工程と、
(b)ビーズ上にアニーリングした断片を油中水型マイクロリアクタ中で乳化及び増幅させる(各油中水型マイクロリアクタは単一のビーズを含む)工程と、
(c)ビーズをウェルに充填する(各ウェルは単一のビーズを含む)工程と、ピロリン酸シグナルを発生する工程とを含む。
(a)アダプタと結合した(adapted)断片をビーズにアニーリングする(各ビーズは単一のアダプタと結合した断片とアニーリングする)工程と、
(b)ビーズ上にアニーリングした断片を油中水型マイクロリアクタ中で乳化及び増幅させる(各油中水型マイクロリアクタは単一のビーズを含む)工程と、
(c)ビーズをウェルに充填する(各ウェルは単一のビーズを含む)工程と、ピロリン酸シグナルを発生する工程とを含む。
第1の工程(a)において、シークエンシングアダプタは、組合せライブラリ内で断片とライゲートする。上記シークエンシングアダプタは少なくとも、ビーズと結合した相補的なオリゴヌクレオチドにアニーリングするための領域、シークエンシングプライマー領域、及びPCRプライマー領域を含む。したがって、アダプタと結合した断片が得られる。
第1の工程では、アダプタと結合した断片をビーズにアニーリングする(各ビーズは単一のアダプタと結合した断片とアニーリングする)。アダプタと結合した断片のプールに過剰のビーズを加えることにより、大部分のビーズに関して、1つのビーズ当たり1つのアダプタと結合した単一断片のアニーリングが保証される(ポワソン分布)。本発明では、クローンから得られた制限断片にライゲートするアダプタは、ビーズとアニーリング可能な区画を含み得る。
次の工程では、ビーズを油中水型マイクロリアクタ中で乳化させる(各油中水型マイクロリアクタは単一のビーズを含む)。PCR試薬が油中水型マイクロリアクタ内に存在することにより、PCR反応をマイクロリアクタ内部で起こすことが可能となる。続いて、マイクロリアクタを破壊して、DNAを含むビーズ(DNAポジティブビーズ)を濃縮する、即ち増幅断片を含有しないビーズから分離する。
続く工程では、濃縮ビーズをウェルに充填する(各ウェルは単一のビーズを含む)。ウェルは、好ましくは大量の断片の同時シークエンシングを可能にするPicoTiter(商標)プレートの一部である。
酵素担持ビーズの添加後、ピロシークエンシングを使用して断片の配列を決定する。引き続く工程では、従来のシークエンシング試薬の存在下、PicoTiter(商標)プレート及びビーズ並びにその中の酵素ビーズを異なるデオキシリボヌクレオチドに曝し、デオキシリボヌクレオチドを取り込む際に、発生する光シグナルを記録する。正確なヌクレオチドの取込みにより、検出し得るピロシークエンシングシグナルが発生される。
ピロシークエンシング自体は当該技術分野において既知であり、とりわけwww.biotagebio.com; www.pyrosequencing.comの技術欄に記載されている。本技術は、例えば、国際公開第WO03/004690号、同第WO03/054142号、同第WO2004/069849号、同第WO2004/070005号、同第WO2004/070007号、及び同第WO2005/003375号(すべて454 Life Sciences名義)及びMargulies et al., nature 2005, 437, 376-380(これらは参照により本明細書中に援用される)でさらに適用される。
本発明において、ビーズは好ましくは、ビーズ結合単位複製配列を得るために重合による伸長が可能なプライマー配列又はその一部を備える。他の実施の形態において、増幅で使用されるプライマーは、続くエマルション重合、その後のシークエンシングを可能にするために、例えばその5’末端に単位複製配列をビーズに結合させる配列を備える。代替的には、単位複製配列は、ビーズ又は表面とのライゲーション前にシークエンシングアダプタとライゲートし得る。単位複製配列をシークエンシングすることにより、識別子の同一性が明らかになり、ひいては識別子の組合せにより、クローンの同一性が明らかになる。
Solexa技術
ハイスループットシークエンシング法の1つは、Solexa(英国)(www.solexa.co.uk)が利用可能であり、とりわけ、国際公開第WO0006770号、同第WO0027521号、同第WO0058507号、同第WO0123610号、同第WO0157248号、同第WO0157249号、同第WO02061127号、同第WO03016565号、同第WO03048387号、同第WO2004018497号、同第WO2004018493号、同第WO2004050915号、同第WO2004076692号、同第WO2005021786号、同第WO2005047301号、同第WO2005065814号、同第WO2005068656号、同第WO2005068089号、同第WO2005078130号に記載されている。本質的に特に本明細書の他の部分で記載されるように人工染色体プールのアダプタとライゲートした断片の場合に、本方法はDNAのアダプタとライゲートした断片で開始する。アダプタとライゲートしたDNAは、典型的にはフローセルで、固体表面と結合したプライマーの濃密な叢(lawn)とランダムに結合する。アダプタとライゲートした断片の他端は、表面上で相補的なプライマーとハイブリダイズする。いわゆる固相架橋増幅において、ヌクレオチド及びポリメラーゼの存在下でプライマーを伸長することにより、二本鎖の断片が得られる。本固相架橋増幅は選択的増幅であり得る。変性及び固相架橋増幅の反復の結果、増幅した断片の濃密なクラスタが表面全体に分布して得られる。4つの異なる標識をした可逆性終止ヌクレオチド、プライマー及びポリメラーゼをフローセルに加えることによって、シークエンシングを開始する。1回目のプライマー伸長の後、標識を検出し、第1の取込み塩基の同一性を記録し、ブロックした3’末端及び蛍光体を取込み塩基から除去する。その後、同様に、第2の塩基の同一性を判定し、このようにしてシークエンシングを継続する。
ハイスループットシークエンシング法の1つは、Solexa(英国)(www.solexa.co.uk)が利用可能であり、とりわけ、国際公開第WO0006770号、同第WO0027521号、同第WO0058507号、同第WO0123610号、同第WO0157248号、同第WO0157249号、同第WO02061127号、同第WO03016565号、同第WO03048387号、同第WO2004018497号、同第WO2004018493号、同第WO2004050915号、同第WO2004076692号、同第WO2005021786号、同第WO2005047301号、同第WO2005065814号、同第WO2005068656号、同第WO2005068089号、同第WO2005078130号に記載されている。本質的に特に本明細書の他の部分で記載されるように人工染色体プールのアダプタとライゲートした断片の場合に、本方法はDNAのアダプタとライゲートした断片で開始する。アダプタとライゲートしたDNAは、典型的にはフローセルで、固体表面と結合したプライマーの濃密な叢(lawn)とランダムに結合する。アダプタとライゲートした断片の他端は、表面上で相補的なプライマーとハイブリダイズする。いわゆる固相架橋増幅において、ヌクレオチド及びポリメラーゼの存在下でプライマーを伸長することにより、二本鎖の断片が得られる。本固相架橋増幅は選択的増幅であり得る。変性及び固相架橋増幅の反復の結果、増幅した断片の濃密なクラスタが表面全体に分布して得られる。4つの異なる標識をした可逆性終止ヌクレオチド、プライマー及びポリメラーゼをフローセルに加えることによって、シークエンシングを開始する。1回目のプライマー伸長の後、標識を検出し、第1の取込み塩基の同一性を記録し、ブロックした3’末端及び蛍光体を取込み塩基から除去する。その後、同様に、第2の塩基の同一性を判定し、このようにしてシークエンシングを継続する。
本発明において、アダプタとライゲートした制限断片又は単位複製配列は、プライマー結合配列又はプライマー配列を介して表面に結合する。識別子配列及び制限断片(の一部)を含む配列は概説したように決定する。現在利用可能なSolexa技術により、約25塩基対の断片のシークエンシングが可能である。アダプタ及び表面に結合したプライマーの経済的設計によって、シークエンシング工程は、試料識別子、制限エンドヌクレアーゼの認識配列の残部、及びいずれかの任意選択的な選択塩基を読み取る。6bpの試料識別子を使用すると、残部はレアカッターEcoRI由来であり(AACCT)、2つの選択塩基を使用すると、12bpの制限断片の内部配列が得られ、これを使用して、試料中の制限断片を一意的に同定することができる。
上記のSolexaシークエンシング技術に基づく、好ましい実施の形態において、アダプタとライゲートした制限断片の増幅は、その3’末端に最大で1つの選択ヌクレオチドを含有するプライマー、好ましくはその3’末端に選択ヌクレオチドを含有しないプライマー(即ち、プライマーがアダプタのみと相補的である)(+0プライマー)を用いて実施される。
本明細書中に記載されるシークエンシング法を対象とする代替的な実施の形態において、増幅で使用されるプライマーは、(本明細書中に記載されるプライマー又はプライマー結合配列の代用として)特定の区間を含有し得る。これは、次のシークエンシング工程で使用されて、アダプタでキャッピングした制限断片又は単位複製配列を表面に結合させる。これらは、概して鍵領域又は5’−プライマー適合配列として示される。
本発明は、プール特異的な区間又は縮重識別子区間を含有するアダプタ、及び/又はプール特異的識別子を含有するプライマーそれぞれにおいて具体化される。
以下、実施例に基づいて説明する。
合成時解読(Sequencing By Synthesis)(SBS)アプローチに基づくシロイヌナズナ(Arabidopsis thaliana)のde novoのBACに基づく物理地図構築
本実施例は、以下の概括に基づく。
本実施例は、以下の概括に基づく。
全シロイヌナズナゲノムは約125Mbpである。細菌人工染色体(BAC)は、平均約100kbのゲノム挿入を有する。シロイヌナズナゲノムの1×物理的包括度に対して、BACの1ゲノム当量(GE)は、約1250個のBACを含む。至適結果を得るには、1つのBACプールが0.34GE(約384個のBAC)以下を含有するように、BACプールを構築することが好ましい。統計分析によって、0.34GEでは、2つの同一のBAC(即ち全く同じ物理的位置にマッピングされる2つのBAC)を見出す確率は5%未満であることが予測される。BACプールのGEが低くなると、同じ位置にマッピングされる2つのBACを見出す確率がさらに低くなる。直接的な3次元プーリングシステムを計算に使用する。2つの異なる高品質BACライブラリ(2つの異なるクローニング酵素、例えばEcoRI及びHindIII)の合計10GEのBACは、高品質物理地図の構築には十分である。シロイヌナズナに関する10GEのBACは、約12500個のBACである。
配列タグ(制限断片の一部と識別子との組合せ)、例えばEcoRI/MseI若しくはHindIII/MseI等のAFLP断片、又は幾つかの複合酵素(EC)の組合せが、レアカッター制限部位から生成される。
本実施例では、HindIII/MseIの複合酵素を使用する。シロイヌナズナゲノムにおけるHindIII/MseI断片の分布は、100kb当たり50〜120個の断片であると推測される。
ハイスループットシークエンシングの設定
図1も参照されたい。0.3GEは、384個のBACに対応する。X+Y+Z次元を用いた384個のBACの3次元プーリングによって、8+12+4=24個のサブプールが得られる。10GEに関して、M×(X+Y+Z)=30×(8+12+4)=720個のサブプール。
図1も参照されたい。0.3GEは、384個のBACに対応する。X+Y+Z次元を用いた384個のBACの3次元プーリングによって、8+12+4=24個のサブプールが得られる。10GEに関して、M×(X+Y+Z)=30×(8+12+4)=720個のサブプール。
各サブプールに関して、
1つのBAC当たり100個のシークエンシングされたタグ、
1つのタグ当たり10倍の配列冗長性(sequence redundancy)、
3次元プーリング(各BAC断片は、各(X、Y、Z)次元でシークエンシングされる)を生成することが目的である。
1つのBAC当たり100個のシークエンシングされたタグ、
1つのタグ当たり10倍の配列冗長性(sequence redundancy)、
3次元プーリング(各BAC断片は、各(X、Y、Z)次元でシークエンシングされる)を生成することが目的である。
このことは、0.34GEのプールの架橋増幅に基づくハイスループットシークエンシングに関して、一連のシークエンシングによって、8つのサブプール×(12×4×100×10)+12個のサブプール×(8×4×100×10)+4つのサブプール×(12×8×100×10)=1152000個のサブプールが読み取られる必要があることを意味する。このことは、1GEに対して、1GE当たり3×1152000=3456000個の読み取り、及び10GE当たり10×3456000=34560000個の読み取りが必要であることを意味する。
単一のBACは、潜在的に約20bpの一意の配列タグ(制限部位を含む)を約100個生成する。配列数は、複合酵素の選択及び/又は組合せに依存する。
個々のBACが調整され、「デコンボリューション」工程によって扱われるサブプールの配列から添付の配列タグを推測することができる。結果として、デコンボリューションを介して、各配列タグを対応する個々のBACに割り当てることが可能である。反復配列タグは無視する。デコンボリューションプロセスによって、1つのBAC当たり100個の一連のタグが得られ、続いてアガロースゲルで分析されたBAC断片に関してCari Soderlundによって説明されたように、FPC(フィンガープリント化コンティグ)型プロセスによって、de novo物理地図のアセンブリが得られる(Soderlund et al. 2000 - Genome Research 10; 1772-1787)。最終的に、物理地図の遺伝子地図への固定がコンピュータ内で行われる。より大きいゲノムに対しては、他のプーリング戦略が必要な場合がある。
合成時解読(SBS)アプローチに基づくキュウリ(Cucumis sativus)のde novoのBACに基づく物理地図構築
本実施例は、以下の概括に基づく。
本実施例は、以下の概括に基づく。
キュウリの全ゲノムは、約350Mbpである。細菌人工染色体(BAC)は、平均して約100kbのゲノム挿入を有する。シロイヌナズナゲノムの1×物理的包括度に対して、BACの1ゲノム当量(GE)は、約3500個のBACを含む。至適結果を得るには、1つのBACプールが0.34GE(約384個のBAC)以下を含有するように、BACプールを構築することが好ましい。統計分析によって、0.34GEでは、2つの同一のBAC(即ち全く同じ物理的位置にマッピングされる2つのBAC)を見出す確率は5%未満であることが予測される。BACプールのGEが低くなると、同じ位置にマッピングされる2つのBACを見出す確率がさらに低くなる。直接的な3次元プーリングシステムを計算に使用する。2つの異なる高品質BACライブラリ(2つの異なるクローニング酵素、例えばEcoRI及びHindIII)の合計10GEのBACは、高品質物理地図の構築には十分である。キュウリに関する10GEのBACは、約35000個のBACである。
配列タグ(制限断片の一部と識別子との組合せ)、例えばEcoRI/MseI若しくはHindIII/MseI等のAFLP断片、又は幾つかの複合酵素(EC)の組合せが、レアカッター制限部位から生成される。
本実施例では、複合酵素HindIII/MseIを使用する。キュウリゲノム中のHindIII/MseI断片の分布は、100kb当たり50個〜120個の断片であると推測される。
ハイスループットシークエンシングの設定
図1を参照されたい。0.3GEは1152個のBACに対応する。X+Y+Z次元による1152個のBACの3次元プーリングによって、8+12+12=32個のサブプールが得られる。10GEに対して、M×(X+Y+Z)=30×(8+12+12)=960個のサブプール。
図1を参照されたい。0.3GEは1152個のBACに対応する。X+Y+Z次元による1152個のBACの3次元プーリングによって、8+12+12=32個のサブプールが得られる。10GEに対して、M×(X+Y+Z)=30×(8+12+12)=960個のサブプール。
各サブプールに関して、
1つのBAC当たり100個のシークエンシングされたタグ、
1つのタグ当たり10倍の配列冗長性、
3次元プーリング(各BAC断片は、各(X、Y、Z)次元でシークエンシングされる)を生成することが目的である。
1つのBAC当たり100個のシークエンシングされたタグ、
1つのタグ当たり10倍の配列冗長性、
3次元プーリング(各BAC断片は、各(X、Y、Z)次元でシークエンシングされる)を生成することが目的である。
このことは、0.34GEのプールの架橋増幅に基づくハイスループットシークエンシングに関して、一連のシークエンシングによって、8個のサブプール×(12×12×100×10)+12個のサブプール×(8×12×100×10)+12個のサブプール×(12×8×100×10)=3456000個のサブプールが読み取られる必要があることを意味する。このことは、1GEに対して、1GE当たり3×3456000=10368000個の読み取り、及び10GE当たり10×10368000=103680000個の読み取りが必要であることを意味する。
単一のBACは、潜在的に約20bpの一意の配列タグ(制限部位を含む)を約100個生成する。配列数は、複合酵素の選択及び/又は組合せに依存する。
個々のBACが調整され、「デコンボリューション」工程によって扱われるサブプールの配列から添付の配列タグを推測することができる。結果として、デコンボリューションを介して、各配列タグを対応する個々のBACに割り当てることが可能である。反復配列タグは無視する。デコンボリューションプロセスによって、1つのBAC当たり100個の一連のタグが得られ、続いてアガロースゲルで分析されたBAC断片に関してCari Soderlundによって説明されたように、FPC(フィンガープリント化コンティグ)型プロセスによって、de novo物理地図のアセンブリが得られる(Soderlund et al. 2000 - Genome Research 10; 1772-1787)。最終的に、物理地図の遺伝子地図への固定がコンピュータ内で行われる。より大きいゲノムに対しては、他のプーリング戦略が必要な場合がある。
プールしたBACからAFLP鋳型(EcoRI/MseI又はHindIII/MseI)を調製する。2個のHindIII+1プライマーと、1個のMseI+0プライマーとの組合せを用いて、AFLP増幅を行う(EcoRIに関しても同じ)。2個の+1プライマーの使用によって、プールからの約50%のH/M(又はE/M)断片の増幅、即ち各複合酵素に対して平均して70/2=35個の制限断片が増幅されるのを確実にする。各BACプールの5’末端に一意の識別子タグを含有するAFLPプライマーで、AFLP増幅反応を行う。したがって、少なくとも74個の識別子配列が必要である。4つの塩基タグ(44=256個の可能性)によって、これを達成することができる。本実施例では一方向性のシークエンシングを行うので、HindIIIプライマーには、識別子配列だけが必要である。
すべてのプールのAFLP反応混合物を等量で混合し、断片ライブラリを作製する。断片ライブラリを用いて、配列ライブラリを構築する。
3次元プーリング戦略では、このことは、各次元で断片毎に平均して複数回サンプリングすることを意味する。結果は、制限断片のHindIII(又はEcoRI)部位に由来する100bpの配列である。上記のように、1つのBACクローン当たり平均して35個の配列が得られる。この配列は、FPC(http://www.agcol .arizona.edu/software/fpc/から入手可能なSoderlund製のソフトウェアパッケージ)と同様の手順を用いるが、配列マッチングに基づいて(より詳細には)、コンティグアセンブリの基礎となる。
再現性のある複雑性の低減を利用することの利点は、物理地図の構築に必要な断片が少なくなることである。上記のキュウリの例における複雑性の50%の低減は、読み取りを103680000個から51840000個にする。本明細書に記載されるような複雑性の低減を利用した本発明のさらなる利点は、制御可能な品質で物理地図を作製することができることである。このことは、+1のAFLP増幅、例えば+Cをプライマーに組合せることで、BACプールの複雑性を低減させることによって、+1の増幅を4つすべてのプライマーの組合せ(A、C、T、G)と比べて、物理地図の品質(包括度)が約25%になることを意味する。しかしながら、2つ又は3つのプライマーの組合せを用いると、+1の増幅を4つすべてのプライマーの組合せ(A、C、T、G)で得られる包括度と比べると、包括度の増大、即ち例えばそれぞれ55%又は90%が得られる。
BACクローンの役割
3つの異なるタグ付けしたプライマーで同じBACクローン由来の断片を増幅する。したがって、3つのタグとの組合せで観察された一意の配列をライブラリ中の単一のBACクローンに割り当てる。反復配列は、複数のタグとの組合せで観察されるので、単一のBACクローンには結び付けることはできない。このことは、かなりの割合の断片に影響を与えるが、1つのBACクローン当たり35個の断片の中で少なくとも1つのサブセットが一意的なものである。
3つの異なるタグ付けしたプライマーで同じBACクローン由来の断片を増幅する。したがって、3つのタグとの組合せで観察された一意の配列をライブラリ中の単一のBACクローンに割り当てる。反復配列は、複数のタグとの組合せで観察されるので、単一のBACクローンには結び付けることはできない。このことは、かなりの割合の断片に影響を与えるが、1つのBACクローン当たり35個の断片の中で少なくとも1つのサブセットが一意的なものである。
BACプールの10倍の配列包括度(3.3倍/次元)は、(個々のクローンの濃度差及びサンプリングの変動等のために)すべての予測される断片が観察される訳ではないことを意味する。したがって、(一意の)配列分画は、1つ又は2つのタグとの組合せで観察されるにすぎない(又は全く観察されない)。このことが、配列を単一のBACクローンに割り当てるのを邪魔している。しかしながら、これが同じクローンに由来する制限断片間のサンプリングの変動によるものであれば、35個の断片をサンプリングすることは、タグの組合せが、BACに対する正確なアドレスを提供することを意味する:下記を参照されたい。
上記のスキームは、コンティグ構築が、コンティグにおいて相互に断片をグループ化する、即ち断片5(一意の配列を有し、3つのタグを組合せてサンプリングした)が、同様に断片1〜断片4(+35)が由来すると考えられる、ライブラリ中でBACアドレスを規定することを示している。
したがって、このアプローチの強みは、十分多い制限断片(上記実施例では35個)における配列情報を正確なコンティグを構築するのに使用し、(実験の変動により)たとえBACアドレスが各個々の断片配列から得ることができなくとも、3次元タグ付けシステムを利用することで大部分のBACに対する直接的な同定を可能にすることである。しかしながら、同じBAC由来の断片からのタグの組合せによってBACアドレスが提供される。
このように、配列ベースのBACコンティグ作製に由来する情報は、従来のアプローチ(即ちコンティグ+BACアドレス)と同じである。個々のクローンフィンガープリント化アプローチに関するBACアドレスは定義により既知であることが観察される。
配列タグBACマッピングによるハイスループット物理地図作製の手順
シロイヌナズナの第4染色体に対してマッピングし、4つのBACコンティグ(1.8Mb、1.2Mb、0.5Mb及び1.9Mb)における全体の物理的な広がりが5.4Mbに及ぶ合計72個のBAC(BAC=細菌人工染色体)をTAIR及び他のデータベースから選択した。BACライブラリのドナー植物は、コロンビア型のシロイヌナズナである。サイズが70kb〜150kbに及ぶ72個のBACを36個のBACの2つのグループ、「AB」グループ及び「XY」グループに分けた。2つのグループ内の36個のBACには内部重複はないが、ABグループとXYグループとを組合せたBACは、ABグループ及びXYグループのBACを交互に並べた4つの連続した最小のタイリングパスコンティグにアセンブリすることができる(図2〜図5を参照されたい)。
シロイヌナズナの第4染色体に対してマッピングし、4つのBACコンティグ(1.8Mb、1.2Mb、0.5Mb及び1.9Mb)における全体の物理的な広がりが5.4Mbに及ぶ合計72個のBAC(BAC=細菌人工染色体)をTAIR及び他のデータベースから選択した。BACライブラリのドナー植物は、コロンビア型のシロイヌナズナである。サイズが70kb〜150kbに及ぶ72個のBACを36個のBACの2つのグループ、「AB」グループ及び「XY」グループに分けた。2つのグループ内の36個のBACには内部重複はないが、ABグループとXYグループとを組合せたBACは、ABグループ及びXYグループのBACを交互に並べた4つの連続した最小のタイリングパスコンティグにアセンブリすることができる(図2〜図5を参照されたい)。
72個のシロイヌナズナのBAC、ABグループ36個及びXYグループ36個のプーリング戦略
クロラムフェニコール(TAMU BACクローン)又はカナマイシン(IGF BACクローン)を含む標準TY培地200μlで個々のクローンとして72個のBACを一晩培養した。すべてのクローンを6×6フォーマットで培養し、プーリング手順を容易にした。翌朝、1つのグループ当たり12個のプールを作製するように、2次元(6×6)で液体培養物をプールした。各プールは、培養BACを有する培地600μl(個々のBAC当たり100μl)を含有していた。Sambrook et al.(2001)による標準的なアルカリミニプレップ法に従って24個すべてのBACプールからDNAを単離した。
各BACプールのDNA 50ngを制限酵素EcoRI及びMseIで消化し、続いてVos et al.(1995)によって記載された標準AFLP法に従って、EcoRI及びMseIのAFLPアダプタをライゲートした。制限/ライゲーションミックスをミリQ水で10倍に希釈し、5μlを増幅工程に使用した。各プールがプール特異的な4つのヌクレオチドアドレス配列でタグ付けされるように、増幅工程で使用したプライマーを4つのヌクレオチド認識配列を用いて設計した。この認識配列は、個々のBAC座標に対するすべての配列のデコンボリューションを容易にするのに必要である。
使用したEcoRI+0プライマー及びMseI+0プライマーの両方は、5’認識配列を担持するアダプタ適合性の5’リン酸化プライマーであり、各プール座標で異なる(図4を参照されたい)。5’リン酸化は、ピロシークエンシングアダプタのライゲーションに必要である。94℃(30秒)、56℃(60秒)、72℃(60秒)のプロファイル30サイクルで増幅を行った。増幅後、産物をアガロースゲル上で確認し(図4)、各グループの増幅したプール産物12個をグループプール(AB cq. XY)にプールするとともに定量した。すぐに各グループプールのDNA 5μgを454 Life Sciencesのシークエンシングのためにさらなる調製工程で処理した。Margulies et al.(2005)に従ってGS20プラットフォームで454 Life Sciencesのピロシークエンシングを行った。
BACコンティグのデータセット及びアセンブリの解析
GS20ピロシークエンシング機によって得られるDNA配列の読み取り表は、3つの工程で解析した:
工程1)プール試料コードから成る最初の4つのヌクレオチドを同定し、対応するプール標識を割り当てた。コードが未知であった場合、このセットから、この読み取りを除いた。
GS20ピロシークエンシング機によって得られるDNA配列の読み取り表は、3つの工程で解析した:
工程1)プール試料コードから成る最初の4つのヌクレオチドを同定し、対応するプール標識を割り当てた。コードが未知であった場合、このセットから、この読み取りを除いた。
工程2)次のプライマー配列を含有する16個又は17個のヌクレオチド(制限酵素に依存する)を同定した。プライマー配列と100%同一であった場合、読み取りを承認して、データセットに加え、そうでなければ除いた。
工程3)工程2のすべての読み取りをプライマー配列後の14個のヌクレオチドに対してトリミングした。
その後、正確にトリミングした配列の読み取りをすべてクループ化した。100%同一な読み取りをすべて同定し、それらを対応するプールに割り当てた。各一意の読み取りグループを「タグ」と呼ぶ。ちょうど2つのプールで見出されたタグ(X座標に関するタグ及びY座標に関するタグの両方)を特異的なBACと結び付けた。この手順はデコンボリューションと呼ぶ。
両方のBACグループに関して、デコンボリューションしたBACに対する一意のタグをすべて列挙した。1つ又は複数の共通のタグを有するBAC対を同定した。その後、BACコンティグを表3に示されるようにアセンブリすることができた。
1.8Mb、1.2Mb、0.5Mb及び1.9Mbの4つのBACの最小タイリングパスが、個々のBACに対する配列タグのデコンボリューション後に直接的な方法で再アセンブリことができることが実証された(表1及び図4)。作製したGS20タグと、コンピュータ内で予測した断片との比較は、EcoRI/MseI断片の70%〜80%がシークエンシングされたことを示した。したがって、4つのBACコンティグを再アセンブリする際に、2つのBAC間で幾つかの小さい物理的重複は検出することができなかった。
短い読み取り(14bp)が、BACタイリングパスを再アセンブリするのには十分であるということは、短い読み取り長を有するハイスループットシークエンシングプラットフォーム(例えばIlluminaのゲノム分析器及びSOliD(ABI))が、提唱された方法に従って、ハイスループットな物理地図のアセンブリを可能にすることを示す。
Claims (14)
- ゲノムの少なくとも一部の物理地図を作製する方法であって、
(a)試料DNAを準備する工程と、
(b)各々が前記試料DNAの一部を含有する人工染色体(BAC、YAC)のクローンのバンクを作製する工程と、
(c)前記人工染色体のクローンであって、各クローンは2つ以上のプールに存在する前記クローンを、複数のプールで組合せる工程であって、ライブラリを作製する、組合せる工程と、
(d)前記1つ又は複数のプールを1つ又は複数の制限エンドヌクレアーゼで消化し、各プールに対して制限断片の組が得られる、消化する工程と、
(e)前記制限断片の片側又は両側にアダプタをライゲートする工程であって、前記アダプタの少なくとも1つが、プール特異的識別子区間を含有することでアダプタとライゲートした制限断片を得るライゲートする工程と、
(f)任意選択で、前記アダプタとライゲートした制限断片を組合せる工程と、
(g)工程(e)の前記アダプタとライゲートした制限断片を、それぞれが該アダプタの前記プール特異的識別子区間に対応するプール特異的区間を含有するか、又は前記縮合識別子区間の位置でプール特異的識別子を含有する少なくとも1つのプライマーで増幅し、増幅したアダプタとライゲートした制限断片である単位複製配列が得られる増幅する工程と、
(h)任意選択で、前記単位複製配列を組合せて組合せた単位複製配列の組を得る工程と、
(i)少なくとも前記プール特異的識別子、及び前記単位複製配列の制限断片部分又は組合せた単位複製配列の組の配列を決定する工程と、
(j)前記プール特異的識別子を使用して、対応するクローンに対して、工程(i)の前記単位複製配列で決定される前記制限断片配列を割り当てる工程と、
(k)同じクローン由来の前記制限断片の順番を決定し、コンティグを構築する、順番を決定する工程と、
(l)工程(k)の前記クローンのコンティグの順番を決定し、それによって、クローン−コンティグを構築し、物理地図を作製する、順番を決定する工程とを含む、ゲノムの少なくとも一部の物理地図を作製する方法。 - 制限断片の一部で同一の配列を含有するが、異なるプール特異的識別子を担持する単位複製配列をクラスタリングすることによって、該制限断片が前記対応するクローンに割り当てられる、請求項1に記載の方法。
- 前記シークエンシングが、ハイスループットシークエンシングによって行われる、請求項1に記載の方法。
- 前記ハイスループットシークエンシングが固体支持体上で行われる、請求項3に記載の方法。
- 前記ハイスループットシークエンシングが合成時解読(Sequencing-by-Synthesis)に基づく、請求項3に記載の方法。
- 前記ハイスループットシークエンシングが、
前記単位複製配列又は前記アダプタとライゲートした制限断片を、ビーズにアニーリングする工程であって、各ビーズは、単一のアダプタとライゲートした制限断片又は単位複製配列とアニーリングする工程と、
前記ビーズを各油中水型マイクロリアクタが単一のビーズを含むように、前記油中水型マイクロリアクタ中で乳化させる工程と、
エマルションPCRを実施し、前記アダプタとライゲートした制限断片又は前記単位複製配列を前記ビーズ表面上で増幅する、実施する工程と、
任意選択で、増幅した単位複製配列を含有するビーズを選択/濃縮する工程と、
前記ビーズを各ウェルが単一のビーズを含むように前記ウェルに充填する工程と、
ピロリン酸シグナルを発生させる工程とを含む、請求項3に記載の方法。 - 前記ハイスループットシークエンシングが、
前記アダプタとライゲートした制限断片又は前記単位複製配列を、第1のプライマー及び第2のプライマー又は第1のプライマー結合配列及び第2のプライマー結合配列をそれぞれ含有する表面にアニーリングする工程と、
架橋増幅を実施し、増幅したアダプタとライゲートした制限断片又は増幅した単位複製配列のクラスタが得られる、実施する工程と、
標識した可逆性終止ヌクレオチドを使用して、前記増幅したアダプタとライゲートした制限断片又は前記増幅した単位複製配列のヌクレオチド配列を決定する工程とを含む、請求項3に記載の方法。 - 前記識別子が、4bp〜16bp、好ましくは4bp〜10bp、より好ましくは4bp〜8bp、最も好ましくは4bp〜6bpである、請求項1に記載の方法。
- 前記識別子が2つ以上の同一の連続塩基を含有しない、請求項8に記載の方法。
- 2つ以上のクローンに対して、前記対応する識別子が、少なくとも2つの異なるヌクレオチドを含有する、請求項8に記載の方法。
- 前記少なくとも1つのプライマーが、その3’末端で1個〜10個、好ましくは1個〜4個の選択的ヌクレオチドを担持し、単位複製配列のランダムサブセットが得られる、請求項1〜10のいずれか一項に記載の方法。
- 請求項1に記載のプライマーを1つ又は複数含むキット。
- 請求項1に記載のアダプタを1つ又は複数含むキット。
- 請求項1に記載のプライマー及びアダプタを含むキット。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US83012106P | 2006-07-12 | 2006-07-12 | |
US60/830,121 | 2006-07-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009519391A Division JP5491177B2 (ja) | 2006-07-12 | 2007-07-10 | ゲノムの少なくとも一部の物理地図を作製する方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014064578A true JP2014064578A (ja) | 2014-04-17 |
Family
ID=38572835
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009519391A Expired - Fee Related JP5491177B2 (ja) | 2006-07-12 | 2007-07-10 | ゲノムの少なくとも一部の物理地図を作製する方法 |
JP2013124744A Expired - Fee Related JP5801349B2 (ja) | 2006-07-12 | 2013-06-13 | 制限断片のクローン源を識別するための方法 |
JP2013230904A Withdrawn JP2014064578A (ja) | 2006-07-12 | 2013-11-07 | Aflpを使用したハイスループット物理地図 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009519391A Expired - Fee Related JP5491177B2 (ja) | 2006-07-12 | 2007-07-10 | ゲノムの少なくとも一部の物理地図を作製する方法 |
JP2013124744A Expired - Fee Related JP5801349B2 (ja) | 2006-07-12 | 2013-06-13 | 制限断片のクローン源を識別するための方法 |
Country Status (10)
Country | Link |
---|---|
US (6) | US8178300B2 (ja) |
EP (4) | EP2275576B1 (ja) |
JP (3) | JP5491177B2 (ja) |
CN (2) | CN103333949B (ja) |
AT (1) | ATE481506T1 (ja) |
DE (1) | DE602007009233D1 (ja) |
DK (1) | DK2038425T3 (ja) |
ES (1) | ES2352987T3 (ja) |
PL (1) | PL2038425T3 (ja) |
WO (1) | WO2008007951A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2121983A2 (en) | 2007-02-02 | 2009-11-25 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
EP2379751B1 (en) | 2009-01-13 | 2013-03-20 | Keygene N.V. | Novel genome sequencing strategies |
EP2248914A1 (en) * | 2009-05-05 | 2010-11-10 | Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. | The use of class IIB restriction endonucleases in 2nd generation sequencing applications |
WO2011071382A1 (en) | 2009-12-10 | 2011-06-16 | Keygene N.V. | Polymorfphic whole genome profiling |
CA2783548A1 (en) | 2009-12-17 | 2011-06-23 | Keygene N.V. | Restriction enzyme based whole genome sequencing |
WO2012008831A1 (en) | 2010-07-13 | 2012-01-19 | Keygene N.V. | Simplified de novo physical map generation from clone libraries |
US9029103B2 (en) | 2010-08-27 | 2015-05-12 | Illumina Cambridge Limited | Methods for sequencing polynucleotides |
CN101967684B (zh) * | 2010-09-01 | 2013-02-27 | 深圳华大基因科技有限公司 | 一种测序文库及其制备方法、一种末端测序方法和装置 |
WO2014047561A1 (en) | 2012-09-21 | 2014-03-27 | The Broad Institute Inc. | Compositions and methods for labeling of agents |
EP2898071A4 (en) * | 2012-09-21 | 2016-07-20 | Broad Inst Inc | COMPOSITIONS AND METHODS FOR LONG-TERM LABORATORIES AND PREPARED END OF NUCLEIC ACIDS IN EMULSION DROPS |
WO2014129894A1 (en) * | 2013-02-19 | 2014-08-28 | Cergentis B.V. | Sequencing strategies for genomic regions of interest |
WO2014143158A1 (en) * | 2013-03-13 | 2014-09-18 | The Broad Institute, Inc. | Compositions and methods for labeling of agents |
DE102014200446B3 (de) * | 2014-01-13 | 2015-01-08 | Technische Universität Dresden | Verfahren zur Dekonvolution Nukleinsäure enthaltender Substanzgemische |
US20180016631A1 (en) * | 2014-12-24 | 2018-01-18 | Keygene N.V. | Backbone mediated mate pair sequencing |
US11326159B2 (en) | 2015-04-06 | 2022-05-10 | The Regents Of The University Of California | Methods and compositions for long-range haplotype phasing |
EP3187040A1 (en) | 2015-12-30 | 2017-07-05 | Vilmorin et Cie | Resistance to tolcndv in melons |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100321510B1 (ko) | 1991-09-24 | 2005-01-10 | 키진 엔.브이. | 선택적인 제한단편의 증폭:디엔에이(dna) 핑거프린트법 |
US20100267023A1 (en) | 1992-09-24 | 2010-10-21 | Keygene N.V. | Selective restriction fragment amplification: fingerprinting |
GB0002310D0 (en) | 2000-02-01 | 2000-03-22 | Solexa Ltd | Polynucleotide sequencing |
WO2000006770A1 (en) | 1998-07-30 | 2000-02-10 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US6480791B1 (en) | 1998-10-28 | 2002-11-12 | Michael P. Strathmann | Parallel methods for genomic analysis |
JP2002529715A (ja) | 1998-11-06 | 2002-09-10 | ソレックサ リミテッド | 分子アレイを複製する方法 |
AU3567900A (en) | 1999-03-30 | 2000-10-16 | Solexa Ltd. | Polynucleotide sequencing |
AU7537200A (en) | 1999-09-29 | 2001-04-30 | Solexa Ltd. | Polynucleotide sequencing |
GB0002389D0 (en) | 2000-02-02 | 2000-03-22 | Solexa Ltd | Molecular arrays |
ATE374259T1 (de) | 2001-01-30 | 2007-10-15 | Solexa Ltd | Herstellung von matrizen aus polynukleotiden |
WO2003004690A2 (en) | 2001-07-06 | 2003-01-16 | 454$m(3) CORPORATION | Method for isolation of independent, parallel chemical micro-reactions using a porous filter |
GB0119719D0 (en) | 2001-08-13 | 2001-10-03 | Solexa Ltd | DNA sequence analysis |
US6975943B2 (en) | 2001-09-24 | 2005-12-13 | Seqwright, Inc. | Clone-array pooled shotgun strategy for nucleic acid sequencing |
US6902921B2 (en) | 2001-10-30 | 2005-06-07 | 454 Corporation | Sulfurylase-luciferase fusion proteins and thermostable sulfurylase |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
EP3438116B1 (en) | 2002-08-23 | 2021-02-17 | Illumina Cambridge Limited | Labelled nucleotides |
GB2395954A (en) | 2002-08-23 | 2004-06-09 | Solexa Ltd | Modified nucleotides |
US20060094016A1 (en) | 2002-12-02 | 2006-05-04 | Niall Gormley | Determination of methylation of nucleic acid sequences |
WO2004063323A2 (en) | 2003-01-10 | 2004-07-29 | Keygene N.V. | Aflp-based method for integrating physical and genetic maps |
ATE437945T1 (de) | 2003-01-29 | 2009-08-15 | 454 Corp | Verfahren zur amplifikation und sequenzierung von nukleinsäuren |
GB0304371D0 (en) | 2003-02-26 | 2003-04-02 | Solexa Ltd | DNA Sequence analysis |
GB0320059D0 (en) | 2003-08-27 | 2003-10-01 | Solexa Ltd | A method of sequencing |
GB0326073D0 (en) | 2003-11-07 | 2003-12-10 | Solexa Ltd | Improvements in or relating to polynucleotide arrays |
EP2789383B1 (en) | 2004-01-07 | 2023-05-03 | Illumina Cambridge Limited | Molecular arrays |
GB0400584D0 (en) | 2004-01-12 | 2004-02-11 | Solexa Ltd | Nucleic acid chacterisation |
GB0400974D0 (en) | 2004-01-16 | 2004-02-18 | Solexa Ltd | Multiple inexact matching |
GB0402895D0 (en) | 2004-02-10 | 2004-03-17 | Solexa Ltd | Arrayed polynucleotides |
WO2006137734A1 (en) * | 2005-06-23 | 2006-12-28 | Keygene N.V. | Improved strategies for sequencing complex genomes using high throughput sequencing technologies |
-
2007
- 2007-07-10 EP EP10176619.4A patent/EP2275576B1/en not_active Not-in-force
- 2007-07-10 WO PCT/NL2007/000177 patent/WO2008007951A1/en active Application Filing
- 2007-07-10 PL PL07768906T patent/PL2038425T3/pl unknown
- 2007-07-10 DE DE602007009233T patent/DE602007009233D1/de active Active
- 2007-07-10 AT AT07768906T patent/ATE481506T1/de not_active IP Right Cessation
- 2007-07-10 EP EP07768906A patent/EP2038425B1/en not_active Not-in-force
- 2007-07-10 ES ES07768906T patent/ES2352987T3/es active Active
- 2007-07-10 JP JP2009519391A patent/JP5491177B2/ja not_active Expired - Fee Related
- 2007-07-10 CN CN201310174221.6A patent/CN103333949B/zh not_active Expired - Fee Related
- 2007-07-10 DK DK07768906.5T patent/DK2038425T3/da active
- 2007-07-10 EP EP14183919.1A patent/EP2821506A1/en not_active Withdrawn
- 2007-07-10 CN CN200780025146XA patent/CN101484589B/zh not_active Expired - Fee Related
- 2007-07-10 US US12/373,220 patent/US8178300B2/en not_active Expired - Fee Related
- 2007-07-10 EP EP10153477.4A patent/EP2182079B1/en not_active Not-in-force
-
2012
- 2012-01-05 US US13/344,162 patent/US8394591B2/en not_active Expired - Fee Related
-
2013
- 2013-03-04 US US13/783,601 patent/US8685650B2/en not_active Expired - Fee Related
- 2013-06-13 JP JP2013124744A patent/JP5801349B2/ja not_active Expired - Fee Related
- 2013-11-07 JP JP2013230904A patent/JP2014064578A/ja not_active Withdrawn
-
2014
- 2014-03-19 US US14/219,931 patent/US8975028B2/en not_active Expired - Fee Related
-
2015
- 2015-02-04 US US14/613,849 patent/US9284606B2/en not_active Expired - Fee Related
-
2016
- 2016-02-03 US US15/014,642 patent/US20160251713A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
CN101484589B (zh) | 2013-08-14 |
JP2009542256A (ja) | 2009-12-03 |
US9284606B2 (en) | 2016-03-15 |
JP5801349B2 (ja) | 2015-10-28 |
US8685650B2 (en) | 2014-04-01 |
US20140206551A1 (en) | 2014-07-24 |
EP2275576B1 (en) | 2013-09-04 |
US8394591B2 (en) | 2013-03-12 |
CN103333949B (zh) | 2015-05-06 |
EP2821506A1 (en) | 2015-01-07 |
EP2182079A1 (en) | 2010-05-05 |
US20160251713A1 (en) | 2016-09-01 |
WO2008007951A1 (en) | 2008-01-17 |
US20150148241A1 (en) | 2015-05-28 |
ATE481506T1 (de) | 2010-10-15 |
DE602007009233D1 (de) | 2010-10-28 |
CN101484589A (zh) | 2009-07-15 |
JP2013223502A (ja) | 2013-10-31 |
US8178300B2 (en) | 2012-05-15 |
ES2352987T3 (es) | 2011-02-24 |
US8975028B2 (en) | 2015-03-10 |
DK2038425T3 (da) | 2010-12-06 |
PL2038425T3 (pl) | 2011-03-31 |
EP2275576A1 (en) | 2011-01-19 |
JP5491177B2 (ja) | 2014-05-14 |
EP2038425A1 (en) | 2009-03-25 |
US20120108442A1 (en) | 2012-05-03 |
US20130184166A1 (en) | 2013-07-18 |
US20090246780A1 (en) | 2009-10-01 |
EP2038425B1 (en) | 2010-09-15 |
EP2182079B1 (en) | 2014-09-10 |
CN103333949A (zh) | 2013-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5801349B2 (ja) | 制限断片のクローン源を識別するための方法 | |
EP2427569B1 (en) | The use of class iib restriction endonucleases in 2nd generation sequencing applications | |
AU2010330936B2 (en) | Restriction enzyme based whole genome sequencing | |
EP2379751B1 (en) | Novel genome sequencing strategies | |
US20160194699A1 (en) | Molecular coding for analysis of composition of macromolecules and molecular complexes | |
WO2009106308A2 (en) | System and method for improved processing of nucleic acids for production of sequencable libraries | |
Good | Reduced representation methods for subgenomic enrichment and next-generation sequencing | |
US20200102612A1 (en) | Method for identifying the source of an amplicon | |
CN117222737A (zh) | 用于测序文库制备的方法和组合物 | |
US20150329906A1 (en) | Novel genome sequencing strategies | |
WO2011071382A1 (en) | Polymorfphic whole genome profiling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20140319 |