JP2012507990A - 正確な配列データおよび修飾塩基位置決定の方法 - Google Patents

正確な配列データおよび修飾塩基位置決定の方法 Download PDF

Info

Publication number
JP2012507990A
JP2012507990A JP2011534995A JP2011534995A JP2012507990A JP 2012507990 A JP2012507990 A JP 2012507990A JP 2011534995 A JP2011534995 A JP 2011534995A JP 2011534995 A JP2011534995 A JP 2011534995A JP 2012507990 A JP2012507990 A JP 2012507990A
Authority
JP
Japan
Prior art keywords
sequence
nucleic acid
acid sample
molecule
insert
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011534995A
Other languages
English (en)
Other versions
JP5483628B2 (ja
Inventor
パン,チャオ−チ
ファン,ジェン−イエ
チュウ,チュン−ファン
チェン,フン−チ
チェン,フイ−リン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial Technology Research Institute ITRI
Original Assignee
Industrial Technology Research Institute ITRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=42152512&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2012507990(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Industrial Technology Research Institute ITRI filed Critical Industrial Technology Research Institute ITRI
Publication of JP2012507990A publication Critical patent/JP2012507990A/ja
Application granted granted Critical
Publication of JP5483628B2 publication Critical patent/JP5483628B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

既知の配列を持つ核酸インサートを有する環状分子中に含まれる核酸試料の配列および/または修飾塩基の位置を決定する方法であって、少なくとも2組のインサート−試料ユニットの配列データを得ることを含む方法が開示されている。いくつかの実施形態において、該方法は、環状ペアロック分子を用いて配列データを得ることを含む。いくつかの実施形態において、該方法は、核酸インサートの配列のスコアを、該配列を核酸インサートの既知の配列と比較することにより計算すること、および核酸試料の配列のリピートのすぐ上流または下流にあるインサートの配列の一方または両方のスコアにしたがって、核酸試料の配列のリピートを受け入れるか、あるいは拒否することを含む。

Description

本発明は、核酸の配列を決定する方法および核酸中の修飾塩基の位置を同定する方法に関する。
本出願は、2008年11月7日に出願された米国仮特許出願第61/112,548号および2009年4月7日に出願された米国仮特許出願第61/167,313号の利益を主張し、その両方が参照として本明細書に組み込まれる。
最近のDNA配列決定技術の発展は、ゲノムレベルにおける高度に個別化された予防医療の可能性を高めた。さらに、1またはそれ以上の集団内の多数の個体から大量の配列データを迅速に得ることの可能性は、生物医科学において、ゲノミクス革命の新風を吹き込む。
遺伝子型間の一塩基の違いは、実質的な表現型効果を生じ得る。例えば、酵素活性欠損を生じさせ、かつ高フェニルアラニン血症やフェニルケトン尿症の疾患を引き起こすフェニルアラニン異化およびタンパク質と神経伝達物質との生合成において、フェニルアラニンをチロシンに変換する酵素であるフェニルアラニンヒドロキシラーゼ(PAH)をエンコードする遺伝子に、300を超える突然変異が確認されている。例えば、非特許文献1を参照されたい。
配列データは、サンガー配列決定法を用いて得ることができ、それにおいては、標識されたジデオキシ鎖ターミネーターヌクレオチド類似体が大量のプライマー伸長反応中に取り込まれ、異なる長さの生成物に分けられ、解析され、取り込まれたターミネーターの同一性が決定される。例えば、非特許文献2を参照されたい。実際に、この技術を用いて、多くのゲノム配列が決定されている。しかし、サンガー配列決定法により配列データを得るコストおよびスピードは、制限されている。
新しい配列決定技術は、1塩基あたりサンガー配列決定法よりも低いコストで、1日に何百ものメガ塩基対という驚異的な速度で配列データを取り出すことができる。例えば、非特許文献3を参照されたい。しかし、これらの配列決定技術を用いて得られる生データは、従来のサンガー配列決定法に比べて、よりエラーが発生しやすい。これは、大量の集団の代わりに個別のDNA分子から情報を得ることに起因する可能性がある。
例えば、合成による単一分子の配列決定においては、装置が弱いシグナルを拾えないことにより、または、蛍光色素の退色により生じるシグナルの欠如により、または、ポリメラーゼが速く作用しすぎて装置に検出され得ないことにより、塩基が抜け落ちることがある。上述した事象の全ては、生配列において欠失のエラーを生じさせる。同様に、変異のエラーおよび挿入のエラーも、おそらくは従来の方法よりも弱いシグナルおよび速い反応という単純な理由によって、より高い頻度で起こり得る。
低い正確度の配列データは、アセンブルするのがより難しい。全真核生物ゲノムの配列決定のような大規模な配列決定では、DNA分子は、より小さな断片に断片化される。これらの断片が並行して配列決定され、次いで、結果として得られた読み取りデータがアセンブルされ、元の試料DNA分子の全配列が再構成される。断片化は、例えば、機械的せん断または酵素的切断によって達成され得る。
配列の小さなリードの大きなゲノムへのアセンブリには、断片化されたリードが正しくグループ化できるほど十分に正確であることが要求される。このことは、生データの正確度が95%より高くなり得るサンガー法により産出される生配列決定データに対しては、概ね当てはまる。正確な単一分子配列決定技術は、単一塩基の修飾または突然変異核酸試料を検出するのに適用できる。しかし、単一分子配列決定技術の生データの正確度は上述した制限のために、より低くなることがある。生配列データの個々のリードの正確度は、60%から80%にまで下がり得る。非特許文献4を参照されたい。したがって、正確な単一分子配列決定法を提供することは有益となるであろう。
また、DNAメチル化は、遺伝子発現の調節において重要な役割を果たす。例えば、プロモーターにおけるメチル化は、しばしば転写サイレンシングを引き起こす。メチル化はまた、遺伝子刷り込みおよびX−染色体の不活化に不可欠なメカニズムとしても知られている。しかし、複雑な全ゲノムのメチル化プロフィール解析の進展は、制限されていた。よって、高スループットにDNAメチル化プロフィールを決定する方法は、有用であろうし、それにもまして、この方法は、正確な配列の決定を提供するはずである。
ジェニングス(Jennings)ら、ヨーロピアン・ジャーナル・オブ・ヒューマン・ジェネティックス(Eur J Hum Genet)8,683−696(2000) サンガー(Sanger)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシズ・オブ・ザ・ユナテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)74,5463−5467(1997) カトウ(Kato)、インターナショナル・ジャーナル・オブ・クリニカル・アンド・エクスペリメンタル・メディスン(Int J Clin Exp Med)2,193−202(2009) ハリス(Harris)ら、サイエンス(Science)320:106−109(2008)
いくつかの実施形態において、本発明は、核酸試料の配列を決定する方法であって、(a)核酸インサートおよび核酸試料を含む少なくとも1組のインサート−試料ユニットを含む環状核酸分子を提供すること、ここで、インサートは既知の配列を有し、(b)少なくとも2組のインサート−試料ユニットの配列を含む配列データを得ること、ここで、少なくとも2組のインサート−試料ユニットを含む核酸分子が生成され、(c)ステップ(b)の配列データの少なくとも2つのインサートの配列のスコアを、該配列をインサートの既知の配列と比較することにより計算すること、(d)核酸試料の配列のリピートのすぐ上流および下流にあるインサートの配列の一方または両方のスコアにしたがって、ステップ(b)の配列データの核酸試料の配列のリピートのうち少なくとも2つを受け入れるか、あるいは拒否すること、(e)ステップ(d)で受け入れられた核酸試料の配列の少なくとも1つのリピートを含む受け入れられた配列セットをコンパイルすること、ならびに(f)受け入れられた配列セットを用いて核酸試料の配列を決定すること、を含む方法を提供する。
いくつかの実施形態において、本発明は、プロセッサ、ストレージ、バスシステム、および少なくとも1つのユーザーインターフェースエレメントを含む計算装置に操作可能に連結された配列決定装置を含むシステムであって、該ストレージが、ユーザーの任意入力により、プロセッサにより実行されるときに、下記の方法を実行するオペレーティングシステム、ユーザーインターフェースソフトウェア、および命令を含む、プログラミングによりエンコードされたものであり、該方法が、(a)核酸インサートおよび核酸試料を含む少なくとも1組のインサート−試料ユニットを含む環状核酸分子から配列データを獲得すること、ここで、(i)インサートが既知の配列を有し、(ii)配列データが少なくとも2組のインサート−試料ユニットの配列を含み、かつ(iii)少なくとも2組のインサート−試料ユニットを含む核酸分子が生成され、(b)ステップ(a)の配列データの少なくとも2つのインサートの配列のスコアを、該配列をインサートの既知の配列と比較することにより計算すること、(c)核酸試料の配列のリピートのすぐ上流および下流にあるインサートの配列の一方または両方のスコアにしたがって、ステップ(a)の配列データの核酸試料の配列のリピートのうちの少なくとも2つを受け入れるか、あるいは拒否すること、(d)ステップ(c)で受け入れられた核酸試料の配列の少なくとも1つのリピートを含む受け入れられた配列セットをコンパイルすること、ならびに(e)受け入れられた配列セットを用いて核酸試料の配列を決定すること、を含み、システムの出力が、(i)核酸試料の配列または(ii)核酸試料中の少なくとも1つの位置に修飾塩基があることの表示のうち少なくとも1つを生じるのに用いられる、システムを提供する。
いくつかの実施形態において、本発明は、ユーザーの任意入力により、プロセッサ、ストレージ、バスシステム、および少なくとも1つのユーザーインターフェースエレメントを含む計算装置に操作可能に連結された配列決定装置を含むシステム上のプロセッサにより実行されるときに、下記の方法を実行するオペレーティングシステム、ユーザーインターフェースソフトウェア、および命令を含むプログラミングによりエンコードされたストレージであって、該方法が、(a)核酸インサートおよび核酸試料を含む少なくとも1組のインサート−試料ユニットを含む環状核酸分子から配列データを獲得すること、ここで、(i)インサートが既知の配列を有し、(ii)配列データが少なくとも2組のインサート−試料ユニットの配列を含み、かつ(iii)少なくとも2組のインサート−試料ユニットを含む核酸分子が生成され、(b)ステップ(a)の配列データの少なくとも2つのインサートの配列のスコアを、該配列をインサートの既知の配列と比較することにより計算すること、(c)核酸試料の配列のリピートのすぐ上流および下流にあるインサートの配列の一方または両方のスコアにしたがって、ステップ(a)の配列データの核酸試料の配列のリピートの少なくとも2つを受け入れるか、あるいは拒否すること、(d)ステップ(c)で受け入れられた核酸試料の配列の少なくとも1つのリピートを含む受け入れられた配列セットをコンパイルすること、ならびに(e)受け入れられた配列セットを用いて核酸試料の配列を決定すること、を含み、該方法により、(i)核酸試料の配列、または(ii)核酸試料中の少なくとも1つの位置に修飾塩基があることの表示のうち少なくとも1つを生じるのに用いられる出力が生じることとなるストレージを提供する。
いくつかの実施形態において、本発明は、二本鎖核酸試料の配列および配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、(a)フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、(b)単一分子配列決定により環状ペアロック分子の配列データを得ること、ここで、配列データは、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を含み、(c)環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列を決定すること、(d)環状ペアロック分子の特定タイプの塩基の塩基対合特異性を変えて、変化した環状ペアロック分子を生成すること、(e)変化した環状ペアロック分子の配列データを得ること、ここで、配列データは変化したフォワード鎖およびリバース鎖の配列を含み、ならびに(f)変化したフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列中の修飾塩基の位置を決定すること、を含む方法を提供する。
いくつかの実施形態において、本発明は、二本鎖核酸試料の配列を決定する方法であって、(a)核酸試料のフォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、(b)単一分子配列決定により環状ペアロック分子の配列データを得ること、ここで、配列データは、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を含み、ならびに(c)環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列を決定すること、を含む方法を提供する。
いくつかの実施形態において、本発明は、二本鎖核酸試料の配列および配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、(a)核酸試料のフォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、(b)単一分子配列決定により環状ペアロック分子の配列データを得ること、ここで、配列データは、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を含み、ならびに(c)環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列および二本鎖核酸試料の配列中の少なくとも1つの修飾塩基の位置を決定すること、を含む方法を提供する。
いくつかの実施形態において、本発明は、二本鎖核酸試料の配列および配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、(a)核酸試料のフォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、(b)環状ペアロック分子中の特定タイプの塩基の塩基対合特異性を変化させること、(c)単一分子配列決定により環状ペアロック分子の配列データを得ること、ここで、配列データは、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を含み、ならびに(d)環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列および二本鎖核酸試料の配列中の少なくとも1つの修飾塩基の位置を決定すること、を含む方法を提供する。
いくつかの実施形態において、本発明は、二本鎖核酸試料の配列および配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、(a)フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、(b)単一分子配列決定により環状ペアロック分子の配列データを得ること、ここで、配列データは、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を含み、(c)環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列を決定すること、(d)単一分子配列決定により環状ペアロック分子の配列決定データを得ること、このうち、塩基とその修飾型を区別する少なくとも1つのヌクレオチド類似体が、少なくとも1つの異なるように標識されたヌクレオチド類似体が取り込まれた少なくとも1つの位置を含む配列データを得るために用いられ、ならびに(e)フォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列中の修飾塩基の位置を決定すること、を含む方法を提供する。
いくつかの実施形態において、本発明は、二本鎖核酸試料の配列および配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、(a)核酸試料のフォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、(b)単一分子配列決定により環状ペアロック分子の配列データを得ること、ここで、塩基とその修飾型を区別する少なくとも1つのヌクレオチド類似体が、少なくとも1つの異なるように標識されたヌクレオチド類似体が取り込まれた少なくとも1つの位置を含む配列データを得るために用いられ、ならびに(c)環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することによって二本鎖核酸試料の配列および二本鎖核酸試料の配列中の少なくとも1つの修飾塩基の位置を決定すること、を含む方法を提供する。
本発明のさらなる目的および長所は、一部は以下に続く説明中に記載されており、一部は説明から明らかとなり、または本発明の実施により知ることができる。本発明の目的および長所は、添付のクレームにおいて具体的に挙げられる要素および組み合わせによって実現および達成される。
上述の概略的な記載および以下の詳細な説明は、いずれも例示的および説明的なものにすぎず、特許請求の範囲に係る発明を限定するものではないことが理解される。
この明細書に組み込まれかつその一部を成す添付の図面は、説明と共に本発明のいくつかの実施形態を例示し、本発明の原理を説明するのに役立つものとなる。
上述したこの発明の態様および長所は、以下のような添付の図面を参照にして、以下の詳細な説明から明らかとなり得る。
本発明のいくつかの実施形態に基づく環状DNA分子の作製である。DNA試料1が断片化される。断片2は、その5’末端(菱形)にてリンカー3に、その3’末端(矢じり形)にて別のリンカー4にライゲートされる。リンカー3および4は、隣接するオリゴヌクレオチド5のセグメントに相補的である。5の3および4へのアニーリングは、ライゲーションによる環状化の基質を提供し、その反応の結果として、(リンカー3および4の配列からの)核酸インサートならびに(フラグメント2の配列からの)核酸試料を含む環状分子6が生じる。 ローリングサークル型の増幅である。図1におけるように生成された環状分子6にアニールされたオリゴヌクレオチド5が、表面8に固定されたポリメラーゼ7に結合される。オリゴヌクレオチドの伸長により、環状分子の相補的な線状コピー9が得られる。引き続いての伸長により、環状分子の多数のコピーを含む分子10の鎖置換と合成が生じることとなる。 環状ペアロック分子である。(A)フォワード鎖11およびリバース鎖12を含む二本鎖分子は、同じでも同じでなくてもよいヘアピン13および14を形成するインサートに結合して、環状ペアロック分子が形成され得る。いくつかの実施形態において、リンカーはオーバーハングおよび陥凹末端(37および38)を有する。これらは、ポリメラーゼを用いて充填され得るか、あるいは二本鎖分子中のオーバーハング(図示せず)に相補的であり得る。完全な環状ペアロック分子において、37および38は、該分子が連続的な、一本鎖の、かつ環状バックボーンを持つように充填されると共に封止される。 環状ペアロック分子である。(B)必要に応じたギャップの充填および末端結合後、ここでは、融解した形式で示される、フォワード鎖11、リンカー14、リバース鎖12、およびリンカー13を含む環状DNAが形成される。この分子は、例えば、プライマーをリンカーのうちの1つにアニーリングし、さらに鎖置換活性を持たないポリメラーゼ、例えば、大腸菌DNAポリメラーゼを用いて、それを伸長し、続いてライゲーションすることによって、二本鎖の形式に変換することができる。 環状ペアロック分子を用いた配列決定ならびに配列およびメチル化プロフィール決定のスキームである。(左)環状ペアロック分子が、少なくとも1の該分子の全長について配列決定され、相補配列のリードが提供される。引き続いての配列決定が、さらなる冗長度を提供するために用いられ得る。配列データは、試料核酸の正確な配列が得られるよう、インサート核酸の配列に基づいて、アライメントされると共に評価され得る。(右)例えば、亜硫酸水素塩変換または光化学的トランジションによる特定タイプのヌクレオチドの変換、その後の変更された配列とその未変更の相補配列の配列決定、アライメント、および比較が、正確な配列データおよびメチル化プロフィールを得るために用いられ得る。試料核酸配列の多数のリピートを含む伸長された配列のリードが、正確度の向上のために用いられ得る。 ヌクレオチド変換である。(A)インサート13および14、少なくとも1つの5−メチルシトシン(C)残基を含むフォワード鎖15、ならびにリバース鎖16を含む環状ペアロック分子が光化学的トランジションのような処理を受け、CがTに変換されることにより、変換されたフォワード鎖17ができる。リバース鎖中の相補ヌクレオチドは影響を受けず、G−Tゆらぎ対ができる。(リバース鎖中のC残基は、存在する場合は、この処理により変換することとなる。) ヌクレオチド変換である。(B)インサート13および14、少なくとも1つの5−メチルシトシン(C)残基を含むフォワード鎖15、ならびにリバース鎖16を含む環状ペアロック分子が亜硫酸水素塩変換のような処理を受け、C(Cではない)がUに変換されることにより、変換されたフォワード鎖39および変換されたリバース鎖40ができる。変換されたヌクレオチドに相補的なヌクレオチドは影響を受けず、G−Uゆらぎ対ができる。 環状ペアロック分子からの配列データおよびメチル化プロフィールの獲得である。(A)プライマー18が図5Aの変換された環状ペアロック分子にアニールされ、さらにポリメラーゼにより伸長されることで、16、14、および17の配列に相補的なセグメント19、20、および21を有する鎖の合成が起こることになる。 環状ペアロック分子からの配列データおよびメチル化プロフィールの獲得である。(B)少なくとも2つのリピート、つまり、試料17のリピートおよび新たに合成されたフォワード鎖21の相補鎖のリピートのうち少なくとも1つ、ならびに新たに合成されたリバース鎖19の相補鎖のリピートおよびリバース鎖16のリピートのうち少なくとも1つ、を含む配列が得られる。これらのリピートはアライメントされる。リピート間で不一致がある位置41は、塩基がその位置で修飾されていることを意味する。用いた修飾のタイプにより、核酸試料の対応する位置に元々存在する塩基が決定され得る。この例では、環状ペアロック分子がCからTへの変換(図5Aを参照)によって修飾された場合、不一致は、Cが位置41のフォワード鎖中の核酸試料に存在したということを表す。この論理は、配列で一致しない位置において、変換反応の生成物である塩基、Tが、核酸試料中に存在していた変換反応の基質、Cに取って代わった、というものである。 環状核酸分子鋳型から得られた生の配列データおよび処理された配列データである。(A)環状鋳型から得ることのできる配列の内容が図示されている。核酸試料の配列はダッシュ記号で示され、核酸インサートの配列は円で示されている。図示された配列は、核酸試料の部分配列22から始まり、核酸インサートの配列23が続く。核酸試料の配列24、核酸インサートの配列25、核酸試料の配列26、および核酸インサートの配列27がこれらに続く。28は、この図に示されていないさらなる配列を表すものであり、核酸インサートの配列29、核酸試料の配列30、核酸インサートの配列31、および核酸試料の部分配列32が続く。環状鋳型が単一の核酸試料および単一の核酸インサートを含む場合、22および24の両方は、後続の核酸試料配列26、30、および32と共に、同じ単一の核酸試料の配列である。同様に、この場合において、23、25、27、29、および31は同じ単一の核酸インサートの配列である。環状鋳型が、環状ペアロック分子のケースのように、核酸試料の配列のフォワードリピートおよびリバースリピートならびに同じでも同じでなくてもよい既知の配列を持つ2つの核酸インサートを含む場合、核酸試料の配列は、互い違いの方向を有し、かつ互い違いの形式で2つの核酸試料のリピートに対応する(例えば、22はフォワード方向であり得る、つまりそれはリバースリピートの配列であるということを意味し、かつ24はリバース方向であり得る、つまり、それはフォワードリピートの配列であるということを意味し、またはその逆も同様である)。同様に、核酸インサートの配列23、25なども、環状鋳型の、同じでも同じでなくてもよい2つの核酸インサートと互い違いの形式で対応することとなる。 環状核酸分子鋳型から得られた生の配列データおよび処理された配列データである。(B)図7Aに示される配列は、各々が核酸試料の配列のリピート、例えば、24を含むセグメントに分解することができる。それらセグメントは、核酸インサートの少なくとも1つのリピート、例えば核酸インサートの2つのリピート、例えば23および25も含む。一部のセグメントは、部分配列、例えば33だけ、または非常に長い配列、例えば、34を含む場合がある。かかるセグメントは、配列決定時におけるエラーによって生じ得る。いくつかの実施形態において、かかるセグメントについては、さらなる検討は加えない。 配列処理ステップの図である。いくつかの実施形態において、図示されるように、生配列データが検査され、処理され、そして、受け入れられるか、あるいは拒否される。 ローリングサークル型の増幅産物である。実施例1において記載した反応の生成物に電気泳動がかけられ、かつゲルが記載したように可視化されている。左から、C1およびC2は、陰性コントロールレーンである。最も左のMrレーンは、バンドの大きさが250から10000bpであるファーメンタス・ジェネルーラー(FERMENTAS GENERULER)1kbラダー、カタログ番号SM0311を含む。次の10レーンは、2つのプライマーまたは1つのプライマーを用いて生成された、示されたようなローリングサークル型増幅反応の生成物(増幅コントロール)、および表示された時間に取り出されたL0(陰性ライゲーションコントロール)またはL3反応のライゲーション反応の生成物を含む。実施例1を参照されたい。次のMrレーンは、バンドの大きさが100から3000bpであるファーメンタス・ジェネルーラー100bpプラス・ラダー、カタログ番号SM0321を含む。次の10レーンは、それら生成物が1%SDS含有の負荷色素と混合されていることを除いて、前の10の生成物のレーンと同じ生成物を含む。 シミュレートされた核酸試料のリピート配列および推定された元の配列を示すアライメントである。全てのアライメントされた配列が一致する位置は、アスタリスクでマークされている。(A)実施例2のリードaおよびbが、核酸試料のフォワード鎖の、「o」で表示された推定された元の配列と共に示されている。元の配列は、表5に示されるルールを用いて推定されたものである。示された3つの全ての配列がCを有する位置は、シミュレートされた核酸試料がフォワード鎖中にメチル化シトシンを含んだ位置である。示された3つの全ての配列がGを有する位置は、シミュレートされた核酸試料がリバース鎖中にメチル化シトシンを含んだ位置である。 シミュレートされた核酸試料のリピート配列および推定された元の配列を示すアライメントである。全てのアライメントされた配列が一致する位置は、アスタリスクでマークされている。(B)実施例3のリードaおよびbが、「r_a」で表示された、フォワード鎖の推定された元の配列と共に示されている。元の配列は、表6のルールを用いて推定されたものである。推定された元の配列がリードaと一致しないCを有する位置は、シミュレートされた核酸試料がフォワード鎖中にメチル化シトシンを含んだ位置である。推定された元の配列がリードbと一致しないGを有する位置は、シミュレートされた核酸試料がリバース鎖中にメチル化シトシンを含んだ位置である。 計算装置およびストレージである。(A)いくつかの実施形態において、本発明は、ディスプレイ57、キーボード58、およびマウス59から選択された少なくとも1つのユーザーインターフェースエレメント、ならびに、ストレージ54(パネルB参照)、バスシステム55、およびプロセッサ56を含む少なくとも1つのコンピュータ53を含む計算装置52に操作可能に連結された配列決定装置51に関する。 計算装置およびストレージである。(B)いくつかの実施形態において、本発明は、オペレーティングシステム60、ユーザーインターフェースソフトウェア61、およびプロセッシングソフトウェア62を含むストレージ54に関する。ストレージは、配列決定装置(図11Aにおける51)から得られる配列データ63をさらに含んでいてもよい。 線状ペアロック分子を用いた、亜硫酸水素塩変換を利用する配列決定および5−メチルシトシンの位置決定に関する一般スキームである。5−メチルシトシンを含む二本鎖核酸試料が提供される(最上部)。線状ペアロック分子は、ヘアピンインサートを分子の一方の二本鎖末端へライゲートすることにより構築され(最初の矢印の下方、右側)、これにより、二本鎖試料のフォワード鎖およびリバース鎖がロックされることとなる。また、線状フラップが、他方の二本鎖末端に付着する(左側)。亜硫酸水素塩変換が実行されて、シトシンがウラシルに変換されるが、5−メチルシトシンは影響を受けないままである。分子は、線状ペアロック分子の3’末端に付着した線状フラップに結合するプライマーを提供すること、およびポリメラーゼによりプライマーを伸長させることによってコピーされる。末端が、例えば、制限消化により処理されて、後続のクローニングおよび/または配列決定のために分子が作製される。 線状ペアロック分子を用いた、光化学的トランジションを利用する配列決定および5−メチルシトシンの位置決定に関する一般スキームである。5−メチルシトシンを含む二本鎖核酸試料が提供される(最上部)。線状ペアロック分子は、ヘアピンインサートを分子の一方の二本鎖末端へライゲートすることにより構築され(最初の矢印の下方、右側)、これにより、二本鎖試料のフォワード鎖およびリバース鎖がロックされることとなる。また、線状フラップが、他方の二本鎖末端に付着する(左側)。光化学的トランジションが実行されて、5−メチルシトシンがチミンに変換されるが、未修飾シトシンは影響を受けないままである。分子は、線状ペアロック分子の3’末端に付着した線状フラップに結合するプライマーを提供すること、およびポリメラーゼによりプライマーを伸長させることによってコピーされる。末端が、例えば、制限消化により処理されて、後続のクローニングおよび/または配列決定のために分子が作製される。 環状ペアロック分子を用いた配列決定に関する一般スキームである。二本鎖核酸試料が提供される(最上部)。環状ペアロック分子は、ヘアピンインサートを分子の両方の二本鎖末端へライゲートすることにより構築され(最初の矢印の下方、右側および左側)、これにより、二本鎖試料のフォワード鎖およびリバース鎖がロックされることとなる。配列決定が実行され、その配列データが分析されて試料の配列が決定される。例えば、実施例5を参照されたい。 亜硫酸水素塩変換および環状ペアロック分子を用いた、配列決定および5−メチルシトシンの位置決定に関する一般スキームである。5−メチルシトシンを含む二本鎖核酸試料が提供される(最上部)。環状ペアロック分子は、ヘアピンインサートを分子の両方の二本鎖末端へライゲートすることにより構築され(最初の矢印の下方、右側および左側)、これにより、二本鎖試料のフォワード鎖およびリバース鎖がロックされることとなる。亜硫酸水素塩変換が実行されて、シトシンがウラシルに変換されるが、5−メチルシトシンは影響を受けないままである。配列決定が実行され、その配列データが分析されて試料の配列および5−メチルシトシンの位置が決定される。例えば、実施例6を参照されたい。 光化学的トランジションおよび環状ペアロック分子を用いた、配列決定および5−メチルシトシンの位置決定に関する一般スキームである。5−メチルシトシンを含む二本鎖核酸試料が提供される(最上部)。環状ペアロック分子は、ヘアピンインサートを分子の両方の二本鎖末端へライゲートすることにより構築され(最初の矢印の下方、右側および左側)、これにより、二本鎖試料のフォワード鎖およびリバース鎖がロックされることとなる。光化学的トランジションが実行されて、5−メチルシトシンがチミンに変換されるが、未修飾シトシンは影響を受けないままである。配列決定が実行され、その配列データが分析されて試料の配列および5−メチルシトシンの位置が決定される。例えば、実施例7を参照されたい。 環状ペアロック分子を用いた、配列決定および5−ブロモウラシルの位置決定に関する一般スキームである。5−ブロモウラシルを含む二本鎖核酸試料が提供される(最上部)。環状ペアロック分子は、ヘアピンインサートを分子の両方の二本鎖末端へライゲートすることにより構築され(最初の矢印の下方、右側および左側)、これにより、二本鎖試料のフォワード鎖およびリバース鎖がロックされることとなる。配列決定が実行され、その配列データが分析されて試料の配列および5−ブロモウラシルの位置が決定される。例えば、実施例8を参照されたい。
定義
本発明の理解を助けるため、多数の用語を以下に定義する。本明細書において定義されない用語は、本発明に関する分野において通常の技術を有する者に普通に理解されるような意味を持つ。「1つの」および「その」などの用語は、単数の存在のみに言及することが意図されたものではなく、具体例が説明のために用いられ得る一般的な分類をも含む。本明細書中の専門用語は本発明の具体的な実施形態を説明するために用いられるが、特許請求の範囲に記載されている場合を除き、それらの使用が本発明の範囲を定めることはない。
核酸という用語は、オリゴヌクレオチドおよびポリヌクレオチドを含む。
ハイブリダイゼーションの高ストリンジェンシー条件とは、2つの核酸が互いにハイブリダイズするための高度な相同性を備えるはずの条件をいう。ハイブリダイゼーションの高ストリンジェンシー条件の例は、65℃または70℃で、4×塩化ナトリウム/クエン酸ナトリウム(SSC)中におけるハイブリダイゼーション、あるいは、約42℃または50℃で、4×SSCおよび50%ホルムアミド中におけるハイブリダイゼーションを含み、続いて65℃または70℃で、1×SSC中における少なくとも1回、少なくとも2回、もしくは少なくとも3回の洗浄が行われる。
融解温度とは、溶液中の核酸の半分が融解された状態で存在し、半分が融解されていない状態で存在し、これにより十分な相補的核酸の存在が推測される温度をいう。相補配列に対して過剰に存在するオリゴヌクレオチドの場合、融解温度は、相補配列の半分がオリゴヌクレオチドとアニールされる温度である。ヘアピンを形成することのできる核酸インサートの場合は、融解温度は、インサートの半分が部分的に自己ハイブリダイズした「ヘアピン」形となる温度である。融解温度は条件に依存的であるため、ここに述べられるオリゴヌクレオチドの融解温度とは、50mMの塩化ナトリウムの水溶液中、オリゴヌクレオチドが0.5μMのときの融解温度のことをいう。融解温度は、当該分野で知られる各種方法、例えば、アラウィ(Allawi)ら、バイオケミストリー(Biochemistry),36,10581−10594(1997)において見出された最隣接熱力学的パラメータを標準的な熱力学方程式と共に用いることによって、推定することができる。
核酸分子における部位は、それが核酸分子中でユニーク配列を有し、かつ相補的なオリゴヌクレオチドが許容される融解温度、例えば、45℃から70℃、50℃から70℃、45℃から65℃、50℃から65℃、55℃から70 ℃、60℃から70℃、55℃から60℃、60℃から65℃、または50℃から55℃の融解温度を有するような長さおよび組成である場合に、プライマーの結合に適している。
プライマー、オリゴヌクレオチド、または核酸を伸長させるとは、少なくとも1つのヌクレオチドをプライマー、オリゴヌクレオチド、または核酸に加えることをいう。これには、ポリメラーゼまたはリガーゼ活性により触媒される反応が含まれる。
配列決定プライマーは、配列データを産出することとなるように、プライマーの結合に適した核酸分子中の部位に結合でき、かつ配列決定反応において伸長され得るオリゴヌクレオチドである。
核酸インサートは、それが部分的に自己ハイブリダイズでき、かつその自己ハイブリダイズした形態が少なくとも15℃の融解温度を有する場合、ヘアピンを形成することができる。
オーバーハングは、二本鎖核酸分子またはヘアピンの末端における一本鎖のセグメントである。
リピートまたはリピート配列は、核酸中に複数回現れる配列のことである。核酸分子中にリピートが存在する場合、最初の例を含む全ての配列の例がリピートであると見なされる。リピートは、環状ペアロック分子中に現れるような、互いに逆相補配列である配列を含む。リピートはまた、全く同じではないが、同一の配列から派生した配列、例えば、合成時における誤取り込みの事象もしくはその他のポリメラーゼのエラーのために異なる配列、または初めは同じであったもしくは完全な逆相補配列であったが、例えば、光化学的トランジションもしくは亜硫酸水素塩処理のような手段による修飾のために異なる配列をも含む。
核酸インサートおよび核酸試料は、インサートと試料との間に他の介在するインサートまたは試料のリピートがない場合は、互いにすぐ上流または下流にある。一本鎖分子において、上流とは5’方向のことを指し、下流とは3’方向のことを指す。二本鎖分子において、極性は任意に決定され得る、またはプロモーター、コード配列などのような方向要素の大半が同じ方向を向く場合、かかる要素の極性にしたがって決定され得る。プロモーターの極性とは、RNAポリメラーゼの合成を開始する方向が下流に向かうことである。コード配列の極性とは、開始から終止コドンへの方向が下流に向かうことである。
2つのリピートは、それらが互いの逆相補配列である、または一方もしくは両方が互いの逆相補配列の派生配列である場合、互いに対してフォワード方向およびリバース方向となると共に、反対の向きを持つ。どのリピートがフォワードであると見なされるかは、前の段落で述べたように、任意とすることができる、またはリピート中の要素の極性にしたがって決定され得る。
修飾塩基とは、アデニン、チミン、グアニン、シトシン、またはウラシル以外の塩基であって、核酸またはヌクレオチド中に、前述した塩基のうちの1つまたはそれ以上の代わりに含まれ得るものである。
多義性コードとは、表示された塩基のいずれかが現れ得るという意味で、配列における塩基の組み合わせを表すコード、例えば、Y=ピリミジン(C、U、またはT)、R=プリン(AまたはG)、W=弱(A、T、またはU)、S=強(GまたはC)、K=ケト(T、U、またはG)、M=アミノ(CまたはA)、D=Cではない(A、G、T、またはU)、V=TまたはUではない(A、C、またはG)、H=Gではない(A、C、T、またはU)、B=Aではない(C、G、T、またはU)である。
位置特異的重み行列とは、行が核酸配列中の位置に対応し、列が塩基に対応している、またはその逆の行列のことであり、行列中の各要素は、特定の位置における特定の塩基の重みである。配列は、該配列の各塩基に対応する重みを合計することにより、位置特異的重み行列に対してスコアリングされ得る。例えば、配列がACGである場合、そのスコアは、行列の第1の列におけるAの重み、第2の列におけるCの重み、および第3の列におけるGの重みの合計となり、位置に対応した列が推測されることとなる。位置特異的重み行列は、行列における位置の数よりも大きい長さを持つ配列上に、行列に対し配列を繰り返してスコアリングすることにより実行することができ、該行列においては、各ランで開始位置が1位置ずつ増える。このような方法で、行列に対して最大または最小のスコアを生み出す配列中の位置が特定され得る。
ストレージとは、コンピュータによるアクセス可能なデジタル情報の収納場所である。それは、RAM、ROM、ハードドライブ、不揮発性固体メモリ、光ディスク、磁気ディスク、およびこれらの均等物を含む。
データ構造とは、データを含むストレージ内のオブジェクトまたは変数のことである。データ構造は、スカラーデータ(例えば、個々の文字、数、または文字列)、スカラーデータの集合(例えば、スカラーの行列または配列)、または再帰的な集合(例えば、サブリスト、行列、配列、および/またはスカラーを要素として含む多次元的なものであり得るリストであって、該サブリストそれら自体がサブリスト、行列、配列、および/またはスカラーを要素として含むことのできる、リスト)を含んでいてよい。
核酸試料
本発明の方法は、核酸試料の配列を決定すること、および/または、核酸試料中の修飾塩基の位置を決定することを含む。「核酸試料」という用語は、その配列および/または修飾塩基の位置が本発明の方法において決定されることとなる核酸のことをいう。
核酸試料は、DNA(ゲノムDNA、cDNA、mtDNA、葉緑体DNA、および染色体外もしくは細胞外DNAを含むが、これらに限定されるものではない)またはRNA(mRNA、一次転写物RNA、tRNA、rRNA、miRNA、siRNA、およびsnoRNAを含むが、これらに限定されるものではない)を含む起源から得ることができるが、これらに限定されるものではない。核酸試料は、個人、患者、検体、細胞培養物、生体膜、器官、組織、細胞、胞子、動物、植物、真菌、原生生物、細菌、古細菌、ウィルス、またはビリオンからのものであってよい。いくつかの実施形態において、核酸試料は、例えば、土壌または水域からの環境試料として得られる。核酸試料は、核酸が細胞性、細胞外性、またはウィルス性のものであるかどうかの明確な知識なしに環境試料として得ることができる。さらに、核酸は、合成、組換え、または天然の核酸が酵素、例えば、メチルトランスフェラーゼにより修飾される反応を含む化学または酵素反応から得ることができる。
いくつかの実施形態において、核酸試料は、例えば、上に挙げたうちの1種のような起源に処理を施した試料である。例えば、単離された核酸は、超音波処理もしくは狭い開口を通すピペット操作によるような、せん断、または制限エンドヌクレアーゼであり得るエンドヌクレアーゼを用いるような酵素消化によって断片化することができる。いくつかの実施形態において、核酸試料は、少なくとも1つのオーバーハングを有する。単離された核酸は、まず、例えば、細菌もしくは酵母人工染色体、ミニ染色体、プラスミド、コスミド、染色体外要素、または染色体に組み込まれた構築物のような宿主細胞および/またはベクター中でクローン化または増殖され得る。
環状核酸分子の提供
いくつかの実施形態において、本発明の方法は、核酸インサートおよび核酸試料を含むインサート−試料ユニットを含む環状核酸分子を提供することを含み、このうち、該インサートは、既知の配列を有している。環状核酸分子は、一本または二本鎖であってよい。
いくつかの実施形態において、環状核酸分子は、その配列の一部が既知であるために核酸インサートとなり得る場合(例えば、該環状分子中に含まれる遺伝子の配列内の保存モチーフが既知であるかもしれないし、あるいは、該分子が、高ストリンジェンシー条件下で既知の配列を有する別の核酸にハイブリダイズするその能力に基づく配列を含むことが知られているかもしれない)、それをその起源から環状の形で単離することによって提供される。いくつかの実施形態において、配列の情報がストリンジェントなハイブリダイゼーションの特性から導かれる場合であれば、核酸インサートの配列は不正確にしか分からない。いくつかの実施形態において、環状核酸分子が既知のバックボーン配列を有する、または既知の配列を含むように操作されている場合であれば、核酸インサートの配列は正確に分かる。
いくつかの実施形態において、環状核酸分子は、核酸インサートと共に核酸試料を環状分子へ取り込むための1回のインビトロ反応または複数の反応を行うことにより提供される。1回のインビトロ反応または複数の反応は、いくつかの実施形態では、リガーゼによるライゲーションおよび/またはリコンビナーゼおよびトポイソメラーゼを含む各種酵素により触媒され得るようなその他の鎖結合反応を含み得る。DNAリガーゼまたはRNAリガーゼは、アダプター分子またはリンカーを用いて、または用いずに、線状鋳型の両端を酵素的に連結して円を形成するのに用いることができる。例えば、テッシエール(Tessier)ら、アナーレン・デア・バイオヘミー(Anal Biochem),158:171−78(1986)に記述されているように、T4 RNAリガーゼは、一本鎖DNAまたはRNAを連結する。また、CIRCLIGASE(登録商標)(エピセンター(Epicentre)、マジソン、ウィスコンシン州)は一本鎖核酸のライゲーションを触媒するのにも用いられ得る。あるいは、大腸菌またはT4 DNAリガーゼのような二本鎖リガーゼは、環状化反応を行うのに用いることが可能である。
いくつかの実施形態において、環状核酸分子を提供することは、相補領域を含むプライマー(それは、核酸インサートとなり得る既知の配列を持つ5’フラップを有するランダムプライマーであってよい)で核酸鋳型を増幅すること、およびリガーゼまたはリコンビナーゼにより触媒され得るような、増幅された核酸を環状化することを含む。増幅された核酸は、いくつかの実施形態において、環状化に先立ち、例えば、制限またはリン酸化反応により、その末端が処理されてもよい。
いくつかの実施形態において、環状核酸分子は、化学的な環状化を行うことによって提供される。化学的手法では、BrCNとイミダゾールおよび二価金属、N−シアノイミダゾールとZnCl、1−(3−ジメチルアミノプロピル)−3エチルカルボジイミド塩酸塩、ならびにその他のカルボジイミド類およびカルボニルジイミダゾール類のような周知のカップリング剤を用いる。線状鋳型の末端は、5’−ホスフェートおよび3’−ヒドロキシル、または5’−ヒドロキシルおよび3’−ホスフェートを縮合することによっても連結され得る。
いくつかの実施形態において、環状核酸分子は、環状ペアロック分子(cPLM)である。このタイプの分子が以下に詳細に述べられる。
核酸試料のフォワードリピートおよびリバースリピートの提供;環状ペアロック分子
いくつかの実施形態において、本発明の方法は、核酸試料のフォワードリピートおよびリバースリピートを提供すること、ならびにフォワード鎖およびリバース鎖をロックしてcPLMを形成することを含む。cPLMの一般構造が図3Aに示されている。cPLMは、核酸試料のフォワードリピートおよびリバースリピートを含む一本鎖の環状核酸分子である。図3Aに示されるように、リピートは核酸インサートに囲まれている。核酸インサートは、同じであっても同じでなくてもよい。いくつかの実施形態において、インサートは、少なくとも50ntまたは少なくとも100ntの長さを有する。いくつかの実施形態において、インサートは、50または100ntから10000または50000ntの長さを有する。
線状二本鎖核酸試料の鎖が、例えば、ヘアピンを形成する核酸インサートを分子の各末端にライゲートすることによりロックされ、cPLMが形成され得る。いくつかの実施形態において、ヘアピンを形成する核酸インサートは、少なくとも20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、または70℃の融解温度を有する。ライゲーションは、平滑末端または粘着末端ライゲーションとすることができる。ヘアピン構造は、塩基対ステム領域および不対ループ領域を有する。いくつかの実施形態において、インサート核酸は、少なくとも20、22、25、30、または35ヌクレオチドのサイズのループ領域を含む。いくつかの実施形態において、このループ領域は、プライマーの結合に適している。いくつかの実施形態において、ループ領域は、少なくとも45℃、50℃、55℃、60℃、65℃、または70℃の融解温度でプライマーを結合させる。
いくつかの実施形態において、核酸試料は、制限酵素を用いて異なる制限部位を消化することにより生成され得るような異なる粘着末端を含み、これらの異なる粘着末端は、異なる核酸インサートのライゲーションを促進する。いくつかの実施形態において、このような方法で変換されることとなる二本鎖核酸は、既知の配列を持つ5’フラップを含むランダムプライマーを、所望の試料の配列を含む鋳型に沿って伸長させることにより得ることができる。
二本鎖核酸の鎖は、二本鎖の末端をヘアピンに変換する酵素、例えば、二本鎖分子のうちの一方の鎖とホスホチロシン結合を形成し、これに続いて他方の鎖によるホスホチロシン結合への求核攻撃によりヘアピン形成が行われるようにするリコンビナーゼを用いる処理によりロックされてcPLMを形成することができる。λインテグラーゼおよびFlpリコンビナーゼのようなファミリーのメンバーは、かかるリコンビナーゼの例である。例えば、チェン(Chen)ら、セル(Cell)69,647−658(1992);ロス(Roth)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシズ・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)90,10788−10792(1993)を参照されたい。いくつかの実施形態において、核酸試料は、二本鎖の末端をヘアピンに変換する酵素に対する認識配列を含む。いくつかの実施形態において、二本鎖の末端をヘアピンに変換する酵素に対する認識配列は、例えば、ライゲーションによって核酸試料に付加される。
いくつかの実施形態において、試料核酸は、最初は、一本鎖の形式で得られ、そして、cPLMの形成に先立ち、二本鎖の形式に変換される。これは、例えば、オーバーハングを有するヘアピンを試料核酸の3’末端にライゲートしてから、ライゲートされたヘアピンの3’末端から伸長させて相補鎖を合成することにより達成され得る。次いで、第2のヘアピンが該分子につなげられ、cPLMが形成され得る。
核酸インサート
本発明の方法は、少なくとも1つの核酸インサートを含んでいる、cPLMsを含む環状核酸分子を提供および/または使用することを含む。いくつかの実施形態において、少なくとも1つの核酸インサートは、上に述べたように、部分的に、不正確に、または完全に分かっている配列を有する。いくつかの実施形態において、少なくとも1つの核酸インサートの配列は完全に分かっている。いくつかの実施形態において、少なくとも1つの核酸インサートは、配列決定プライマーを含むオリゴヌクレオチドに適した結合部位を含んでいる。いくつかの実施形態において、少なくとも1つのインサート核酸は、ヘアピンを形成する。
いくつかの実施形態において、少なくとも1つの核酸インサートは、10から300、15から250、30から200、または30から100ヌクレオチド残基の長さを有する。いくつかの実施形態において、少なくとも1つの核酸インサートは、45 ℃から70℃または50℃から65℃の融解温度を有する。
いくつかの実施形態において、少なくとも1つの核酸インサートは、プロモーター、例えば、T7 RNAポリメラーゼプロモーターを含む。例えば、グオ(Guo)ら、ジャーナル・オブ・バイオロジカル・ケミストリー(J Biol Chem)280,14956−14961(2005)を参照されたい。プロモーターは、RNAポリメラーゼによりRNA合成を開始する部位として認識される。さらなるプロモーターも当該分野において知られている。
インサート−試料ユニット
本発明の方法において用いられる環状核酸分子は、少なくとも1組のインサート−試料ユニットとしてグループ化される少なくとも1つの核酸試料および少なくとも1つの核酸インサートを含む。インサート−試料ユニットは、核酸インサートが核酸試料のすぐ上流または下流にある核酸のセグメントである。
いくつかの実施形態において、環状核酸分子はcPLMであり、それは2組のインサート−試料ユニットを含む。これら2つのユニットにおける核酸試料は、互いに反対の向きとなっている、つまり、一方が核酸試料のフォワードリピートであり、他方がリバースリピートである。cPLMが、インサートが試料の上流または下流のいずれかにくる2組のインサート−試料ユニットを含むものだと見なされ得ることに留意しなければならない、すなわち、図3Bに示される構造にしたがったcPLMは、要素11(フォワードリピート)、14(インサート)、12(リバースリピート)、および13(インサート)をこの順で含み、13がまた11につながって円を閉じる。インサート−試料ユニットが11と14および12と13からなるものと見なされるか、または13と11および14と12からなるものと見なされるかにかかわらず、分子は2組のインサート−試料ユニットを含む。試料に対するインサートの方向および/またはその位置決めが機能上重要である。例えば、インサートがプロモーターまたはプライマー結合部位を含む実施形態では、インサートと、プライマー結合部位またはプロモーターが向かう方向にある試料、つまり、プライマー結合部位またはプロモーターから開始するポリメラーゼによって最初にコピーされることとなる試料とがグループ化されるように、インサート−試料ユニットをグループ化することが最も有効であり得る。
配列データの獲得
配列決定法
本発明の方法は配列データを得ることを含む。いくつかの実施形態において、少なくとも2組のインサート試料ユニットを含む核酸分子が配列データを得るステップにおいて生成される。いくつかの実施形態において、少なくとも2組のインサート試料ユニットを含む核酸分子は、提供された環状核酸分子からそれを合成することによって生成され得る。いくつかの実施形態において、少なくとも2組のインサート試料ユニットを含む核酸分子は、提供された環状核酸分子を変化させることにより、例えば、環状核酸分子を線状核酸分子に変換することにより生成することができ、いくつかの実施形態ではそれは一本鎖であってよい。いくつかの実施形態において、提供された環状核酸分子またはその鋳型合成生成物であり得る核酸分子中の少なくとも1つのホスホジエステル結合が、配列データを得るステップにおいては形成または切断される。
いくつかの実施形態において、配列データは合成法による配列決定を用いて得られる。いくつかの実施形態において、配列データは、単一分子配列決定法を用いて得られる。いくつかの実施形態において、単一分子配列決定法は、パイロシークエンシング、可逆的ターミネーターシークエンシング、ライゲーションシークエンシング、ナノポアシークエンシング、および第三世代シークエンシングから選ばれる。
いくつかの実施形態において、配列データは、大量配列決定法、例えば、サンガー配列決定法またはマクサム・ギルバート配列決定法を用いて得られる。
単一分子配列決定法は、単一の核酸分子が配列決定の手順の一部として単離されるかどうかによって、大量配列決定法と区別される。核酸分子は一本鎖または二本鎖であってよい。2本のアニールされた核酸鎖は、この目的のために単一分子と見なされる。単一分子の単離は、光学的に分解可能な方法による顕微鏡スライドのような基板への直接もしくは間接的な付着によって、ナノポアを用いマイクロウェル中で、または配列データが個々の分子から得られるようなその他の任意の方式で、生じ得る。間接的な付着では、単一分子は、単一分子に結合する連結構造、例えば、タンパク質またはオリゴヌクレオチドを介して基板に付着する。特に、単一分子が単離されてから増幅され、かつ配列データがその増幅産物(複数の増幅産物)から直接得られる方法は、単一分子が単離されて配列データの最重要な起源となっているため、依然として単一分子法と見なされる。(対照的に、大量配列決定法では、多数の分子を含む核酸試料が用いられ、かつ多数の分子から発せられたシグナルを含むデータが得られる。)。いくつかの実施形態において、単一分子配列決定が行われ、このうち冗長配列が同一分子から得られる。冗長配列は、分子内の少なくとも2つのダイレクトもしくは逆方向リピートについて配列決定をすることによって、または分子の同じセグメントについて複数回配列決定をすることによって得ることができる。冗長配列は、完全に冗長であっても、例えば、特定タイプの塩基の塩基対合特異性の変化により導かれる相違のため、または配列決定プロセスにおいて起こり得るエラーのため、いくらかの変化を伴って部分的に冗長であってもよい。いくつかの実施形態において、塩基対合特異性の変化は、配列決定より前に起こり得る。いくつかの実施形態においては、同一分子が多数回配列決定され、任意で、繰り返す配列決定の間に現れる特定タイプの塩基の塩基対合特異性を選択的に変化させる中間の処理を伴う。
標識されたジデオキシ鎖ターミネーターを用いることを含むサンガー配列決定法は、当該分野においてよく知られている。例えば、サンガー(Sanger)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)74,5463−5467(1997)を参照されたい。核酸試料の断片に対して多数回の部分的な化学分解反応を行い、続いて断片の検出および分析を行って配列を推定することを含むマクサム・ギルバート配列決定法も、当該分野においてよく知られている。例えば、マクサム(Maxam)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・ザ・ユナイテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)74,560−564(1977)を参照されたい。別の大量配列決定法は、ハイブリダイゼーションによる配列決定であり、それにおいては、試料の配列が、例えばマイクロ配列または遺伝子チップ上で、複数の配列に対するそのハイブリダイゼーションの特性に基づいて推定される。例えば、ドラマナック(Drmanac)ら、ネイチャー・バイオテクノロジー(Nat Biotechnol)16,54−58(1998)を参照されたい。
単一分子配列決定法は、例えば、カトウ(Kato)、インターナショナル・ジャーナル・オブ・クリニカル・アンド・エクスペリメンタル・メディスン(Int J Clin Exp Med)2,193−202(2009)およびその中の参照文献において全般的に論じられている。
パイロシークエンシング、可逆的ターミネーターシークエンシング、およびライゲーションシークエンシングは、第二世代の配列決定法であると見なされている。通常、これらの方法は、単一分子から生成される増幅産物を用い、それらは他の分子から生成される増幅産物とは空間的に分離されたものである。空間的な分離は、エマルジョン、ピコリットルのウェルを用いることにより、またはスライドガラスへの付着により実施することができる。配列情報は、ヌクレオチドの取り込みにおける蛍光によって得られる。データを得た後、新たに取り込まれたヌクレオチドの蛍光は取り除かれ、そのプロセスが次のヌクレオチドについて繰り返される。
パイロシークエンシングでは、重合反応により放出されるピロリン酸イオンがATPスルフリラーゼによってアデノシン5’ホスホ硫酸と反応してATPを生成する。次いで、ATPがルシフェラーゼによりルシフェリンのオキシルシフェリンと光への変換を促す。蛍光は過渡的なものであるため、蛍光を除去するための分離のステップはこの方法では必要ない。一度に1種のデオキシリボヌクレオチド三リン酸(dNTP)が加えられ、どのdNTPが反応部位で有効なシグナルを生じるかに基づいて配列情報が判別される。市販されているロシェ(Roche)GS FLXの機器では、この方法を用いて配列が得られる。この技術およびその応用は、例えば、ロナギ(Ronaghi)ら、アナーレン・デア・バイオヘミー(Anal Biochem)242,84−89(1996)およびマルグリース(Margulies)ら、ネイチャー(Nature)437,376−380(2005)(ネイチャー(Nature)441,120(2006)の誤植)に詳細に述べられている。
可逆的ターミネーターシークエンシングでは、保護基の存在のために可逆的鎖ターミネーターとなる蛍光色素標識ヌクレオチド類似体が、単一塩基伸長反応に取り込まれる。塩基の同一性は蛍光色素分子により決定される。換言すれば、各塩基は異なる蛍光色素分子とそれぞれ対になる。蛍光/配列データが得られた後、蛍光色素分子および保護基が化学的に除去され、そして、そのサイクルが配列情報の次の塩基を得るために繰り返される。イルミナ(Illumina)GAの機器は、この方法により作動する。この技術およびその応用は、例えば、ルパレル(Ruparel)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシズ・オブ・ザ・ユナテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)102,5932−5937(2005)、およびハリス(Harris)ら、サイエンス(Science)320,106−109(2008)に詳細に述べられている。
ライゲーションシークエンシングでは、リガーゼ酵素が、オーバーハングを持つ部分的に二本鎖のオリゴヌクレオチドを配列決定される核酸に連結するのに用いられ、それはオーバーハングを有する。ライゲーションが起こるようにするためには、それらオーバーハングは相補的でなければならない。部分的に二本鎖のオリゴヌクレオチドのオーバーハング中の塩基は、部分的に二本鎖のオリゴヌクレオチドにコンジュゲートされた蛍光色素分子および/または部分的に二本鎖のオリゴヌクレオチドの他の部分にハイブリダイズする二次的なオリゴヌクレオチドに基づいて同定され得る。蛍光データの獲得後、ライゲートされた複合体は、(部分的に二本鎖のオリゴヌクレオチド中に含まれていた)その認識部位から一定の距離をおいた部位で切断する、例えば、IIs型制限酵素、例としてBbvIにより、ライゲーション部位の上流が切断される。この切断反応は前のオーバーハングのすぐ上流に新たなオーバーハングを露呈させ、そして、該プロセスが繰り返される。この技術およびその応用は、例えば、ブレンナー(Brenner)ら、ネイチャー・バイオテクノロジー(Nat Biotechnol)18,630−634(2000)に詳細に述べられている。いくつかの実施形態において、ライゲーションシークエンシングは、環状核酸分子のローリングサークル型増幅産物を得ること、および該ローリングサークル型増幅産物をライゲーションシークエンシングの鋳型として用いることにより、本発明の方法に適するようになる。
ナノポアシークエンシングでは、例えば、電気泳動の駆動力を利用して一本鎖核酸分子にポアを通過させ、そして、一本鎖核酸分子がポアを通過するときに得られるデータを分析することによって配列が推定される。該データは、イオン電流データであり得、各塩基は、例えば、ポアを通過する電流を部分的にブロックすることによって、差異があり、区別可能な程度に電流を変化させる。
第三世代シークエンシングにおいては、多数の小さな(〜50nm)孔を持つアルミニウム膜を備えたスライドが、ゼロモード導波管として用いられる(例えば、レヴィン(Levene)ら、サイエンス(Science)299,682−686(2003)を参照されたい)。そのアルミニウム表面は、ポリホスホネートの化学的性質、例えば、ポリビニルホスホネートの化学的性質によって、DNAポリメラーゼの付着から保護される(例えば、コルラック(Korlach)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシズ・オブ・ザ・ユナテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)105,1176−1181(2008)を参照されたい)。このことは、アルミニウム膜の孔内において露出しているシリカへのDNAポリメラーゼ分子の優先的な付着をもたらす。この構成により、エバネッセント波の現象が蛍光バックグラウンドを減少させるべく利用されることとなり、これによってより高濃度の蛍光標識dNTPsの使用が可能となる。蛍光色素分子はdNTPの末端ホスフェートに付着し、これによりdNTPの取り込みにおいて、蛍光が放出されるが、蛍光色素分子は新たに取り込まれたヌクレオチドに付着したままではなく、つまり、その複合体はすぐに再度の取り込みができる状態になる。この方法によると、アルミニウム膜の孔内に存在する個々のプライマー−鋳型複合体へのdNTPsの取り込みを検出することができる。例えば、エイド(Eid)ら、サイエンス(Science)323,133−138(2009)を参照されたい。
配列決定鋳型;得られる配列決定データの量
いくつかの実施形態において、配列データは環状核酸分子から、つまり環状核酸分子を鋳型として用いることにより、直接得られる。鋳型として用いられる環状核酸分子は、環状ペアロック分子であってよい。いくつかの実施形態において、配列データは、それ自体が環状核酸分子を鋳型として用いて合成されたものである生成物核酸分子から得られる。つまり、配列データが得られる鋳型は、環状核酸分子鋳型から合成された生成物核酸分子であり得る。いくつかの実施形態において、配列データは、環状核酸分子鋳型、および環状核酸分子鋳型より合成された生成物の核酸分子の両方から得られる。
いくつかの実施形態では、環状核酸分子を鋳型として用いて、少なくとも2組のインサート−試料ユニットを含む生成物核酸分子を合成することを含むローリングサークル型増幅が行われる。いくつかの実施形態において、ローリングサークル型増幅は、少なくとも3、4、5、10、15、20、25、50、または100組のインサート−試料ユニットを含む生成物核酸分子を合成することを含む。多数の鋳型のコピーを生成するためのローリングサークル型増幅の使用は、当該分野において、よく知られている。例えば、ブランコ(Blanco)ら、ジャーナル・オブ・バイオロジカル・ケミストリー(J Biol Chem)264,8935−8940(1989)およびバナー(Baner)ら、ヌクレイック・アシッズ・リサーチ(Nucleic Acids Res)26,5073−5078(1998)を参照されたい。ローリングサークル型増幅は、環状核酸分子が配列決定鋳型である配列決定の一部として、または配列決定鋳型として用いられることとなる生成物核酸分子を合成するために、行われ得る。
鋳型にかかわらず、本発明の方法により得られる配列データは、少なくとも2つの核酸試料配列のリピートを含む。これら少なくとも2つのリピートは、いくつかの実施形態では、少なくとも1つの核酸試料配列のフォワードリピートおよび少なくとも1つの核酸試料配列のリバースリピートを含んでいてもよい。いくつかの実施形態において、配列データは、少なくとも3、4、5、10、15、20、25、50、または100の核酸試料配列のリピートを含む。いくつかの実施形態において、配列データは、少なくとも2、3、4、5、10、15、20、25、50、または100の核酸試料配列のフォワードリピートを含む。いくつかの実施形態において、配列データは、少なくとも2、3、4、5、10、15、20、25、50、または100の核酸試料配列のリバースリピートを含む。いくつかの実施形態において、配列データは、核酸試料配列のフォワードリピートおよびリバースリピートをそれぞれ少なくとも2、3、4、5、10、15、20、25、50、または100含む。
スコアの計算
いくつかの実施形態において、本発明の方法は、配列データにおける少なくとも2つのインサートの配列のスコアを、その配列をインサートの既知の配列と比較することによって計算することを含む。インサートの配列が部分的または不正確にのみ分かっている実施形態においては、核酸インサートの既知の配列は、例えば、多義性コードまたは位置特異的重み行列の使用によって、不明確なまたは未知の位置を含み得る。
配列をインサートの既知の配列と比較することは、配列データ中の少なくとも2つのインサートの配列を識別することを含む。配列を識別することは、いくつかの実施形態では、目視検査によって、つまり人が配列データを目視で調べ、かつそこに含まれるインサート核酸の配列を見分けることにより、またはコンピュータ支援のアライメント法により、行われ得る。例えば、国際特許出願公開第WO2009/017678号パンフレットを参照されたい。いくつかの実施形態において、配列を識別することは、配列を認識するアルゴリズムを用いて配列データを走査することにより、例えば、核酸インサートの既知の配列に最も密接に対応する局所的極値を識別するために、配列データ内の多数の位置について繰り返して、または、発見的学習法によって、スコアを計算することにより、行うことができる。いくつかの実施形態において、少なくとも2つの核酸インサートの配列を識別することは、スコアを計算するのと同時に行われ、両方のプロセスは同じスコアを使用することができる。
いくつかの実施形態において、スコアを計算することは、適したアライメントアルゴリズムを用いてアライメントを実行することを含み、その多くが当該分野において知られ、かつ容易に利用可能であり、例えば、ブラスト(BLAST)、メガブラスト(MEGABLAST)、スミス−ウォーターマン(Smith−Waterman)アライメント、およびニードルマン−ウンシュ(Needleman−Wunsch)アライメントである。例えば、アルトシュール(Altschul)ら、ジャーナル・オブ・モレキュラー・バイオロジー(J Mol Biol)215,403−410(1990)を参照されたい。適したアライメントアルゴリズムには、ギャップを許すアルゴリズムとギャップを許さないアルゴリズムの両方が含まれる。あるいは、いくつかの実施形態において、スコアを計算することは、配列について位置特異的重み行列を実行し、かつその配列に対応する行列の要素の合計を計算するようなアルゴリズムを用いて配列を分析することを含む。このようにして、スコアが、段階的な方式で行列を配列リードに適用することにより得られた極大値として計算され得る。
いくつかの実施形態において、スコアは、既知の配列に対する少なくとも2つの核酸インサートの配列の近さと正の相関関係がある(例えば、最大可能スコアは完全な一致の結果生じる)。かかる正の相関関係があるスコアは、同一性パーセント、ビットスコア、およびマッチング塩基カウントを含むが、これらに限定されるものではない。
いくつかの実施形態において、スコアは、既知の配列に対する少なくとも2つの核酸インサートの配列の近さと逆の相関関係がある(例えば、最小可能スコアは完全な一致の結果生じる)。かかる負の相関関係があるスコアは、e−値、ミスマッチの数、ミスマッチおよびギャップの数、ミスマッチのパーセント、ならびにミスマッチ/ギャップのパーセントを含むが、これらに限定されるものではない。
いくつかの実施形態において、スコアは、比率ベースで計算される。比率ベースで計算されるスコアの可能な範囲は、比較される配列の長さに応じて変化しない。比率ベースで計算されるスコアの例は、同一性パーセントおよびミスマッチ/ギャップのパーセントを含むが、これらに限定されるものではない。
いくつかの実施形態において、スコアはカウントベースで計算される。カウントベースで計算されるスコアの可能な範囲は、比較される配列の長さに応じて変化する。カウントベースで計算されるスコアの例は、ビットスコア、ミスマッチの数、ミスマッチおよびギャップの数、ならびにマッチング塩基カウントを含むが、これらに限定されるものではない。
核酸試料の配列のリピートの受け入れまたは拒否;受け入れられた配列セット
いくつかの実施形態において、本発明の方法は、核酸試料の配列のリピートのすぐ上流および下流にあるインサートの配列の一方または両方のスコアにしたがって、配列データ中の核酸試料の配列のリピートを受け入れるか、あるいは拒否することを含む。よって、各種の実施形態において、すぐ上流およびすぐ下流の核酸インサート両方のスコア、いずれか一方のスコア、または一方もしくは他方のスコアは、配列データ中の核酸試料の配列を受け入れるか、あるいは拒否するかを決定するのに用いられる。
スコアが既知の配列に対する少なくとも2つの核酸インサートの配列の近さと正の相関関係がある実施形態において、配列を受け入れるためにはスコアは閾値よりも大きいまたはそれ以上であることが要求される。適した閾値の選択は、用いられるスコアのタイプ、配列決定のエラー率、ならびに時間および冗長度の検討事項を含む多数の要因によってなされる。
核酸試料の配列のリピートを受け入れることおよび拒否することは、核酸試料の配列を決定するべく、少なくとも1つの受け入れられたリピートが用いられ、かついずれの拒否されたリピートも用いられないことになるような各種方法により実行され得る。リピートを受け入れることおよび拒否することは、受け入れられた配列セットをコンパイルすることと協調的な方式で行われても、または行われなくてもよい。例えば、受け入れられたリピートの配列は、受け入れられた配列セットとなる新たなデータ構造にそれらが受け入れられるときにコピーされ得る。あるいは、拒否されたリピートの配列は、それらが拒否されるときに消去または上書きされ得る(例えば、ヌルまたは排除データを表す「0」または「X」の文字で)。この場合において、拒否された配列が一旦消去または上書きされると、元のデータ構造は、受け入れられたデータセットとなるように修正される。これらの例では、リピートを受け入れるおよび拒否することが、受け入れられた配列セットをコンパイルすることと協調的な方式で行われるものと見なされる。
いくつかの実施形態において、核酸試料の配列のリピートは、核酸試料の配列の他のリピートの長さから逸脱する長さを持つといったような、さらなる根拠に基づいて、拒否され得る(例えば、図7Bを参照されたい)。例えば、核酸試料の配列のリピートは、それが、他の核酸試料の配列の、または上述したような核酸試料の配列のリピートのすぐ上流および下流にあるインサートの配列のうち一方もしくは両方のスコアに基づいて受け入れられた核酸試料の配列のリピートを含むものであって、中央値または平均の長さの計算のために一時的に除かれる拒否の可能性が検討されている核酸試料の配列のリピートを有していても有していなくてもよい受け入れられた配列セットの仮バージョンの、平均または中央値の長さからの閾値の範囲にそれる場合に、拒否され得る。閾値の範囲は、絶対的な長さ、例えば、1、2、5、10、20、もしくは50ヌクレオチドで、相対的な長さ、例えば1%、2%、5%、10%、20%、もしくは50%で、または標準偏差のような統計的尺度、例えば、0.5、1、1.5、2、2.5、3、3.5、4、もしくは5の標準偏差で表すことができる。
あるいは、配列は、受け入れられたまたは拒否されたものとしてフラッギングされ、次いで、そのフラッギングプロセスが完了した後、受け入れられた配列が新たなデータ構造中にコピーされ、または拒否された配列が消去もしくは上書きされて、協調的でない方式で受け入れられた配列セットが生成され得る。
受け入れられた配列セットは、核酸試料の配列の少なくとも1つの受け入れられたリピートおよび連結された形式の任意のさらなる受け入れられたリピートを含む単一のデータ文字列、ならびに各要素が核酸試料の配列の受け入れられたリピートまたはそのサブパートを表す多要素変数を含む形式から選ばれ得る。いくつかの実施形態において、多要素変数は、リスト、配列、ハッシュ、および行列から選ばれる。核酸試料の配列の少なくとも1つの受け入れられたリピートの保存、およびそれに続く核酸試料の配列の決定を可能とするいかなる形式のデータ構造も、使用に適している。
受け入れられた配列セットの形式が生配列データの形式とは異なる(例えば、生配列データが文字列の形式をとり、受け入れられた配列セットが配列のような多要素データ構造の形式をとる)実施形態では、生配列データは、リピート、インサート−試料ユニット、または当該方法における生配列データが得られた後および最後の受け入れられた配列セットが生成される前の時点で両側にすぐ上流および下流のインサートが位置する試料のリピートを含む要素に解析され得る。この解析のステップは、上に述べたスコアリングステップの前または後に生じるものとすることができる。
核酸試料の配列の決定;共通配列;信頼度
いくつかの実施形態において、当該方法は、核酸試料の配列を決定することを含む。
核酸試料の配列を決定する方式は、条件付きで、受け入れられた配列セット中の核酸試料のリピートの数を基に選ぶことができる。例えば、受け入れられた配列セットが1つの受け入れられたリピートのみを含む場合、核酸試料の配列は、受け入れられたリピートの配列であると決定され得る。受け入れられた配列セットが2つのみ、または少なくとも3つの受け入れられたリピートを含む場合、核酸試料の配列は、受け入れられたリピートの共通配列(下記参照)であると決定され得る。受け入れられた配列セットが少なくとも3つの受け入れられたリピートを含む場合は、共通配列がどのように決定されるかについて、より多くの選択肢がある。
共通配列
共通配列は、受け入れられたリピートのアライメント(「スコアの計算」のセクションにおいて上に述べたように実行される)から決定される。受け入れられたリピートが同一の塩基を含むアライメント中の位置において、共通配列はその塩基を含む。いくつかの実施形態では、受け入れられたリピートが同一の塩基を含まないアライメント中の位置において、共通配列は適した多義性コード(例えば、受け入れられたリピートがある位置においてAおよびGを含む場合にはR)を含む。いくつかの実施形態では、受け入れられたリピートが同一の塩基を含まないアライメント中の位置において、共通配列は、Nまたは未知の塩基を示すその他の符号を含む。いくつかの実施形態では、受け入れられたリピートが同一の塩基を含まないアライメント中の位置において、共通配列は、配列の獲得時においてより強いまたはより強固なシグナルを出した受け入れられたリピートからの塩基を含む(例えば、生データが蛍光の形式であった場合、(いくつかの実施形態では、適した正規化および/または標準化の後に)より明るい蛍光発光に基づいてコールされた塩基は、共通配列中に置かれる。
共通配列が、少なくとも3つの受け入れられたリピートを含む受け入れられた配列セットから決定される場合、共通配列の各位置における塩基は、いくつかの実施形態では、多数決によって決定され得る。つまり、受け入れられたリピートの半数以上におけるある位置に現れる塩基は、共通配列中のその位置に置かれる。受け入れられたリピートが、そこに過半数の票がないようなある位置において一致しない場合、共通配列中のその位置における塩基は別の方法で決定され、例えば、相対多数決を用いてもよく(つまり、受け入れられたリピート中のある位置に最も頻繁に現れる塩基が、共通配列中のその位置に置かれる)、または前の段落で述べた手段のうちの1つを用いてもよい。
いくつかの実施形態において、共通配列が少なくとも3つの受け入れられたリピートを含む受け入れられた配列セットから決定される場合、共通配列の各位置における塩基は、いくつかの実施形態では、受け入れられたリピート中のその位置における各塩基の出現頻度に基づいて決定され得る。よって、共通配列は、各塩基が核酸試料中の各位置に現れる見込みの確率的表現であり得る。かかる表現は、位置特異的重み行列の形式をとることができる。いくつかの実施形態において、位置特異的重み行列の要素は、受け入れられたリピートのアライメント中の各位置に各塩基が見られた頻度である。
いくつかの実施形態において、位置特異的重み行列の要素は、受け入れられたリピートのアライメント中の各位置に各塩基が見られた頻度から計算される。この計算には他の因子を用いることもでき、例えば、いくつかの受け入れられたリピートの配列が、他のリピートに比べ、配列の獲得時においてより強いまたはより強固なシグナルにより得られた場合、それら受け入れられたリピートの配列により大きい重みが与えられ得る、および/または、他のリピートにより小さい重みが与えられ得る。重みが変更される度合いは、例えば、シグナルの強度に基づいて定量的に決定することができる、あるいは、それは一定した変更であってもよい。例えば、比較的に強いシグナルにより得られた塩基の重みは、50%もしくは100%のような値だけ増やされてもよい、および/または、比較的に弱いシグナルの塩基の重みは、33%もしくは50%のような値だけ減らされてもよい。
いくつかの実施形態において、位置特異的重み行列の要素は、(おそらくは上述のように重みが付けられている)各位置における各塩基の変換された出現頻度から導かれた値である。出現頻度は、対数的にまたは累乗法によって、変換されてもよい。いくつかの実施形態において、変換は、ある位置においてまれにしか見られない塩基の重みを減らす、および/または、ある位置によく見られる塩基もしくは複数の塩基の重みを増やす効果を有する。例えば、TがN個の受け入れられたリピートの配列のアライメント中のある位置にM回現れ(ここで、N>2かつM<N/2である)、Cが残りのすべての回数現れる(つまり、N−M回)場合、いくつかの実施形態では、これら出現頻度の変換により、位置特異的重み行列におけるTの重みがM/N(もしくはそれに対応するパーセンテージ)よりも小さくなる、および/またはCの重みが(N−M)/N(もしくはそれに対応するパーセンテージ)よりも大きくなることになる。いくつかの実施形態においては、最もよく見られる塩基(または出現頻度が同数の場合の塩基)の重みを増やすだけのために、変換が選ばれる。
信頼度
いくつかの実施形態において、信頼度が、核酸試料の配列中の少なくとも1つの位置について決定される。信頼度は、多くの方式、例えば、パーセンテージとしてもしくはフレッド(phred)スコアとして表される全体のベースコールの正確度の値で、またはエラー率で表すことができる。いくつかの実施形態において、信頼度は、ある位置に最もよく見られる塩基もしくは複数の塩基の出現頻度、または最もよく見られるものではない塩基の組み合わせた出現頻度から決定される。いくつかの実施形態において、これら出現頻度は、上述したように変換され、重みが増やされ、および/または、重みが減らされる。
配列全体の信頼度の決定;核酸試料の配列ならびに信頼度のリアルタイムでのおよび/または所望の信頼のレベルとなるまで行う決定
いくつかの実施形態において、本発明の方法は、配列全体の信頼度を決定することを含む。配列全体の信頼度は、多くの方式、例えば、パーセンテージもしくはフレッド(phred)スコアとして表される全体のベースコールの正確度の値、エラー率、または配列中の予測されるエラーの数で表すことができる。
個々の位置からの信頼度は、上のセクションで述べたように、配列全体の信頼度を計算するのに用いることができる。例えば、全体の信頼度は、核酸試料の配列の各位置における信頼度の統計的な母集団の算術平均、幾何平均、中央値、または最頻値の信頼度として決定され得る。いくつかの実施形態において、核酸試料の配列の各位置における信頼度の統計的な母集団は、配列全体の信頼度の計算の前に処理され、例えば、異常値が棄却される。
いくつかの実施形態において、本発明の方法は、核酸試料の配列および信頼度をリアルタイムで決定することを含む。これら実施形態では、配列決定のステップにおいて得られたデータは、例えば、ローリングサークル型増幅産物のさらなるリピートからのさらなる配列データの獲得と同時に配列および信頼度を決定するために処理される。さらなる配列データが得られるとき、決定された配列および信頼度の両方が更新される。いくつかの実施形態において、該リアルタイムプロセスは、事前に選択された信頼度に達するまで続けられる。事前に選択された信頼度は、例えば、90%、95%、99%、99.5%、99.9%、99.95%、または99.99%のベースコールの正確度とすることができる。事前に選択された信頼度は、配列における位置の全体または一部としての配列に対するものであってよく、例えば、50%、67%、75%、80%、85%、90%、95%、98%、99%、99.5%、および99.9%のような値から選ぶことができる。
多数の試料;コンティグのアセンブル
いくつかの実施形態において、当該方法は、配列を有する核酸試料と同じ起源、種、または菌株からの少なくとも1つの他の試料であって、該核酸試料の配列と部分的に重なる試料を用いて当該方法の上記ステップを繰り返すこと、これにより少なくとも1つの他の配列を決定すること、およびその少なくとも1つの他の配列を元の試料の配列と共にアセンブルしてコンフィグを形成すること、を含む。いくつかの実施形態において、当該方法は、0.5、1、2、5、10、もしくは100kb、または1、2、5、10、100、もしくは1000Mbよりも大きいサイズのコンフィグが作成されるように、多くの試料を用いて、当該方法の上記ステップを繰り返すことを含む。いくつかの実施形態において、コンフィグは、例えば、限定はされないが、染色体、ミニ染色体、人工染色体、ウィルスゲノム、または染色体外要素であり得る核酸分子の全配列、またはヘテロクロマチンもしくは無反応性領域を除く全配列を表す。コンフィグのアセンブリは、当該分野において周知の方法を用いて実行することができる。
修飾塩基
いくつかの実施形態において、核酸試料は、少なくとも1つの修飾塩基、例えば、5−メチルシトシン、5−ブロモウラシル、ウラシル、5,6−ジヒドロウラシル、リボチミン、7−メチルグアニン、ヒポキサンチン、またはキサンチンを含む。ウラシルはDNA鎖において修飾塩基と見なすことができ、リボチミンはRNA鎖において修飾塩基と見なすことができる。いくつかの実施形態において、二本鎖核酸試料における少なくとも1つの修飾塩基は、その優先的なパートナー塩基とは異なる塩基対合特異性により対合する。これは、例えば、二本鎖分子中の1つの塩基が、それを標準塩基のうちの1つから同じ優先的なパートナー塩基を持たない修飾塩基に変換する反応を受けた(例えば、散発的な酸化、または放射物もしくは化学的な突然変異物質のような突然変異剤への暴露のため)ときに起こり得る。
優先的なパートナー塩基は、ワトソン・クリック型塩基対の法則に基づくものである。例えば、アデニンの優先的なパートナー塩基はチミン(またはウラシル)であり、逆もそうである。シトシンの優先的なパートナー塩基はグアニンであり、逆もそうである。修飾塩基の優先的なパートナー塩基は、当業者には広く知られている、または標準塩基のそれらに類似する位置における水素結合の供与体および受容体の存在に基づいて予測することができる。例えば、グアニンのように、ヒポキサンチンはプリン環の6位に水素結合受容体(二重結合酸素)を持ち、それゆえ、その優先的なパートナー塩基は、ピリミジン環の6位に水素結合受容体(アミン基)を持つシトシンである。特に、ヒポキサンチンは、アデニンの脱アミノ化によって形成され得る。アデニンはDNA中で通常はチミンと対合するため、この脱アミノ反応の結果としてヒポキサンチン−チミン対が生じることとなり、修飾塩基であるヒポキサンチンはその優先的なパートナー塩基に対合しない 。また、シトシンも脱アミノ化されてウラシルを形成し得る。DNAとの関連では、ウラシルは修飾塩基と見なすことができ、それが(通常の二本鎖DNAにおけるシトシンの脱アミノ化によって起こり得るように)グアニンに対合する場合は、これもまた修飾塩基であるウラシルがその優先的なパートナー塩基に対合しないという状況となる。
修飾塩基の検出;特定タイプの塩基の塩基対合特異性の変化
いくつかの実施形態において、本発明の方法は、特定タイプの塩基の塩基対合特異性を変化させることを含む。特定タイプの塩基の塩基対合特異性を変化させることは、塩基の未修飾型、例えば、シトシンの塩基対合特異性を特異的に変化させることを含み得る。この場合、少なくとも1つの塩基の修飾型、例えば、5−メチルシトシンの塩基対合特異性は変化させない。
あるいは、特定タイプの塩基の塩基対合特異性を変化させることは、塩基の修飾型(例えば、5−メチルシトシン)の塩基対合特異性を特異的に変化させることを含み得るが、塩基の未修飾型(シトシン)のそれは変化させない。
いくつかの実施形態において、特定タイプの塩基の塩基対合特異性を変化させることは、5−メチルシトシン(未修飾のシトシンではない)をチミンに変換する光化学的トランジションを含む。例えば、マツムラ(Matsumura)ら、ヌクレイック・アシッズ・シンポジウム(Nucleic Acids Symp)整理番号51,233−234(2007)を参照されたい。この反応は、光化学的トランジションを受ける塩基の塩基対合特異性をグアニンからアデニンへ変化させる(グアニンは5−メチルシトシンと対合し、一方アデニンはチミンと対合する)。
別の実施形態において、特定タイプの塩基の塩基対合特異性を変化させることは、シトシン(5−メチルシトシンではない)をウラシルに変換する亜硫酸水素塩変換を含む。例えば、レアド(Laird)ら、プロシーディングズ・オブ・ザ・ナショナル・アカデミー・オブ・サイエンシズ・オブ・ザ・ユナテッド・ステイツ・オブ・アメリカ(Proc Natl Acad Sci USA)101,204−209(2004)およびジルバーマン(Zilberman)ら、ディベロップメント(Development)134,3959−3965(2007)を参照されたい。この反応は、亜硫酸水素塩変換を受ける塩基の塩基対合特異性をグアニンからアデニンへ変化させる(グアニンはシトシンと対合し、一方アデニンはウラシルと対合する)。
また、別の実施形態においては、修飾塩基が塩基の未修飾型と比べて変化した塩基対合特異性を有している場合におけるように、変化のステップを行うことなく、修飾塩基が検出され得る。かかる塩基の例には、5−ブロモウラシル、ウラシル、5,6−ジヒドロウラシル、リボチミン、7−メチルグアニン、ヒポキサンチン、およびキサンチンが含まれ得る。例えば、アデニンに比べてグアニンへの対合を増やすこととなるケト−エノール互変異性化を受ける5−ブルモウラシルの傾向、およびアデニンの脱アミノ化による(チミンより優先的にシトシンに対合する)ヒポキサンチンの形成について論じている。ブラウン(Brown)、ゲノムズ(Genomes)、第2版、ジョン・ワイリー・アンド・サンズ,インク(John Wiley & Sons, Inc.)、ニューヨーク、ニューヨーク州、2002、第14章、「変異、修復、および組換え(Mutation,Repair,and Recombination)」を参照されたい。
塩基とその修飾型とを区別するヌクレオチド類似体
いくつかの実施形態において、配列データは、塩基とその修飾型とを区別する少なくとも1つのヌクレオチド類似体(「区別類似体」;これは、塩基およびその修正型のうちの一方と優先的に対合し、他方にはそうではない)を用いて得られる。ヌクレオチド類似体は、例えば、可逆的ターミネーターシークエンシングもしくはライゲーションシークエンシングにおける異なる標識の使用により、またはヌクレオチドを1度に1種ずつ加えてから洗い流すことのできるパイロシークエンシングに取り入れられる場合に、それが標準の4種の塩基に加えて第5の塩基であるかのように用いられると共に、検出され得る。いくつかの実施形態において、区別類似体は、その対応する天然ヌクレオチドの前に加えられる(例えば、パイロシークエンシングで)、またはその同族の天然ヌクレオチドの濃度よりも10から100倍高い濃度で提供される(例えば、可逆的ターミネーターシークエンシングで)。例えば、区別類似体は、シトシンと5−メチルシトシンとを区別するデオキシグアノシン三リン酸の類似体とすることができる(例えば、それはシトシンと対合するが、5−メチルシトシンとは対合しない)。該類似体は、デオキシグアノシン三リン酸の濃度よりも10から100倍高い濃度で提供され得る。このようにして、該類似体は、通常、それが優先的に対合する塩基の配列方式と相反する形態で取り込まれるはずであるが、天然塩基は、通常、該類似体が優先的に対合しない塩基の配列方式と相反する形態で取り込まれるはずである。
区別類似体の例は、米国特許第7,399,614号に見られ、例えば、未修飾シトシンと5−メチルシトシンとを区別し、前者と優先的に対合する次の分子を含む。
および
これら分子は、それぞれ区別類似体1および区別類似体2と称される。
核酸試料中の修飾塩基の位置の決定
いくつかの実施形態において、本発明の方法は、核酸試料中の修飾塩基の位置を決定することを含む。これら実施形態は、(i)二本鎖の形式の核酸試料を提供すること、(ii)核酸試料を環状ペアロック分子に変換すること、このうち、環状ペアロック分子は、核酸試料の配列のフォワードリピートおよびリバースリピートならびに同じであっても同じでなくてもよい既知の配列を持つ2つの核酸インサートを含み、(iii)環状ペアロック分子中の特定タイプの塩基の塩基対合特異性を選択的に変化させること、(iv)次いで、環状ペアロック分子のフォワードリピートおよびリバースリピート、またはその相補配列を鋳型として配列データを得ること、ならびに(v)少なくともフォワードリピートおよびリバースリピートまたはそのコピーの配列データを用いて核酸試料中の修飾塩基の位置を決定すること、を含む。特に、フォワードリピートを鋳型とした配列は、リバースリピートと同じセンスを持つようになるが(逆の場合も同じ)、リバースリピートと完全に同じであっても、そうでなくてもよい。違いは、リバースリピート中の対応する塩基以外の塩基に対合することのできる塩基を含むフォワードリピートにより生じ得る。そのような状況の例は、cPLM中のフォワードリピートはリバース鎖中のアデニンに対合した5−ブロモウラシルを含むが、合成による配列決定反応におけるグアニンの添加の鋳型となる場合である。
少なくとも2つのリピート、つまり、試料のリピート(例えば、図5Aにおいて17と標示されているリピート)および新たに合成されたフォワード鎖の相補鎖のリピート(例えば、図6Aにおいて21と標示されているリピート)のうち少なくとも1つ、ならびに新たに合成されたリバース鎖の相補鎖のリピート(例えば、図6Aにおいて19と標示されているリピート)およびリバース鎖のリピート(例えば、図6Aにおいて16と標示されているリピート)のうち少なくとも1つ、を含む配列データが得られる。これらリピートがアライメントされる。このアライメントは、上述したような任意の適したアルゴリズムを用いて実行され得る。リピート間で不一致がある位置(例えば、図6Bにおいて41と標示されている位置)は、その位置の核酸試料中の塩基が、その塩基対合特異性の変化を受けたことを表す。該プロセスに用いられるまたは試料中に存在する修飾のタイプ、修飾塩基、および/または、区別類似体により、核酸試料の対応する位置に元々存在する塩基が決定され得る。
例えば、CからTへの変換(図5A参照)によって環状ペアロック分子が変化した場合、不一致は、Cが、あるリードにおいては、Tである位置またはAに相補的である位置、および、別のリードにおいては、Cである位置またはGに相補的である位置の核酸試料中に存在していたことを示す。その論理は、配列で不一致となる位置において、変換反応の生成物である塩基、Tが、核酸試料中に存在していた変換反応の基質、Cに取って代わったというものである。
もう一つの例では、CからUへの変換によって環状ペアロック分子が変化した場合、不一致は、Cが、あるリードにおいては、UもしくはTである位置またはAに相補的である位置、および、別のリードにおいては、Cである位置またはGに相補的である位置の核酸試料中に存在していたことを示す。その論理は、配列で不一致となる位置において、変換反応の生成物である塩基、U(シークエンシングシステムよりTと読まれることもある)が、核酸試料中に存在していた変換反応の基質、Cに取って代わったというものである。C残基はCからUへの変換によっては変化しないため、リードがある位置におけるCおよび/またはその相補体としてのGを示すことで一致している位置は、Cが元の試料中のこの位置に存在していたことを示す。
上述のように区別類似体が用いられた実施形態では、それが優先的に結合する塩基の存在が、区別類似体が出現する位置に対応する元の配列の位置における元の配列にあることが推測され得る。
システム/コンピュータ可読媒体
いくつかの実施形態において、本発明は、プロセッサ、ストレージ、バスシステム、および少なくとも1つのユーザーインターフェースエレメントを含む計算装置に操作可能に連結された配列決定装置を含むシステムに関する。ユーザーインターフェースエレメントは、ディスプレイ、キーボード、およびマウスから選択することができる。いくつかの実施形態において、該システムは、少なくとも1つの集積回路および/または少なくとも1つの半導体を含む。
いくつかの実施形態において、配列決定装置は、上述した配列決定法のうち少なくとも1つを実行するように構成された配列決定装置から選ばれる。
いくつかの実施形態において、ディスプレイは、単独のユーザーインターフェースエレメントとしての機能を果たすタッチスクリーンであってよい。ストレージは、ユーザーの任意入力により、プロセッサ、ストレージ、バスシステム、および少なくとも1つのユーザーインターフェースエレメントを含む計算装置に操作可能に連結された配列決定装置を含むシステム上のプロセッサにより実行されるときに、上述のような本発明の方法を実行するオペレーティングシステム、ユーザーインターフェースソフトウェア、および命令を含むプログラミングによりエンコードされたものである。いくつかの実施形態において、ストレージは、上述した形式のいずれか、例えば、生配列データ、受け入れられた配列セット、共通配列などであり得る配列データをさらに含む。
いくつかの実施形態において、ストレージおよびその内容の全ては1台のコンピュータ内に配置される。別の実施形態では、ストレージは少なくとも2台のコンピュータ、例えば、ネットワーク接続を介して連結されたコンピュータ間で分けられる。いくつかの実施形態において、ユーザーインターフェースは、システムの少なくとも1つの構成要素、例えば、プロセッシングソフトウェアを含む少なくとも1台の他のコンピュータと通信状態にある1台のコンピュータの一部である。
いくつかの実施形態において、プロセッサにより実行されるシステムまたは方法の出力の結果として、核酸試料中の少なくとも1つの位置に修飾塩基があるという表示がなされることになる。その表示は、さまざまな形式、例えば、配列中の修飾位置のリスト、修飾位置が、例えば、アスタリスクまたは類似の文字、あるいは、太字、イタリック体または下線の書式、カラーテキストで強調またはマーキングされる配列のテキストもしくはグラフィック表現、または修飾塩基の構造を含む核酸の化学構造の描写であってよい。
以下の具体的な実施例は、単なる例示であり、いかなる方式においても、その他の部分の開示を限定するものではないと解釈されるべきである。さらに詳細な説明がなくとも、当業者は、本明細書における記載に基づいて本発明をその最大の範囲において利用することができると考えられる。
実施例1:合成環状ペアロック分子のローリングサークル型増幅
表1に示されるような4つのオリゴデオキシリボヌクレオチドを提供した。
5μLの10×T4リガーゼバッファ(NEB製;10mMのATPを含む10×ストックバッファ)の存在下、30μLの10μMオリゴデオキシリボヌクレオチド(最終濃度)を1μLの10U/μL T4ポリヌクレオチドキナーゼ(ニューイングランド・バイオラボズ(New England Biolabs)(「NEB」)製、カタログ番号:M0201S)で処理する別々の50μL反応で、CPLM−1およびCPLM−2をリン酸化した。14μLのddHOを加えて、最終体積を50μLとした(表2を参照)。その反応を37℃で30分間インキュベートし、続いて65℃で20分間酵素不活性化を行った。
上記反応から得られたリン酸化CPLM−1およびCPLM−2(それぞれ5’P−CPLM−1および5’P−CPLM−2)の濃度を6μMに調整した。
次いで、精製したリン酸化CPLM−1およびCPLM−2を95℃で5分間変性させてから、氷上に置き、バッファ、ddHO、およびT4リガーゼ(NEB製、カタログ番号:M0202S)と混ぜ、表3に示されるような環状ペアロック分子を生成した。ライゲーションは25℃で起こり、18μLのアリコートを10、30および60分間で取り出した。リガーゼを用いない陰性コントロールを並行して行った(表3の列L0)。
ライゲーション生成物を、表4に示されるように、pS−T1および/またはpS−T2プライマー、dNTPs、RepliPHI(登録商標)Phi29 DNAポリメラーゼ(エピセンター(Epicentre)製、カタログ番号:PP031010)、ならびに,適当な10×反応バッファRepliPHI Phi29 DNA ポリメラーゼバッファと合わせた。
Phi29ポリメラーゼを入れずに反応物をアセンブルし、95℃で5分間変性させてから、氷上に5分間置いた。Phi29ポリメラーゼを加え、続いて30℃で18時間インキュベートした。
5μLの反応生成物の試料を1μLの6×ローディング色素(0.03%ブロモフェノールブルー、0.03%キシレンシアノールFF、60%グリセロール、100mM Tris−EDTA(pH7.6))と混合し、95℃で10分間加熱してから、すぐに氷上に置いた。1%SDSをさらに加えたことを除き、第2の組の反応生成物試料を同じように処理した。
試料を1×TAEバッファ中の0.7%アガロースゲルにロードし、135Vで28分間電気泳動させた。DNAをGelRed(登録商標)プレキャストゲル染色(バイオチウム(Biotium)製、カタログ番号:41003 GelRed(登録商標)Nicleic Acid Gel Stain、水中に10000×希釈)により可視化した。そのゲルが図9に示されている。見掛けの分子量が10kbよりも大きいローリングサークル型増幅産物が、L3ライゲーション反応生成物ならびにpS−T1およびpS−T2プライマーの両方を用いた反応からの試料中に観測されたが、L0コントロールまたはプライマーを欠いた試料を用いた試料には観測されなかった。SDSで処理したL3ライゲーション反応生成物ならびにpS−T1およびpS−T2プライマーの両方を用いた試料では、ウェル中により多くの生成物の残留が見られ、RCA産物中の二次構造の変性に合致していた。
実施例2:線状ペアロック分子を用いた亜硫酸水素塩処理によるCからUへの変換を利用したメチル化の検出シミュレーション
亜硫酸水素塩処理によるC残基からU残基への変換を利用した仮想二本鎖DNAフラグメントの配列および5−メチルシトシンの位置の決定を以下のようにシミュレートする。この例の一般スキームが図12に図示されている。DNAの配列は以下に示される。
DNA試料(メチル化されたCはCと示した)
2本の鎖をライゲーションによりリンカー配列(「nnnn」と表されている)に連結し、以下の生成物を得る。そのリンカー配列は配列決定プライマーとして用いるのに適している。
加えて、既知の配列を有する線状フラップ(図示せず)を配列番号7の分子の各末端に付着させる。3’末端のフラップは、配列決定または複製のためのプライマーの結合に適している。5’末端のフラップの相補体は、配列決定または複製のためのプライマーの結合に適している。
その生成物を亜硫酸水素塩ナトリウムで処理すると、シトシン(5−メチルシトシンではない)残基からウラシルへの変換が起こり、以下の生成物が得られる。新たに形成されたウラシル残基は、太字とされ、かつ塩基の上にアスタリスクで印が付られている。
相補鎖(以下に配列番号9と示されている)を、3’末端に付加されたフラップへのプライマーのアニーリングを含むDNA複製によって合成する。
上記二本鎖について両方向に配列決定する。配列決定の中間物が以下に示されている。その配列が獲得されている新生鎖は、反応aにおける配列番号10および反応bにおける配列番号11である。
したがって、これらの反応から得られることが予測されるリードは次の配列を含む。
シトシンのメチル化状態を含む元の試料の配列は、表5に要約されている以下のルールを適用して決定される。元の配列のフォワード鎖は、上記の2つのリードと同じセンスを持つ鎖である。
リードaおよびリードbがいずれもAを有する位置において、元の配列のフォワード鎖もAを有し、リバース鎖はTを有する。リードaおよびリードbがいずれもTを有する位置においては、元の配列のフォワード鎖もTを有し、リバース鎖はAを有する。
リードaおよびリードbがいずれもCを有するとき、元の配列のフォワード鎖はCを有し、リバース鎖はGを有する。リードaおよびリードbがいずれもGを有するとき、元の配列のフォワード鎖はGを有し、リバース鎖はCを有する。
一方のリードが、他方のリードがAを有する位置にGを有するとき、元の配列のフォワード鎖はGを有し、リバース鎖はCを有する。
一方のリードが、他方のリードがCを有する位置にTを有するとき、元の配列のフォワード鎖はCを有し、リバース鎖はGを有する。
両リードで異なる位置にどちらのリードがGおよびT残基を含むかにより、リードaおよびbは、表5の列1および2にマッチする。この例では、リードaは列1に対応している。
配列番号10および11に上記ルールを適用すると、元の配列、つまり、配列番号5および6に回復することとなる(リンカー配列nnnnの除去後)。リードaおよびbの元の配列のフォワード鎖とのアライメントが図10Aに示されている。
実施例3:線状ペアロック分子を用いた光化学的トランジションによるCからTへの変換を利用したメチル化の検出シミュレーション
光化学的トランジションによるCからTへの変換を利用した仮想二本鎖DNAフラグメントの配列および5−メチルシトシンの位置の決定を以下のようにシミュレートする。この例の一般スキームが図13に図示されている。DNAの配列は以下に示される。
2本の鎖をライゲーションによりリンカー配列(「nnnn」と表されている)に連結し、以下の生成物を得る。そのリンカー配列は配列決定プライマーとして用いるのに適している。線状フラップ(図示せず)もこの分子の3’および5’末端に付加する。
5−メチルシトシン(シトシンではない)残基をチミンに光化学的に変換するべく、上記生成物を光で処理して以下の生成物を得る。新たに形成されたチミン残基は、太字とされ、かつ塩基の上または下にアスタリスクで印が付られている。
相補鎖(以下に配列番号13と示されている)を、分子の3’末端に付加されたフラップに結合するプライマーを用いてDNA複製により合成する。
上記二本鎖について、上記の実施例2におけるように、両方向に配列決定し、以下のリードを得る。
シトシンのメチル化状態を含む元の試料の配列は、表6に要約されている以下のルールを適用して決定される。元の配列のフォワード鎖は、上記の2つのリードと同じセンスを持つ鎖である。
リードaおよびリードbがいずれもAを有する位置において、元の配列のフォワード鎖もAを有し、リバース鎖はTを有する。リードaおよびリードbがいずれもTを有する位置においては、元の配列のフォワード鎖もTを有し、リバース鎖はAを有する。
リードaおよびリードbがいずれもCを有するとき、元の配列のフォワード鎖はCを有し、リバース鎖はGを有する。リードaおよびリードbがいずれもGを有するとき、元の配列のフォワード鎖はGを有し、リバース鎖はCを有する。
一方のリードが、他方のリードがAを有する位置にGを有するとき、元の配列のフォワード鎖はGを有し、リバース鎖はCを有する。
一方のリードが、他方のリードがCを有する位置にTを有するとき、元の配列のフォワード鎖はCを有し、リバース鎖はGを有する。
両リードで異なる位置にどちらのリードがGおよびT残基を含むかにより、リードaおよびbは、表6の列1および2にマッチする。この例では、リードaは列1に対応している。
配列番号14および15に上記ルールを適用すると、元の配列、つまり、配列番号5および6に回復することとなる(リンカー配列nnnnの除去後)。リードaおよびbの元の配列のフォワード鎖とのアライメントが図10Bに示されている。
実施例4:シミュレートされたシングルリードおよびマルチプルリード配列決定の正確度の比較
ジェンバンク(GenBank)受託番号U00096、長さ4639675bpのアセンブルされた大腸菌ゲノムの配列をジェンバンクからダウンロードした。長さ500bpから2000bpまでの無作為に選ばれたフラグメントをこの配列から抽出した。これらのフラグメントをマスター配列に指定した。
表7に示されるように定められた比率で、コンピュータにより欠失および誤読エラーを導入することによって、5つの配列をマスター配列から生成した。
エラーを含む5つの配列について、クラスタルダブル(CLUSTALW)アルゴリズム(デフォルト設定)を用いて、マルチプル配列比較分析を行った。共通配列を得るために、クラスタルダブル(CLUSTALW)分析の結果をエンボス(EMBOSS)パッケージのプログラム「cons」の入力として用いた。プログラム「cons」は、ライス(Rice)ら、トレンズ・イン・ジェネティックス(Trends Genet)16,276−277(2000)およびマラン(Mullan)ら、ブリーフ・バイオインフォーマティクス(Brief Bioinform)3,92−94(2002)に記載されている。
最初の部分配列および共通配列をそれぞれマスター配列と比較し、ギャップと誤読の頻度を表にした。表7を参照されたい。その結果、マルチプルリードを用いて共通配列を形成すると、試験された様々なエラー率の各々における誤読およびギャップの頻度が減ることが明らかとなった。各組の欠失および誤読エラー率について、単一のシミュレートされたリードおよび5つのシミュレートされたリードから決定された共通配列をマスター配列に対してアライメントした。誤読されたおよびギャップになった位置の数およびパーセンテージを、アライメントにおける位置の割合として決定した。
実施例5:cPLMを用いた配列決定のシミュレーション
実施例2におけるように二本鎖核酸試料を提供する。図14のcPLM構築ステップに示されるようなヘアピンを形成するインサートの分子の各末端へのライゲーションにより、試料のフォワード鎖およびリバース鎖をロックして、環状ペアロック分子を形成する。合成反応による単一分子配列決定を、インサートのうちの1つに結合するプライマーを用いて行う。試料のフォワード鎖の少なくとも1つの配列および試料のリバース鎖の少なくとも1つの配列を含む配列データを得る。表8にしたがって、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することにより配列データを分析し、核酸試料の配列を決定する。
注:表8および以下の表9〜11において、フォワード鎖を鋳型として獲得した配列は、図14〜17中の配列決定データの上のライン(つまり、「配列決定」と表示された矢印の下方かつ「配列分析」と表示された矢印の上方に示されている配列)にそれぞれ対応する。同様に、リバース鎖を鋳型として獲得した配列は、図14〜17中の配列決定データの下のラインにそれぞれ対応する。
実施例6:環状ペアロック分子を用いた亜硫酸水素塩処理によるCからUへの変換を利用したメチル化の検出のシミュレーション
この例の一般スキームは図15に示されている。実施例2におけるように少なくとも1つの5−メチルシトシンを含む二本鎖核酸試料を提供する。実施例5におけるように環状ペアロック分子を形成する。実施例2におけるように亜硫酸水素塩変換を行う。実施例5におけるように配列データを得る。表9のルールにしたがって、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することにより配列データを分析し、核酸試料の配列および少なくとも1つの5−メチルシトシンの位置を決定する。
実施例7:環状ペアロック分子を用いた光化学的トランジションによるCからTへの変換を利用したメチル化の検出のシミュレーション
この例の一般スキームは図16に示されている。実施例3におけるように少なくとも1つの5−メチルシトシンを含む二本鎖核酸試料を提供する。実施例5におけるように環状ペアロック分子を形成する。実施例3におけるように光化学的トランジションを行う。実施例5におけるように配列データを得る。表10のルールにしたがって、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することにより配列データを分析し、核酸試料の配列および少なくとも1つの5−メチルシトシンの位置を決定する。
実施例8:環状ペアロック分子を用いた5−ブロモウラシルの検出のシミュレーション
この例の一般スキームは図17に示されている。少なくとも1つの5−ブロモウラシルを含む二本鎖核酸試料を提供する。実施例5におけるように環状ペアロック分子を形成する。実施例5におけるように配列データを得る。表11のルールにしたがって、環状ペアロック分子のフォワード鎖およびリバース鎖の配列を比較することにより配列データを分析し、核酸試料の配列および少なくとも1つの5−ブロモウラシルの位置を決定する。
本明細書は、本明細書中で引用された参照文献の教示内容に照らせば、最も完全に理解される。本明細書中の実施形態は、本発明の実施形態の説明を提供するものであり、本発明の範囲を限定するものと解されるべきではない。当業者は、多くの他の実施形態が本発明に含まれることを容易に理解する。この開示において引用した全ての刊行物および特許は、それら全体として参照として組み込まれる。参照として組み込まれる材料が本明細書と相反するまたは矛盾する限りにおいては、本明細書は、いかなるそのような材料にも優先し得る。本明細書中のいかなる参照文献の引用も、かかる参照文献が本発明の先行技術であるということの承認ではない。
特に示さない限り、特許請求の範囲を含めて本明細書中で用いられる成分、反応条件、およびその他の量を表す数字は、いずれも、すべての場合において「約」という用語によって修飾されるものとして理解されるべきである。したがって、そうでないということが特に示されない限り、数値パラメーターは近似値であり、かつ、本発明により得ようとする所望の特性に応じて変わり得る。最低限でも、そしてクレームの範囲への均等論の適用を制限しようとするのではなく、各数値パラメータは、有効数字の数および通常の丸めの手法を踏まえて解釈されるべきである。本明細書における異なる量の有効桁数を持つ一連の数字の列挙は、与えられたより少ない有効桁数を持つ数字が、与えられたより多い有効桁数を持つ数字と同じ精度を有することを示唆するものと解釈されるべきではない。
特許請求の範囲および/または明細書において、「含む」という用語と共に用いる場合の「1つの」という用語の使用は、「1つの」を意味し得るが、「1つまたは複数の」、「少なくとも1つの」および「1つまたは1つよりも多くの」という意味にも整合するものである。特許請求の範囲における「または」という用語の使用は、選択肢のみを指すこと、あるいは、それら選択肢が相互排他的であることが明示的に示されている場合を除いて、「および/または」を意味するものとして用いられるが、本開示は選択肢のみと「および/または」を指すという定義を支持する。
特に示さない限り、一連の要素の前に来る「少なくとも」という用語は、その連なりの中のすべての要素に言及するということが理解されなければならない。当業者は、日常的なものにすぎない実験によって、本明細書に記載される本発明の特定の実施形態の多くの均等物を認めるか、あるいは確認することができる。そのような均等物は、以下の特許請求の範囲に包含されることが意図されている。
特に定義しない限り、本明細書において用いられる全ての技術および科学用語は、この発明が属する分野における当業者が通常理解しているのと同じ意味を有する。本明細書において記載されたのと同じようなまたは均等ないかなる方法および構成要素も、本発明の実施または試験に用いられ得るが、ここでは好ましい方法および構成が記載される。
本明細書で述べた刊行物は、それらの開示が本願の出願日よりも早いために、提示されているにすぎない。先発明の理由で本発明がかかる刊行物に先行する権利がないことの承認と解釈されるものは、本明細書に含まれていない。さらに、提示した刊行日は、実際の刊行日と異なる場合があり、個別に確認することが必要かもしれない。
本発明の他の実施形態は、本明細書の検討および本明細書に開示される本発明の実施から、当業者には明らかとなろう。本明細書および実施例は単なる例示であると考えられることを意図しており、以下の特許請求の範囲により本発明の真の範囲および精神が示される。
1 DNA試料、2 フラグメント、3 リンカー、4 リンカー、5 オリゴヌクレオチド、6 環状分子、7 ポリメラーゼ、8 表面、9 線状コピー、10 分子、11 フォワード鎖、12 リバース鎖、13 ヘアピン、14 ヘアピン、15 フォワード鎖、16 リバース鎖、17 フォワード鎖、18 プライマー、19 セグメント、20 セグメント、21 セグメント、22 核酸試料の部分配列、23 核酸インサートの配列、24 核酸試料の配列、25 核酸インサートの配列、26 核酸試料の配列、27 核酸インサートの配列、28 さらなる配列、29 核酸インサート、30 核酸試料の配列、31 核酸インサートの配列、32 核酸試料の部分配列、33 部分配列、34 非常に長い配列、37 オーバーハングまたは陥凹末端、38 オーバーハングまたは陥凹末端、41 位置、51 配列決定装置、52 計算装置、53 コンピュータ、54 ストレージ、55 バスシステム、56 プロセッサ、57 ディスプレイ、58 キーボード、59 マウス、60 オペレーティングシステム、61 ユーザーインターフェースソフトウェア、62 プロセッシングソフトウェア、63 配列データ

Claims (68)

  1. 核酸試料の配列を決定する方法であって、
    a.核酸インサートおよび前記核酸試料を含む少なくとも1組のインサート−試料ユニットを含む環状核酸分子を提供すること、ここで、前記インサートは既知の配列を有し、
    b.少なくとも2組のインサート−試料ユニットの配列を含む配列データを得ること、ここで、少なくとも2組のインサート−試料ユニットを含む核酸分子が生成され、
    c.ステップ(b)の前記配列データの少なくとも2つのインサートの前記配列のスコアを、前記配列を前記インサートの前記既知の配列と比較することにより計算すること、
    d.前記核酸試料の前記配列の前記リピートのすぐ上流および下流にある前記インサートの前記配列の一方または両方の前記スコアにしたがって、ステップ(b)の前記配列データの前記核酸試料の前記配列の前記リピートのうち少なくとも2つを受け入れるか、あるいは拒否すること、
    e.ステップ(d)で受け入れられた前記核酸試料の前記配列の少なくとも1つのリピートを含む受け入れられた配列セットをコンパイルすること、ならびに
    f.前記受け入れられた配列セットを用いて前記核酸試料の前記配列を決定すること、
    を含む方法。
  2. 配列データを得ることが、単一分子配列決定を含む請求項1に記載の方法。
  3. 前記単一分子配列決定が、合成およびライゲーションシークエンシングによる単一分子配列決定から選ばれる方法よる配列決定を含む請求項2に記載の方法。
  4. 前記単一分子配列決定が、合成によるリアルタイム単一分子配列決定を含む請求項3に記載の方法。
  5. 前記単一分子配列決定が、パイロシークエンシング、可逆的ターミネーターシークエンシング、および第三世代シークエンシングから選ばれる方法による合成による単一分子配列決定を含む請求項3に記載の方法。
  6. 前記単一分子配列決定がナノポアシークエンシングを含む請求項3に記載の方法。
  7. 環状核酸分子を提供することが、前記核酸試料を前記核酸インサートにライゲートして前記環状核酸分子を形成することを含む請求項1に記載の方法。
  8. 前記環状核酸分子が二本鎖である請求項1に記載の方法。
  9. 前記核酸試料がRNA試料から得られる請求項1に記載の方法。
  10. 前記核酸試料がゲノムDNA試料から得られる請求項1に記載の方法。
  11. 前記環状核酸分子が少なくとも2組のインサート−試料ユニットを含む請求項1に記載の方法。
  12. 前記核酸インサートがプロモーターを含み、かつ前記生成物の核酸分子を合成することが、前記プロモーターを、前記プロモーターを認識するRNAポリメラーゼに接触させ、続いてリボヌクレオチド残基を含む生成物の核酸分子を合成することを含む請求項1に記載の方法。
  13. 前記核酸インサートが30℃から90℃の融解温度を有する請求項1に記載の方法。
  14. 前記核酸インサートが14から200ヌクレオチド残基の長さを有する請求項1に記載の方法。
  15. 前記受け入れられた配列セットが、ステップ(e)で拒否された前記核酸試料の前記配列のリピートを消去、上書き、または除くように処理されたステップ(b)の前記配列データを含む多要素変数および単一のデータ文字列から選ばれた形式である請求項1に記載の方法。
  16. 前記受け入れられた配列セットが、リスト、配列、ハッシュ、および行列から選ばれるタイプの前記多要素変数の形式である請求項1に記載の方法。
  17. 前記核酸試料の前記配列の少なくとも2つのリピートが、ステップ(d)で受け入れられ、かつ前記核酸試料の前記配列を決定することが、ステップ(d)で受け入れられた前記核酸試料の前記配列の前記少なくとも2つのリピートに基づいて共通配列を決定することを含む請求項1に記載の方法。
  18. 前記共通配列が、ステップ(d)で受け入れられた前記核酸試料の前記配列の前記少なくとも2つのリピートで一致しない少なくとも1つの位置に、確率的に表された塩基を含む請求項17に記載の方法。
  19. 前記核酸試料の前記配列の少なくとも3つのリピートが、ステップ(d)で受け入れられ、かつ共通配列を決定することが、ステップ(d)で受け入れられた前記核酸試料の前記配列の前記少なくとも3つのリピートの前記過半数の票を決定することを含む請求項17に記載の方法。
  20. 前記共通配列が位置特異的重み行列である請求項17に記載の方法。
  21. 前記共通配列がフラットな配列である請求項17に記載の方法。
  22. 前記フラットな配列が少なくとも1つの多義性コードを含む請求項21に記載の方法。
  23. 前記共通配列が信頼度を含む請求項17に記載の方法。
  24. 前記信頼度が、塩基の出現頻度、情報内容、およびフレッド(phred)クオリティスコアから選ばれた形式で表現される請求項23に記載の方法。
  25. 請求項1のステップ(b)〜(f)がリアルタイムで実行され、かつ前記共通配列および信頼度がリアルタイムで更新される請求項23に記載の方法。
  26. 前記方法が、前記共通配列の位置の事前に選択されたパーセンテージにおける規定の信頼の最低レベルに達せられるまで実行される請求項25に記載の方法。
  27. 位置の事前に選択されたパーセンテージが前記規定の信頼の最低レベルに達するときに警告を発生することをさらに含む請求項26に記載の方法。
  28. 前記規定の信頼の最低レベルが、90%、95%、99%、99.5%、99.9%、99.95%、および99.99%のベースコールの正確度から選ばれる請求項26に記載の方法。
  29. 請求項1の前記核酸試料の前記配列に部分的に重なる配列を有する請求項1の前記核酸試料と同じ起源、種、または菌株からの少なくとも1つの他の核酸試料を用いて、請求項1の前記ステップを繰り返すこと、これにより少なくとも1つの他の配列を決定すること、および前記少なくとも1つの他の配列をステップ(f)の前記配列と共にアセンブルしてコンティグを形成することをさらに含む請求項1に記載の方法。
  30. ステップ(c)の前記スコアが、ステップ(b)の前記配列データ全体の信頼度を評価するのに用いられる請求項1に記載の方法。
  31. スコアを計算することが、前記配列データの前記少なくとも2つのインサートと前記インサートの前記既知の配列との間のミスマッチの数を決定することを含む請求項1に記載の方法。
  32. スコアを計算することが、前記配列データの前記少なくとも2つのインサートの、前記インサートの前記既知の配列に対する同一性パーセントを決定することを含む請求項1に記載の方法。
  33. スコアを計算することが、前記配列データの前記少なくとも2つのインサートと前記インサートの前記既知の配列との間のアライメントを行うことを含む請求項1に記載の方法。
  34. アライメントを行うことが、BLAST、MEGABLAST、Smith−Watermanアライメント、およびNeedleman−Wunschアライメントから選ばれたアルゴリズムを用いることを含む請求項33に記載の方法。
  35. 前記スコアが、カウントベースおよび比率ベースから選ばれる根拠に基づいて生成される請求項1に記載の方法。
  36. ステップ(b)の前記配列データの前記核酸試料の前記配列の前記リピートの少なくとも2つを受け入れるか、あるいは拒否することが、スコアが事前に定めた閾値以上である試料インサート配列のすぐ上流または下流にある前記核酸試料の前記配列の前記少なくとも2つのリピートのうちのそれらリピートを受け入れること、およびそうではないそれらを拒否することを含む請求項1に記載の方法。
  37. プロセッサ、ストレージ、バスシステム、および少なくとも1つのユーザーインターフェースエレメントを含む計算装置に操作可能に連結された配列決定装置を含むシステムであって、前記ストレージが、ユーザーの任意入力により、前記プロセッサにより実行されるときに、下記の方法を実行するオペレーティングシステム、ユーザーインターフェースソフトウェア、および命令を含む、プログラミングによりエンコードされたものであり、該方法が
    a.核酸インサートおよび核酸試料を含む少なくとも1組のインサート−試料ユニットを含む環状核酸分子から配列データを獲得すること、ここで、
    (i)前記インサートが既知の配列を有し、
    (ii)前記配列データが少なくとも2組のインサート−試料ユニットの配列を含み、かつ
    (iii)少なくとも2組のインサート−試料ユニットを含む核酸分子が生成され、
    b.ステップ(a)の前記配列データの少なくとも2つのインサートの前記配列のスコアを、前記配列を前記インサートの前記既知の配列と比較することにより計算すること、 c.前記核酸試料の前記配列の前記リピートのすぐ上流および下流にある前記インサートの前記配列の一方または両方の前記スコアにしたがって、ステップ(a)の前記配列データの前記核酸試料の前記配列の前記リピートの少なくとも2つを受け入れるか、あるいは拒否すること、
    d.ステップ(c)で受け入れられた前記核酸試料の前記配列の少なくとも1つのリピートを含む受け入れられた配列セットをコンパイルすること、ならびに
    e.前記受け入れられた配列セットを用いて前記核酸試料の前記配列を決定すること、
    を含み、
    前記システムの出力が、(i)核酸試料の配列または(ii)核酸試料中の少なくとも1つの位置に修飾塩基があることの表示のうち少なくとも1つを生じるのに用いられる、システム。
  38. ユーザーの任意入力により、プロセッサ、ストレージ、バスシステム、および少なくとも1つのユーザーインターフェースエレメントを含む計算装置に操作可能に連結された配列決定装置を含むシステム上のプロセッサにより実行されるときに、下記の方法を実行するオペレーティングシステム、ユーザーインターフェースソフトウェア、および命令を含むプログラミングによりエンコードされたストレージであって、該方法が、
    a.核酸インサートおよび核酸試料を含む少なくとも1組のインサート−試料ユニットを含む環状核酸分子から配列データを獲得すること、ここで、
    (i)前記インサートが既知の配列を有し、
    (ii)前記配列データが少なくとも2組のインサート−試料ユニットの配列を含み、かつ
    (iii)少なくとも2組のインサート−試料ユニットを含む核酸分子が生成され、
    b.ステップ(a)の前記配列データの少なくとも2つのインサートの前記配列のスコアを、前記配列を前記インサートの前記既知の配列と比較することにより計算すること、
    c.前記核酸試料の前記配列の前記リピートのすぐ上流および下流にある前記インサートの前記配列の一方または両方の前記スコアにしたがって、ステップ(a)の前記配列データの前記核酸試料の前記配列の前記リピートのうち少なくとも2つを受け入れるか、あるいは拒否すること、
    d.ステップ(c)で受け入れられた前記核酸試料の前記配列の少なくとも1つのリピートを含む受け入れられた配列セットをコンパイルすること、ならびに
    e.前記受け入れられた配列セットを用いて前記核酸試料の前記配列を決定すること、を含み、
    前記方法により、(i)核酸試料の配列または(ii)核酸試料中の少なくとも1つの位置に修飾塩基があることの表示のうち少なくとも1つを生じるのに用いられる出力が生じることとなる、ストレージ。
  39. 二本鎖核酸試料の配列および前記配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、
    a.前記フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、
    b.単一分子配列決定により前記環状ペアロック分子の配列データを得ること、ここで、前記配列データは、前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の配列を含み、
    c.前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列を決定すること、
    d.前記環状ペアロック分子の特定タイプの塩基の前記塩基対合特異性を変えて、変化した環状ペアロック分子を生成すること、
    e.前記変化した環状ペアロック分子の前記配列データを得ること、ここで、前記配列データが前記変化したフォワード鎖およびリバース鎖の配列を含み、ならびに
    f.前記変化したフォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列中の修飾塩基の前記位置を決定すること、
    を含む方法。
  40. 前記二本鎖核酸試料が、細胞、ウィルス、または環境起源からの一次単離物として得られる請求項39に記載の方法。
  41. 前記一次単離物が、請求項39のステップ(a)よりも前に、実質的に二価陽イオンおよび核酸修飾酵素がない条件において25℃以下に保たれる請求項40に記載の方法。
  42. 前記二本鎖核酸試料が、インビトロ反応から、または細胞外核酸から得られる請求項39に記載の方法。
  43. 前記環状ペアロック分子の特定タイプの塩基の前記塩基対合特異性を変化させることが、亜硫酸水素塩処理を含む請求項39に記載の方法。
  44. 前記環状ペアロック分子の特定タイプの塩基の前記塩基対合特異性を変化させることが、光化学的トランジションを含む請求項39に記載の方法。
  45. 前記フォワード鎖およびリバース鎖をロックすることが、同じであっても同じでなくてもよい2つの核酸インサートを、1つを各々の末端につなげて、前記二本鎖核酸試料に連結することを含む請求項39に記載の方法。
  46. 前記核酸インサートが14から200ヌクレオチド残基の長さを有する請求項45に記載の方法。
  47. 前記核酸インサートが既知の配列を有する請求項45に記載の方法。
  48. 前記核酸インサートがオーバーハングを有するヘアピンを形成し、かつ前記核酸試料が、前記核酸インサートの前記オーバーハングと適合するオーバーハングを有する請求項45に記載の方法。
  49. 配列データを得ることが、前記核酸インサートのうち少なくとも1つの少なくとも一部に相補的なプライマーを、前記鋳型にアニーリングすること、および前記プライマーを伸長させることを含む請求項45に記載の方法。
  50. 前記核酸インサートのうちの少なくとも1つがプロモーターを含み、かつ配列データを得ることが、前記プロモーターを、前記プロモーターを認識するRNAポリメラーゼに接触させ、続いてリボヌクレオチド残基を含む生成物の核酸分子を合成することを含む請求項45に記載の方法。
  51. 連結がライゲーションにより達成される請求項45に記載の方法。
  52. 前記二本鎖核酸試料が、連結された複数の試料を含む請求項39に記載の方法。
  53. 前記複数の前記試料が、介在する核酸インサートを介して連結される請求項52に記載の方法。
  54. 前記フォワード鎖およびリバース鎖をロックすることが、前記核酸インサートの前記オーバーハングを前記核酸試料の前記適合するオーバーハングに接触させることにより形成される複合体をライゲートすることを含む請求項53に記載の方法。
  55. 前記二本鎖核酸試料がゲノムDNAフラグメントである請求項39に記載の方法。
  56. 前記二本鎖核酸試料が少なくとも1つのRNA鎖を含む請求項39に記載の方法。
  57. 前記単一分子配列決定が、合成およびライゲーションシークエンシングによる単一分子配列決定から選ばれる方法による配列決定を含む請求項39に記載の方法。
  58. 前記単一分子配列決定が、合成によるリアルタイム単一分子配列決定を含む請求項39に記載の方法。
  59. 前記単一分子配列決定が、パイロシークエンシング、可逆的ターミネーターシークエンシング、および第三世代シークエンシングから選ばれる方法による合成による単一分子配列決定を含む請求項39に記載の方法。
  60. 前記単一分子配列決定がナノポアシークエンシングを含む請求項39に記載の方法。
  61. 前記環状ペアロック分子の前記フォワード鎖およびリバース鎖が核酸インサートによりロックされており、
    ステップ(b)で得られた前記配列データが、前記環状ペアロック分子の前記配列の少なくとも2つのコピーを含み、各コピーは第1および第2のインサート−試料ユニットの配列を含んでおり、
    前記第1および第2のインサート−試料ユニットの前記配列は、同じであっても同じでなくてもよいインサート配列、および前記核酸試料の前記配列の反対向きのリピートを含み、かつ
    前記方法が、
    g.前記配列データ中に含まれる少なくとも4つのインサートの前記配列のスコアを、前記少なくとも4つのインサートの前記配列を前記インサートの前記既知の配列と比較することによって計算すること、
    h.各方向における少なくとも1つの試料配列が受け入れられるという条件にしたがい、前記試料配列のすぐ上流および下流にある前記インサートの前記配列の一方または両方のスコアに基づいて、前記配列データ中に含まれる前記核酸試料の前記配列の前記リピートの少なくとも4つを受け入れるか、あるいは拒否すること、
    i.ステップ(g)で受け入れられた各方向における前記少なくとも1つの試料の配列を含む受け入れられた配列セットをコンパイルすること、ならびに
    j.前記受け入れられた配列セットを用いて前記核酸試料の前記配列を決定すること
    をさらに含む請求項39に記載の方法。
  62. 二本鎖核酸試料の配列を決定する方法であって、
    a.前記核酸試料の前記フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、
    b.単一分子配列決定により前記環状ペアロック分子の配列データを得ること、ここで、配列データは、前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の配列を含み、ならびに
    c.前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列を決定すること、
    を含む方法。
  63. 二本鎖核酸試料の配列および前記配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、
    a.前記核酸試料の前記フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、
    b.単一分子配列決定により前記環状ペアロック分子の配列データを得ること、ここで、配列データは、前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の配列を含み、ならびに
    c.前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列および前記二本鎖核酸試料の前記配列中の前記少なくとも1つの修飾塩基の前記位置を決定すること、
    を含む方法。
  64. 前記二本鎖核酸試料が、5−ブロモウラシル、ウラシル、5,6−ジヒドロウラシル、リボチミン、7−メチルグアニン、ヒポキサンチン、およびキサンチンから選ばれる少なくとも1つの修飾塩基を含む請求項63に記載の方法。
  65. 前記二本鎖核酸試料中の少なくとも1つの修飾塩基が、その優先的なパートナー塩基とは異なる塩基対合特異性を有する塩基と対合する請求項63に記載の方法。
  66. 二本鎖核酸試料の配列および前記配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、
    a.前記核酸試料の前記フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、
    b.前記環状ペアロック分子中の特定タイプの塩基の前記塩基対合特異性を変化させること、
    c.単一分子配列決定により前記環状ペアロック分子の配列データを得ること、ここで、配列データは、前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の配列を含み、ならびに
    d.前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列および前記二本鎖核酸試料の前記配列中の前記少なくとも1つの修飾塩基の前記位置を決定すること、
    を含む方法。
  67. 二本鎖核酸試料の配列および前記配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、
    a.前記フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、
    b.単一分子配列決定により前記環状ペアロック分子の配列データを得ること、ここで、前記配列データは、前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の配列を含み、
    c.前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列を決定すること、
    d.単一分子配列決定により前記環状ペアロック分子の配列決定データを得ること、ここで、塩基とその修飾型を区別する少なくとも1つのヌクレオチド類似体が、前記少なくとも1つの異なるように標識されたヌクレオチド類似体が取り込まれた少なくとも1つの位置を含む配列データを得るために用いられ、ならびに
    e.前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列中の修飾塩基の前記位置を決定すること、
    を含む方法。
  68. 二本鎖核酸試料の配列および前記配列中の少なくとも1つの修飾塩基の位置を決定する方法であって、
    a.前記核酸試料の前記フォワード鎖およびリバース鎖をロックして環状ペアロック分子を形成すること、
    b.単一分子配列決定により前記環状ペアロック分子の配列データを得ること、ここで、塩基とその修飾型を区別する少なくとも1つのヌクレオチド類似体が、前記少なくとも1つの異なるように標識されたヌクレオチド類似体が取り込まれた少なくとも1つの位置を含む配列データを得るために用いられ、ならびに
    c.前記環状ペアロック分子の前記フォワード鎖およびリバース鎖の前記配列を比較することによって前記二本鎖核酸試料の前記配列および前記二本鎖核酸試料の前記配列中の前記少なくとも1つの修飾塩基の前記位置を決定すること、
    を含む方法。
JP2011534995A 2008-11-07 2009-11-06 正確な配列データおよび修飾塩基位置決定の方法 Active JP5483628B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US11254808P 2008-11-07 2008-11-07
US61/112,548 2008-11-07
US16731309P 2009-04-07 2009-04-07
US61/167,313 2009-04-07
US12/613,291 2009-11-05
US12/613,291 US8486630B2 (en) 2008-11-07 2009-11-05 Methods for accurate sequence data and modified base position determination
PCT/CN2009/074851 WO2010051773A1 (en) 2008-11-07 2009-11-06 Methods for accurate sequence data and modified base position determination

Publications (2)

Publication Number Publication Date
JP2012507990A true JP2012507990A (ja) 2012-04-05
JP5483628B2 JP5483628B2 (ja) 2014-05-07

Family

ID=42152512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011534995A Active JP5483628B2 (ja) 2008-11-07 2009-11-06 正確な配列データおよび修飾塩基位置決定の方法

Country Status (10)

Country Link
US (7) US8486630B2 (ja)
EP (2) EP2245187B1 (ja)
JP (1) JP5483628B2 (ja)
CN (2) CN103484560B (ja)
AU (1) AU2009311073B2 (ja)
DK (1) DK2245187T3 (ja)
ES (1) ES2528253T3 (ja)
PL (1) PL2245187T3 (ja)
TW (1) TWI385253B (ja)
WO (1) WO2010051773A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013094149A (ja) * 2011-11-04 2013-05-20 Hitachi Ltd Dna配列解読システム、dna配列解読方法及びプログラム

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110005918A1 (en) 2007-04-04 2011-01-13 Akeson Mark A Compositions, devices, systems, and methods for using a nanopore
WO2009120374A2 (en) 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
JP2011515102A (ja) 2008-03-28 2011-05-19 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 核酸シーケンシング用組成物及び方法
US8486630B2 (en) 2008-11-07 2013-07-16 Industrial Technology Research Institute Methods for accurate sequence data and modified base position determination
US20230148447A9 (en) 2008-12-11 2023-05-11 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
US9175338B2 (en) 2008-12-11 2015-11-03 Pacific Biosciences Of California, Inc. Methods for identifying nucleic acid modifications
EP2370598B1 (en) 2008-12-11 2017-02-15 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates
CA2750879C (en) * 2009-01-30 2018-05-22 Oxford Nanopore Technologies Limited Adaptors for nucleic acid constructs in transmembrane sequencing
US9778188B2 (en) 2009-03-11 2017-10-03 Industrial Technology Research Institute Apparatus and method for detection and discrimination molecular object
US8324914B2 (en) 2010-02-08 2012-12-04 Genia Technologies, Inc. Systems and methods for characterizing a molecule
US9678055B2 (en) 2010-02-08 2017-06-13 Genia Technologies, Inc. Methods for forming a nanopore in a lipid bilayer
US9605307B2 (en) 2010-02-08 2017-03-28 Genia Technologies, Inc. Systems and methods for forming a nanopore in a lipid bilayer
AU2011217862B9 (en) 2010-02-19 2014-07-10 Pacific Biosciences Of California, Inc. Integrated analytical system and method
US8994946B2 (en) 2010-02-19 2015-03-31 Pacific Biosciences Of California, Inc. Integrated analytical system and method
US9482615B2 (en) 2010-03-15 2016-11-01 Industrial Technology Research Institute Single-molecule detection system and methods
US9670243B2 (en) 2010-06-02 2017-06-06 Industrial Technology Research Institute Compositions and methods for sequencing nucleic acids
US8865078B2 (en) 2010-06-11 2014-10-21 Industrial Technology Research Institute Apparatus for single-molecule detection
US8845880B2 (en) 2010-12-22 2014-09-30 Genia Technologies, Inc. Nanopore-based single DNA molecule characterization, identification and isolation using speed bumps
US8962242B2 (en) 2011-01-24 2015-02-24 Genia Technologies, Inc. System for detecting electrical properties of a molecular complex
US9110478B2 (en) 2011-01-27 2015-08-18 Genia Technologies, Inc. Temperature regulation of measurement arrays
WO2012138973A2 (en) 2011-04-06 2012-10-11 The University Of Chicago COMPOSITION AND METHODS RELATED TO MODIFICATION OF 5-METHYLCYTOSINE (5mC)
AU2012288629B2 (en) 2011-07-25 2017-02-02 Oxford Nanopore Technologies Limited Hairpin loop method for double strand polynucleotide sequencing using transmembrane pores
EP2574923A1 (en) * 2011-09-28 2013-04-03 Koninklijke Philips Electronics N.V. Apparatus for the processing of single molecules
US9238836B2 (en) 2012-03-30 2016-01-19 Pacific Biosciences Of California, Inc. Methods and compositions for sequencing modified nucleic acids
US8986629B2 (en) 2012-02-27 2015-03-24 Genia Technologies, Inc. Sensor circuit for controlling, detecting, and measuring a molecular complex
WO2013131888A1 (en) 2012-03-06 2013-09-12 Rudolf Rigler Cyclic single molecule sequencing process
WO2013163207A1 (en) 2012-04-24 2013-10-31 Pacific Biosciences Of California, Inc. Identification of 5-methyl-c in nucleic acid templates
JP2015525077A (ja) 2012-06-15 2015-09-03 ジェニア・テクノロジーズ・インコーポレイテッド チップの構成および高精度な核酸配列決定
US9372308B1 (en) 2012-06-17 2016-06-21 Pacific Biosciences Of California, Inc. Arrays of integrated analytical devices and methods for production
WO2014013259A1 (en) 2012-07-19 2014-01-23 Oxford Nanopore Technologies Limited Ssb method
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
WO2014099776A1 (en) 2012-12-18 2014-06-26 Pacific Biosciences Of California, Inc. Illumination of optical analytical devices
US9759711B2 (en) 2013-02-05 2017-09-12 Genia Technologies, Inc. Nanopore arrays
EP2959283B1 (en) 2013-02-22 2022-08-17 Pacific Biosciences of California, Inc. Integrated illumination of optical analytical devices
SG11201507138RA (en) 2013-03-08 2015-10-29 Oxford Nanopore Tech Ltd Enzyme stalling method
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
US9146248B2 (en) 2013-03-14 2015-09-29 Intelligent Bio-Systems, Inc. Apparatus and methods for purging flow cells in nucleic acid sequencing instruments
US9591268B2 (en) 2013-03-15 2017-03-07 Qiagen Waltham, Inc. Flow cell alignment methods and systems
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
EP3640349A3 (en) 2013-10-23 2020-07-29 Roche Sequencing Solutions, Inc. High speed molecular sensing with nanopores
US9322062B2 (en) 2013-10-23 2016-04-26 Genia Technologies, Inc. Process for biosensor well formation
EP3068896B1 (en) 2013-11-12 2018-08-08 Life Technologies Corporation Reagents and methods for sequencing
CN103853937B (zh) * 2013-11-27 2017-02-01 上海丰核信息科技有限公司 高通量测序数据后期处理方法
US9540688B2 (en) 2014-02-19 2017-01-10 Personal Genomics, Inc. Real-time sequencing method for single molecule
GB201403096D0 (en) 2014-02-21 2014-04-09 Oxford Nanopore Tech Ltd Sample preparation method
WO2016033207A1 (en) 2014-08-27 2016-03-03 Pacific Biosciences Of California, Inc. Arrays of integrated analyitcal devices
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
WO2016100049A1 (en) 2014-12-18 2016-06-23 Edico Genome Corporation Chemically-sensitive field effect transistor
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
EP4220256A1 (en) 2015-03-16 2023-08-02 Pacific Biosciences of California, Inc. Analytical system comprising integrated devices and systems for free-space optical coupling
WO2016201387A1 (en) 2015-06-12 2016-12-15 Pacific Biosciences Of California, Inc. Integrated target waveguide devices and systems for optical coupling
JP6942129B2 (ja) 2015-11-25 2021-09-29 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft ポリメラーゼ複合体の精製
EP3459115A4 (en) 2016-05-16 2020-04-08 Agilome, Inc. GRAPHEN-FET DEVICES, SYSTEMS AND METHODS FOR USE THEREOF FOR SEQUENCING NUCLEIC ACIDS
GB201609220D0 (en) 2016-05-25 2016-07-06 Oxford Nanopore Tech Ltd Method
TWI578180B (zh) * 2016-07-13 2017-04-11 國立臺灣師範大學 微核糖核酸與腦部疾病風險的關聯性運算平台
TWI607332B (zh) * 2016-12-21 2017-12-01 國立臺灣師範大學 Correlation between persistent organic pollutants and microRNAs station
US11091791B2 (en) * 2017-02-24 2021-08-17 Mgi Tech Co., Ltd. Methods for hybridization based hook ligation
EP3682027A1 (en) 2017-09-15 2020-07-22 H. Hoffnabb-La Roche Ag Hybridization-extension-ligation strategy for generating circular single-stranded dna libraries
JP7304852B2 (ja) * 2017-11-03 2023-07-07 ガーダント ヘルス, インコーポレイテッド 脱アミノ化に誘導される配列エラーの補正
SG11202004534RA (en) * 2017-11-21 2020-06-29 4basebio Sl Methods and kits for amplification of double stranded dna
CN109273047B (zh) * 2017-12-15 2022-09-16 武汉科技大学 一种基于模拟退火的核酸结构预测方法
CN108268752B (zh) * 2018-01-18 2019-02-01 东莞博奥木华基因科技有限公司 一种染色体异常检测装置
GB201807793D0 (en) 2018-05-14 2018-06-27 Oxford Nanopore Tech Ltd Method
CN108681658B (zh) * 2018-05-22 2021-09-21 贵州医科大学 一种优化外源基因在大肠杆菌中翻译速度的方法
CN108753765B (zh) * 2018-06-08 2020-12-08 中国科学院遗传与发育生物学研究所 一种构建超长连续dna序列的基因组组装方法
US20210217493A1 (en) * 2018-07-27 2021-07-15 Seekin, Inc. Reducing noise in sequencing data
NZ788335A (en) * 2019-08-16 2023-02-24 Univ Hong Kong Chinese Determination of base modifications of nucleic acids
WO2021067484A1 (en) 2019-09-30 2021-04-08 Guardant Health, Inc. Compositions and methods for analyzing cell-free dna in methylation partitioning assays
CN113122616A (zh) 2019-12-30 2021-07-16 财团法人工业技术研究院 扩增和确定目标核苷酸序列的方法
CN111145832B (zh) * 2019-12-31 2021-05-07 云舟生物科技(广州)有限公司 载体的元件插入方法、计算机存储介质及电子设备
US11946044B2 (en) 2020-07-30 2024-04-02 Guardant Health, Inc. Methods for isolating cell-free DNA
CN111970351B (zh) * 2020-08-11 2021-06-22 震坤行工业超市(上海)有限公司 一种基于数据对齐的物联网多维传感优化方法及系统
CN112102883B (zh) * 2020-08-20 2023-12-08 深圳华大生命科学研究院 一种fastq文件压缩中的碱基序列编码方法和系统
US20230279382A1 (en) * 2022-03-04 2023-09-07 Element Biosciences, Inc. Single-stranded splint strands and methods of use
US20220154285A1 (en) 2020-09-30 2022-05-19 Guardant Health, Inc. Analysis of methylated dna comprising methylation-sensitive or methylation-dependent restrictions
JP2023547620A (ja) 2020-10-23 2023-11-13 ガーダント ヘルス, インコーポレイテッド 分配および塩基変換を使用してdnaを解析するための組成物および方法
EP4251765A1 (en) 2020-11-30 2023-10-04 Guardant Health, Inc. Compositions and methods for enriching methylated polynucleotides
EP4291679A1 (en) 2021-02-12 2023-12-20 Guardant Health, Inc. Methods and compositions for detecting nucleic acid variants
WO2023122623A1 (en) 2021-12-21 2023-06-29 Guardant Health, Inc. Methods and systems for combinatorial chromatin-ip sequencing
WO2023122740A1 (en) 2021-12-23 2023-06-29 Guardant Health, Inc. Compositions and methods for detection of metastasis
WO2024006908A1 (en) 2022-06-30 2024-01-04 Guardant Health, Inc. Enrichment of aberrantly methylated dna
WO2024073508A2 (en) 2022-09-27 2024-04-04 Guardant Health, Inc. Methods and compositions for quantifying immune cell dna

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003515149A (ja) * 1999-11-26 2003-04-22 キュラジェン コーポレイション 核酸プローブアレイ
JP2003514514A (ja) * 1999-09-16 2003-04-22 キュラジェン コーポレイション 核酸を配列決定する方法
JP2005505748A (ja) * 2001-03-21 2005-02-24 キュラジェン コーポレイション 核酸の配列決定のための装置および方法
WO2007106509A2 (en) * 2006-03-14 2007-09-20 Genizon Biosciences, Inc. Methods and means for nucleic acid sequencing
JP2007530020A (ja) * 2004-03-25 2007-11-01 ゲニゾン バイオサイエンシス インコーポレイテッド 核酸の配列決定のための方法および手段
WO2009017678A2 (en) * 2007-07-26 2009-02-05 Pacific Biosciences Of California, Inc. Molecular redundant sequencing
WO2009120372A2 (en) * 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4264731A (en) 1977-05-27 1981-04-28 The Regents Of The University Of California DNA Joining method
US5834202A (en) * 1992-08-04 1998-11-10 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
ES2192559T3 (es) 1993-11-12 2003-10-16 Akzo Nobel Nv Vacuna para la proteccion de aves de corral contra la coccidiosis.
US6764835B2 (en) * 1995-12-07 2004-07-20 Diversa Corporation Saturation mutageneis in directed evolution
US6087099A (en) * 1997-09-08 2000-07-11 Myriad Genetics, Inc. Method for sequencing both strands of a double stranded DNA in a single sequencing reaction
US6235502B1 (en) * 1998-09-18 2001-05-22 Molecular Staging Inc. Methods for selectively isolating DNA using rolling circle amplification
US7211390B2 (en) * 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7809509B2 (en) * 2001-05-08 2010-10-05 Ip Genesis, Inc. Comparative mapping and assembly of nucleic acid sequences
US7452699B2 (en) * 2003-01-15 2008-11-18 Dana-Farber Cancer Institute, Inc. Amplification of DNA in a hairpin structure, and applications
US7399614B2 (en) * 2004-06-30 2008-07-15 Applera Corporation 5-methylcytosine detection, compositions and methods therefor
US20060024711A1 (en) * 2004-07-02 2006-02-02 Helicos Biosciences Corporation Methods for nucleic acid amplification and sequence determination
JP2008513782A (ja) 2004-09-17 2008-05-01 パシフィック バイオサイエンシーズ オブ カリフォルニア, インコーポレイテッド 分子解析のための装置及び方法
JP2006333739A (ja) * 2005-05-31 2006-12-14 Hitachi High-Technologies Corp 単分子計測による核酸分析方法
US20070020640A1 (en) * 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
US7282337B1 (en) * 2006-04-14 2007-10-16 Helicos Biosciences Corporation Methods for increasing accuracy of nucleic acid sequencing
WO2009120374A2 (en) * 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Methods and compositions for nucleic acid sample preparation
US8486630B2 (en) 2008-11-07 2013-07-16 Industrial Technology Research Institute Methods for accurate sequence data and modified base position determination
EP2370598B1 (en) 2008-12-11 2017-02-15 Pacific Biosciences Of California, Inc. Classification of nucleic acid templates

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003514514A (ja) * 1999-09-16 2003-04-22 キュラジェン コーポレイション 核酸を配列決定する方法
JP2003515149A (ja) * 1999-11-26 2003-04-22 キュラジェン コーポレイション 核酸プローブアレイ
JP2005505748A (ja) * 2001-03-21 2005-02-24 キュラジェン コーポレイション 核酸の配列決定のための装置および方法
JP2007530020A (ja) * 2004-03-25 2007-11-01 ゲニゾン バイオサイエンシス インコーポレイテッド 核酸の配列決定のための方法および手段
WO2007106509A2 (en) * 2006-03-14 2007-09-20 Genizon Biosciences, Inc. Methods and means for nucleic acid sequencing
WO2009017678A2 (en) * 2007-07-26 2009-02-05 Pacific Biosciences Of California, Inc. Molecular redundant sequencing
WO2009120372A2 (en) * 2008-03-28 2009-10-01 Pacific Biosciences Of California, Inc. Compositions and methods for nucleic acid sequencing

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013094149A (ja) * 2011-11-04 2013-05-20 Hitachi Ltd Dna配列解読システム、dna配列解読方法及びプログラム

Also Published As

Publication number Publication date
US11676682B1 (en) 2023-06-13
US9747414B2 (en) 2017-08-29
US10515714B2 (en) 2019-12-24
TWI385253B (zh) 2013-02-11
EP2245187B1 (en) 2014-12-17
US9767251B2 (en) 2017-09-19
WO2010051773A1 (en) 2010-05-14
EP2740806B1 (en) 2017-03-08
CN103484560B (zh) 2014-11-05
EP2740806A2 (en) 2014-06-11
US20120295260A1 (en) 2012-11-22
US20140256570A1 (en) 2014-09-11
CN102076871A (zh) 2011-05-25
US20130230909A1 (en) 2013-09-05
US20150379194A1 (en) 2015-12-31
US20180018425A1 (en) 2018-01-18
CN103484560A (zh) 2014-01-01
US8486630B2 (en) 2013-07-16
JP5483628B2 (ja) 2014-05-07
PL2245187T3 (pl) 2015-05-29
AU2009311073B2 (en) 2012-04-26
EP2245187A4 (en) 2013-06-26
ES2528253T3 (es) 2015-02-05
AU2009311073A1 (en) 2010-05-14
DK2245187T3 (en) 2015-03-30
TW201018731A (en) 2010-05-16
CN102076871B (zh) 2014-01-01
EP2740806A3 (en) 2014-08-20
US20100121582A1 (en) 2010-05-13
EP2245187A1 (en) 2010-11-03

Similar Documents

Publication Publication Date Title
US11676682B1 (en) Methods for accurate sequence data and modified base position determination
Rapley et al. Molecular biology and biotechnology
JP6685324B2 (ja) 特異的分子インデックス(umi)を有する冗長リードを用いたシーケンシングdna断片におけるエラーの抑制
RU2752700C2 (ru) Способы и композиции для днк-профилирования
US10373705B2 (en) Providing nucleotide sequence data
US20230074210A1 (en) Methods for removal of adaptor dimers from nucleic acid sequencing preparations
JP2022513343A (ja) 次世代シーケンスにおいて低サンプルインプットを扱うための正規化対照
EP3870718B1 (en) Methods and uses of introducing mutations into genetic material for genome assembly
Singh et al. Next-generation sequencing technologies: approaches and applications for crop improvement
US20230235320A1 (en) Methods and compositions for analyzing nucleic acid
Vats Bio-Informatics Analysis of Meta-Transcriptomics Sequencing
Muhindira A novel approach for the assembly of complex genomic DNA cloned into bacterial artificial chromosome vectors: Assembly and analysis of Triticum aestivum chromosome arm 7DS

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140214

R150 Certificate of patent or registration of utility model

Ref document number: 5483628

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S201 Request for registration of exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R314201

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250