JP6494045B2 - 標的シーケンシングおよびuidフィルタリング - Google Patents

標的シーケンシングおよびuidフィルタリング Download PDF

Info

Publication number
JP6494045B2
JP6494045B2 JP2016551299A JP2016551299A JP6494045B2 JP 6494045 B2 JP6494045 B2 JP 6494045B2 JP 2016551299 A JP2016551299 A JP 2016551299A JP 2016551299 A JP2016551299 A JP 2016551299A JP 6494045 B2 JP6494045 B2 JP 6494045B2
Authority
JP
Japan
Prior art keywords
sequence
primer
target
polynucleotide
complementary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016551299A
Other languages
English (en)
Other versions
JP2017511121A (ja
Inventor
フランソワ ヴィニョー
フランソワ ヴィニョー
ウィリアム ドナヒュー
ウィリアム ドナヒュー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of JP2017511121A publication Critical patent/JP2017511121A/ja
Application granted granted Critical
Publication of JP6494045B2 publication Critical patent/JP6494045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]

Description

背景
多くの最新次世代シーケンシング(NGS)技術では、逐次合成によるシーケンシング(sequencing by synthesis)(SBS)法の一形態を使用する。NGS技術には何百万というDNAテンプレートを大量に並列シーケンシングする能力がある。高いスループットを達成するために、何百万もの一本鎖テンプレートをチップ上にアレイ化し、各テンプレートの配列が独立して読まれる。第2世代のNGSプラットフォームでは、固形支持体上でDNAテンプレートをクローン増幅し、次にサイクルシーケンシングを行う。第3世代のNGSプラットフォームでは単分子PCRフリープロトコールおよびサイクルフリーケミストリーを使用する(Schadt et al., Hum Mol Genet, 19(R2):R227-40,(2010)(非特許文献1))。
NGS法および他のハイスループットシーケンシング法の大きな制約として、シーケンシングおよび増幅のエラーおよびバイアスが挙げられる。増幅およびシーケンシングに関連するエラーとバイアスゆえに、これらのシーケンシング技術は、リードの理想的な均一分布からは逸脱し、多くの科学的応用および医学的応用を損ないうる。臨床応用の場合、検査室は、患者に報告する前に、変異コールまたは一塩基多型(SNP)コールの精度を検証しなければならない。配列検証は、典型的には、配列の取得後に標的のサンガーライブラリー(Sanger library)を作製し、次世代シーケンシング(NGS)結果を「サンガー修飾(Sanger qualifying)」することによって行われる。伝統的なサンガーシーケンシングと比較して高い、NGSプラットフォームのエラー率を克服するには、塩基を正確にコールするために、高レベルの冗長性または配列被覆度が要求される。正確な塩基コールには、通例、30〜50倍の被覆度が要求されるが、これは、シーケンシングプラットフォームの精度、バリアント検出方法、およびシーケンシングされる材料に基づいて変動しうる(Koboldt DC et al., Brief Bioinform., 11:484-98(2010)(非特許文献2))。一般に、第2世代のプラットフォームはいずれも、十分なシーケンシング深度(例えば被覆度)に頼って、より高い精度の塩基コールを行うことで、類似する精度(98〜99.5%)のデータを生成する。
シーケンシングバイアスは、被覆度バイアス(リードの均一な分布からの逸脱)およびエラーバイアス(均一なミスマッチ率、挿入率、および欠失率からの逸脱)として現れうる。最新のシーケンシング技術には制約がある。ハイスループットシーケンシング法に使用されるケミストリーには、本質的にバイアスがかかっているからである。一部のヌクレオチド配列は他の配列より頻繁に読まれ、固有のエラー率を有する。使用するシーケンシングプラットフォームを含む数多くの因子に依存して、100〜2000塩基に1エラーの範囲で、リードエラー(その大半は低品質塩基コールによる誤認塩基である)が起こりうる。被覆度バイアスは重要なシーケンシング測定規準であるが、配列精度の変動も重要である。
別の大きな制約はPCR増幅バイアスである。なぜなら、シーケンシング用のヌクレオチドテンプレートのライブラリー構築時の条件が、シーケンシングバイアスに著しい影響を及ぼしうるからである。ライブラリー構築のためのPCR増幅はシーケンシングデータエラーの発生源であることが示されている(Keohavong P et al., PNAS 86:9253-9257(1989)(非特許文献3); Cariello et al., Nucleic Acids Res., 19:4193-4198(1991)(非特許文献4); Cline et al., Nucleic Acids Res., 24:3546-3551(1996)(非特許文献5))。ライブラリー構築法は被覆度の均等性に影響を及ぼしうる。例えばPCR増幅はライブラリー構築時のGC-エクストリーム(GC-extreme)領域のアンダーカバレッジの公知の原因である(Aird et al., Genome Biol., 12:R18(2011)(非特許文献6); Oyola et al., BMC Genomics, 13:1;22(2012)(非特許文献7); Benjamini et al., Nucleic Acids Res., 40:e72(2012)(非特許文献8))。同様のバイアスはクラスター増幅のためのブリッジPCR中にも導入されうる。また、一部のNGSプラットフォームでは、鎖特異的エラーが、アライナーのパフォーマンスを損なうことによって被覆度バイアスをもたらしうる(Nakamura et al., Nucleic Acids Res., 39:e90(2011)(非特許文献9))。ターミネーターフリー・ケミストリーを用いる他のプラットフォームでは、長いホモポリマーを正確にシーケンシングする能力に制約が生じる場合があり、また、ライブラリー構築時にエマルションPCRによって導入される被覆度バイアスの影響を受けやすい場合もある(Rothberg et al., Nature, 475:348-352(2011)(非特許文献10); Margulies et al., Nature 2005, 437:376-380(2005)(非特許文献11); Huse et al., Genome Biol., 8:R143(2007)(非特許文献12); Merriman et al., Electrophoresis, 33:3397-3417(2012)(非特許文献13))。
Schadt et al., Hum Mol Genet, 19(R2):R227-40,(2010) Koboldt DC et al., Brief Bioinform., 11:484-98(2010) Keohavong P et al., PNAS 86:9253-9257(1989) Cariello et al., Nucleic Acids Res., 19:4193-4198(1991) Cline et al., Nucleic Acids Res., 24:3546-3551(1996) Aird et al., Genome Biol., 12:R18(2011) Oyola et al., BMC Genomics, 13:1;22(2012) Benjamini et al., Nucleic Acids Res., 40:e72(2012) Nakamura et al., Nucleic Acids Res., 39:e90(2011) Rothberg et al., Nature, 475:348-352(2011) Margulies et al., Nature 2005, 437:376-380(2005) Huse et al., Genome Biol., 8:R143(2007) Merriman et al., Electrophoresis, 33:3397-3417(2012)
概要
一局面では、(a)標的特異的配列を含む第1のプライマーを使用して、試料から標的ポリヌクレオチドの第1の相補配列(CS)を作製する工程;(b)第1のプライマー結合配列(PBS)またはその一部分を含むアダプターを、第1のCSに付着させ、それにより、修飾相補配列(MCS)を形成する工程;(c)MCSにハイブリダイズした第2のプライマーを伸長させて、それにより第2のCSを形成する工程であって、第2のプライマーが、(i)標的特異的領域と、(ii)第2のPBSとを含む、工程;ならびに(d)第1のPBSおよび第2のPBSにそれぞれハイブリダイズする複数のプライマーを使用して、第2のCSを増幅する工程を含み、第1のプライマーまたは第2のプライマーがユニーク識別(UID)配列を含む、ポリヌクレオチドのライブラリーを作製する方法が提供される。
いくつかの態様において、第1のプライマーはUIDを含む。
いくつかの態様において、第2のプライマーはUIDを含む。
一局面では、(a)標的ポリヌクレオチドにハイブリダイズした、標的特異的な第1のプライマーを伸長させて、第1のCSを形成する工程;(b)第1のCSにアダプターを付着させて、MCSを形成する工程;(c)MCSにハイブリダイズした第2のプライマーを伸長させて、第2のCSを形成する工程;および(d)第2のCSを増幅する工程を含み、(a)または(c)が指数関数的増幅を含まず、かつ第1のプライマーまたは第2のプライマーがUIDを含む、ポリヌクレオチドのライブラリーを作製する方法が提供される。
いくつかの態様において、第1のプライマーはUIDを含む。
いくつかの態様において、第2のプライマーはUIDを含む。
一局面では、(a)標的ポリヌクレオチドから、第1のCSまたはその修飾型(MCS)を作製する工程;(b)第1のCSの配列を含むポリヌクレオチドから、第2のCSを作製する工程であって、第2のCSが非指数関数的増幅反応によって作製される、工程;および(c)第2のCSを増幅する工程を含み、第1のCSまたは第2のCSがUIDを含む、ポリヌクレオチドのライブラリーを作製する方法が提供される。
いくつかの態様において、第1のCSはUIDを含む。
いくつかの態様において、第2のCSはUIDを含む。
一局面では、(a)標的ポリヌクレオチドから作製された第1のCSまたはその修飾型(MCS)から、第2のCSを作製する工程であって、第1のCS、第2のCS、またはMCSがUIDを含み、かつ第1のCSおよび第2のCSがそれぞれ個別に、(i)プライマー伸長反応、または(ii)線形増幅反応によって作製される、工程;(b)第2のCSを増幅する工程;(c)増幅された第2のCSの少なくとも1つをシーケンシングする工程;(d)同じUIDを含有する、工程(c)からの少なくとも2つの配列をアラインメントする工程;ならびに(e)工程(d)に基づいて、標的ポリヌクレオチド配列に正確に相当するコンセンサス配列を決定する工程を含む、標的ポリヌクレオチドの配列を正確に決定する方法が提供される。
いくつかの態様において、第1のCSはUIDを含む。
いくつかの態様において、第2のCSはUIDを含む。
いくつかの態様において、工程(a)は、標的ポリヌクレオチドに第1のプライマーをハイブリダイズさせ、かつハイブリダイズした第1のプライマーを伸長させることによって、第1のCSを作製することを含む。
いくつかの態様において、工程(a)は、標的ポリヌクレオチドにハイブリダイズした第1のプライマーを伸長させることによって、第1のCSを作製することを含む。
いくつかの態様において、第1のプライマーは、標的特異的配列を介して標的ポリヌクレオチドにハイブリダイズする。
いくつかの態様において、工程(a)は、プライマー伸長反応または逆転写反応を行うことを含む。
いくつかの態様において、工程(a)はプライマー伸長反応を含む。
いくつかの態様において、標的ポリヌクレオチドはDNAである。
いくつかの態様において、工程(a)はDNAポリメラーゼを使用して行われる。
いくつかの態様において、工程(a)は逆転写反応を含む。
いくつかの態様において、標的ポリヌクレオチドはRNAである。
いくつかの態様において、工程(a)は逆転写酵素を使用して行われる。
いくつかの態様において、アダプターは第1のPBSを含む。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、第2のプライマーは標的特異的領域を含む。
いくつかの態様において、第2のプライマーは第2のPBSを含む。
いくつかの態様において、第1のCSは第1のPBSを含む。
いくつかの態様において、本方法はさらに、第1のCSにアダプターを付着させて、MCSを形成する工程を含む。
いくつかの態様において、アダプターは第1のPBSを含む。
いくつかの態様において、第1のCSの配列を含むポリヌクレオチドはMCSである。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、付着させることは、工程(a)の後に行われる。
いくつかの態様において、付着させることは、工程(b)の前に行われる。
いくつかの態様において、第2のCSを作製する工程は、第1のCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のCSを作製する工程は、MCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のプライマーは標的特異的領域を含む。
いくつかの態様において、第2のプライマーは第2のPBSを含む。
いくつかの態様において、第2のCSは第1のCSから作製される。
いくつかの態様において、第1のCSは第1のPBSを含む。
いくつかの態様において、第2のCSはMCSから作製される。
いくつかの態様において、MCSは、第1のCSにアダプターを付着させてMCSを形成することによって作製される。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、第2のCSを作製する工程は、第1のCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のCSを作製する工程は、MCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のプライマーは標的特異的領域を含む。
いくつかの態様において、第2のプライマーは第2のPBSを含む。
いくつかの態様において、第1のプライマーはユニバーサルライゲーション配列(ULS)を含む。
いくつかの態様において、アダプターはULSに相補的な配列を含む一本鎖領域を含む。
いくつかの態様において、ULSに相補的な配列は、アダプターの一本鎖領域の5'端にある。
いくつかの態様において、第1のプライマーはさらに、リン酸化された5'端を含む。
いくつかの態様において、本方法は、アダプターを付着させる前に、リン酸化された5'端を作製する工程を含む。
いくつかの態様において、第1のプライマーは、部分的なプライマー結合部位の第1の部分をさらに含み、完全なプライマー結合部位は2つの部分を含む。
いくつかの態様において、アダプターは部分的なプライマー結合部位の第2の部分を含む。
いくつかの態様において、完全なプライマー結合部位は、第1のCSにアダプターを付着させることによって形成される。
いくつかの態様において、第2のプライマーはさらに、ユニバーサルプライミング配列(UPS)を含む。
いくつかの態様において、アダプターはさらにUPSを含む。
いくつかの態様において、アダプターは一本鎖ポリヌクレオチドを含む。
いくつかの態様において、本方法はさらに、アダプターにハイブリダイズした第1のプライマーを伸長させる工程を含み、第1のプライマーの伸長部分はアダプターまたはその一部分に相補的な領域を含む。
いくつかの態様において、アダプターは二本鎖ポリヌクレオチドを含む。
いくつかの態様において、アダプターは、さらにオーバーハング領域を含む。
いくつかの態様において、オーバーハング領域は、第1のCSの一部分に相補的な配列を含む。
いくつかの態様において、アダプターのオーバーハング領域に相補的である、第1のCSの部分は、第1のCSの端部である。
いくつかの態様において、アダプターはさらに、第1のCSに相補的でない領域を含む。
いくつかの態様において、アダプターはさらに、試料バーコード(SBC)配列を含む。
いくつかの態様において、アダプターはさらに、SBC配列を含む。
いくつかの態様において、第1のCSに相補的でない領域はSBC配列を含む。
いくつかの態様において、アダプターはさらに、アフィニティ分子または捕捉配列を含む。
いくつかの態様において、アダプターは、ビオチンであるアフィニティ分子を含む。
いくつかの態様において、MCSはさらに、アフィニティ分子または捕捉配列を含む。
いくつかの態様において、MCSは、ビオチンであるアフィニティ分子を含む。
いくつかの態様において、本方法は、アフィニティ分子または捕捉配列を固体表面に結合する工程を含む。
いくつかの態様において、固体表面はビーズである。
いくつかの態様において、本方法は、結合しているMCSから標的ポリヌクレオチドまたは非標的ポリヌクレオチドを分離する工程を含む。
いくつかの態様において、第1のCSの一部分に相補的な配列は、SBCに対して5'側にある。
いくつかの態様において、第1のCSの一部分に相補的な配列は、UPSに対して3'側または5'側にある。
いくつかの態様において、MCSはアダプターを含む。
いくつかの態様において、MCSは二本鎖アダプターの一本の鎖を含む。
いくつかの態様において、MCSはUPSを含む。
いくつかの態様において、MCSの第1のPBSはUPSを含む。
いくつかの態様において、MCSの第1のPBSはUPSを含まない。
いくつかの態様において、第2のプライマーはUPSを含む。
いくつかの態様において、第2のプライマーの第2のPBSはUPSを含む。
いくつかの態様において、第2のプライマーの第2のPBSはUPSを含まない。
いくつかの態様において、MCSは第1のUPSを含み、第2のプライマーは第2のUPSを含む。
いくつかの態様において、MCSの第1のPBSは、第1のUPSを含む。
いくつかの態様において、第2のプライマーの第2のPBSは第2のUPSを含む。
いくつかの態様において、第2のCSは、第1のPBS、MCS、第2のPBS、標的配列、それらの相補鎖、またはそれらの任意の組合せを含む。
いくつかの態様において、第2のCSは、第1のPBSに相補的な配列を含む。
いくつかの態様において、第2のCSはMCSに相補的な配列を含む。
いくつかの態様において、第2のCSは第2のPBSを含む。
いくつかの態様において、第2のCSは標的配列を含む。
いくつかの態様において、第2のCSはUPSを含む。
いくつかの態様において、第2のCSは、第1のUPSに相補的な配列を含む。
いくつかの態様において、第2のCSは第2のUPSを含む。
いくつかの態様において、第2のCSは非指数関数的増幅反応から作製される。
いくつかの態様において、第2のCSは単一の第2のプライマーから作製される。
いくつかの態様において、第2のCSはプライマー伸長反応から作製される。
いくつかの態様において、第2のCSは線形増幅反応から作製される。
いくつかの態様において、増幅反応は単一ラウンドの増幅を含む。
いくつかの態様において、増幅反応は2ラウンドまたはそれ以上の増幅を含む。
いくつかの態様において、増幅反応は10ラウンドまたはそれ以上の増幅を含む。
いくつかの態様において、第2のCSは、指数関数的増幅反応が行われる前に作製される。
いくつかの態様において、標的ポリヌクレオチドは、複数の標的ポリヌクレオチドを含む。
いくつかの態様において、複数の標的ポリヌクレオチドのそれぞれは、異なる配列を含む。
いくつかの態様において、複数の標的ポリヌクレオチドのそれぞれは、同じ配列を含む。
いくつかの態様において、第1のプライマーは、それぞれが標的特異的領域を含む複数の第1のプライマーを含む。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は異なっている。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は同じである。
いくつかの態様において、第2のプライマーは、それぞれが標的特異的領域に相補的な配列を含む複数の第2のプライマーを含む。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は異なっている。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は同じである。
いくつかの態様において、第1のプライマーは、標的ポリヌクレオチドの3'端、5'端、または内部領域にハイブリダイズする。
いくつかの態様において、第2のプライマーは、第1のCSまたはMCSの3'端、5'端、または内部領域にハイブリダイズする。
いくつかの態様において、第1のCSは複数の第1のCSを含む。
いくつかの態様において、複数の第1のCSのそれぞれは異なる配列を含む。
いくつかの態様において、複数の第1のCSのそれぞれは同じ配列を含む。
いくつかの態様において、アダプターは複数のアダプターを含む。
いくつかの態様において、複数のアダプターのそれぞれは異なる配列を含む。
いくつかの態様において、複数のアダプターのそれぞれは同じ配列を含む。
いくつかの態様において、MCSは複数のMCSを含む。
いくつかの態様において、複数のMCSのそれぞれは異なる配列を含む。
いくつかの態様において、複数のMCSのそれぞれは同じ配列を含む。
いくつかの態様において、第2のCSは複数の第2のCSを含む。
いくつかの態様において、複数の第2のCSのそれぞれは異なる配列を含む。
いくつかの態様において、複数の第2のCSのそれぞれは同じ配列を含む。
いくつかの態様において、UIDは各第1のプライマーに関してユニークである。
いくつかの態様において、UIDは各第1のプライマーに関してユニークでない。
いくつかの態様において、各第1のプライマーは、同じUPS、同じ第1のPBS、またはその両方を含む。
いくつかの態様において、各第1のCSは、同じUPS、同じ第1のPBS、またはその両方を含む。
いくつかの態様において、各アダプターは、同じUPS、同じ第1のPBS、同じSBC、またはそれらの組合せを含む。
いくつかの態様において、各MCSは、同じUPS、同じ第1のPBS、同じSBC、またはそれらの組合せを含む。
いくつかの態様において、各第2のプライマーは、同じUPS、同じ第2のPBS、またはその両方を含む。
いくつかの態様において、各第2のCSは、同じUPS、同じ第1のUPS、同じ第2のUPS、同じSBC、同じ第1のPBS、同じ第2のPBS、またはそれらの組合せを含む。
いくつかの態様において、各アダプターは、異なるUPS、異なる第1のPBS、異なるSBC、またはそれらの組合せを含む。
いくつかの態様において、各MCSは、異なるUPS、異なる第1のPBS、異なるSBC、またはそれらの組合せを含む。
いくつかの態様では、第1の複数の第1のプライマーの各第1のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、標的ポリヌクレオチドに同時にハイブリダイズさせるか、または同じ反応チャンバ中で標的ポリヌクレオチドにハイブリダイズさせる。
いくつかの態様では、第1の複数の第1のCSまたはMCSの各第の1CSまたはMCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様では、第1の複数の第2のプライマーの各第2のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、第1のCSまたはMCSに同時にハイブリダイズさせるか、または同じ反応チャンバ中で第1のCSまたはMCSにハイブリダイズさせる。
いくつかの態様では、第1の複数の第2のCSの各第2のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様において、試料は生物学的試料である。
いくつかの態様において、試料は対象由来の生物学的試料である。
いくつかの態様において、対象は、ある疾患またはある状態を持つ対象である。
いくつかの態様において、対象は、ある疾患またはある状態を持たない対象である。
いくつかの態様において、対象は動物である。
いくつかの態様において、動物はヒトである。
いくつかの態様において、試料は血液試料である。
いくつかの態様において、標的ポリヌクレオチドは試料から単離される。
いくつかの態様において、標的ポリヌクレオチドは試料から直接増幅される。
いくつかの態様において、試料は、第1の試料と第2の試料とを含む複数の試料である。
いくつかの態様において、複数の試料は、少なくとも3、4、5、10、20、30、40、50、60、70、80、90、もしくは100個またはそれ以上の試料を含む。
いくつかの態様において、複数の試料は、少なくとも約100、200、300、400、500、600、700、800、900、もしくは1000個またはそれ以上の試料を含む。
いくつかの態様において、複数の試料は、少なくとも約1000、2000、3000、4000、5000、6000、7000、もしくは8000個の試料、9000もしくは10,000個の試料、もしくは100,000個の試料、もしくは1,000,000個またはそれ以上の試料を含む。
いくつかの態様において、複数の試料は少なくとも約10,000個の試料を含む。
いくつかの態様において、第1の試料は第1の対象に由来し、第2の試料は第2の対象に由来する。
いくつかの態様において、第1の対象は、ある疾患またはある状態を持つ対象である。
いくつかの態様において、第2の対象は、ある疾患またはある状態を持たない対象である。
いくつかの態様では、第1の複数の第1のプライマーの各第1のプライマーを第1の試料と接触させ、第2の複数の第1のプライマーの各第1のプライマーを第2の試料と接触させる。
いくつかの態様では、第2の複数の第1のプライマーの各第1のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、標的ポリヌクレオチドに同時にハイブリダイズさせるか、または同じ反応チャンバ中で標的ポリヌクレオチドにハイブリダイズさせる。
いくつかの態様では、第1の複数の第1のプライマーおよび第2の複数の第1のプライマーを、同時に伸長させるか、または標的ポリヌクレオチドに同時にハイブリダイズさせる。
いくつかの態様では、第1の複数の第2のプライマーの各第2のプライマーを第1の試料と接触させ、第2の複数の第2のプライマーの各第2のプライマーを第2の試料と接触させる。
いくつかの態様では、第2の複数の第2のプライマーの各第2のプライマーを同時に伸長させるか、同じ反応チャンバ中で伸長させるか、標的ポリヌクレオチドに同時にハイブリダイズさせるか、または同じ反応チャンバ中で標的ポリヌクレオチドにハイブリダイズさせる。
いくつかの態様では、第1の複数の第2のプライマーおよび第2の複数の第2のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、第1のCSまたはMCSに同時にハイブリダイズさせるか、または同じ反応チャンバ中で第1のCSまたはMCSにハイブリダイズさせる。
いくつかの態様において、第1の複数の第1のCSまたはMCSの各第の1CSまたはMCSは第1の試料中の標的ポリヌクレオチドから作製され、第2の複数の第1のCSまたはMCSの各第1のCSまたはMCSは第2の試料中の標的ポリヌクレオチドから作製される。
いくつかの態様では、第2の複数の第1のCSまたは第2のMCSの各第1のCSまたはMCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様では、第1の複数の第1のCSおよび第2の複数の第1のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様において、第1の複数の第2のCSの各第2のCSは第1の試料中の標的ポリヌクレオチドから作製され、第2の複数の第2のCSの各第2のCSは第2の試料中の標的ポリヌクレオチドから作製される。
いくつかの態様では、第2の複数の第2のCSの各第2のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様では、第1の複数の第2のCSおよび第2の複数の第2のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様において、本方法はさらに、第1の試料と第2の試料とを混和する工程を含む。
いくつかの態様において、混和は、第1の複数の第1のCSまたはMCSを作製した後に行われる。
いくつかの態様において、標的ポリヌクレオチドの1つもしくは複数または複数の標的ポリヌクレオチドは、バリアント配列を含む。
いくつかの態様において、バリアント配列は、変異、多型、欠失、または挿入を含む。
いくつかの態様において、多型は一塩基多型である。
いくつかの態様において、標的ポリヌクレオチドの1つまたは複数は病原体に由来する。
いくつかの態様において、病原体はウイルス、細菌、または真菌である。
いくつかの態様において、UIDは少なくとも2つのヌクレオチドを含む。
いくつかの態様において、UIDは少なくとも10個のヌクレオチドを含む。
いくつかの態様において、UIDは少なくとも15個のヌクレオチドを含む。
いくつかの態様において、UIDは最大で50個のヌクレオチドを含む。
いくつかの態様において、UIDは10〜30個のヌクレオチドを含む。
いくつかの態様において、UIDは縮重配列を含む。
いくつかの態様において、UIDは完全または部分的縮重配列を含む。
いくつかの態様において、UIDは配列
Figure 0006494045
を含み、Nは任意の核酸である。
いくつかの態様において、UIDは配列
Figure 0006494045
を含み、Nは任意の核酸でありかつWはアデニンまたはチミンである。
いくつかの態様において、付着させることは、ライゲーションを含む。
いくつかの態様において、付着させることは増幅を含む。
いくつかの態様において、第2のCSは指数関数的増幅反応によって増幅される。
いくつかの態様において、第2のCSはPCRによって増幅される。
いくつかの態様において、第2のCSは、第1のPBSに対するプライマーと第2のPBSに対するプライマーとを含むプライマーセットを使用して増幅される。
いくつかの態様において、第2のCSはUPSを使用して増幅される。
いくつかの態様において、第2のCSは、第1のUPSに対するプライマーと第2のUPSに対するプライマーとを含むプライマーセットを使用して増幅される。
いくつかの態様において、本方法はさらに、1つもしくは複数の第2のCSまたは1つもしくは複数の複数の第2のCS由来の増幅産物をシーケンシングする工程を含む。
いくつかの態様において、シーケンシングは同時に行われる。
いくつかの態様において、シーケンシングはハイスループットシーケンシングである。
いくつかの態様において、本方法はさらに、決定された配列を解析する工程を含む。
いくつかの態様において、解析はコンピュータを使用して行われる。
いくつかの態様において、本方法はさらに、増幅エラー率を決定する工程を含む。
いくつかの態様において、本方法はさらに、シーケンシングエラー率を決定する工程を含む。
いくつかの態様において、本方法はさらに、1つまたは複数の標的ポリヌクレオチドの頻度を決定する工程を含む。
いくつかの態様において、本方法はさらに、1つまたは複数の標的ポリヌクレオチドにおけるバリアントの有無を決定する工程を含む。
いくつかの態様において、本方法はさらに、対象が、あるアレルに関してホモ接合であるかヘテロ接合であるかを決定する工程を含む。
いくつかの態様において、本方法はさらに、ある疾患またはある状態を持つ対象を診断し、予後判定し、または処置する工程を含む。
いくつかの態様において、本方法はさらに、増幅エラーを修正する工程を含む。
いくつかの態様において、本方法はさらに、シーケンシングエラーを修正する工程を含む。
いくつかの態様において、本方法はさらに、同じUIDを含む配列をビン化またはグループ分けする工程を含む。
いくつかの態様において、本方法はさらに、同じUIDを含む配列をコンピュータまたはアルゴリズムを使用してビン化またはグループ分けする工程を含む。
いくつかの態様において、本方法はさらに、同じUIDを含む配列をコンピュータまたはアルゴリズムを使用してビン化またはグループ分けする工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列をクラスター化する工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列をアラインメントする工程を含む。
いくつかの態様において、クラスター化またはアラインメントはコンピュータまたはアルゴリズムを用いて行われる。
いくつかの態様において、本方法はさらに、同じUIDを含有する配列リードの数を決定する工程を含む。
いくつかの態様において、本方法はさらに、同じUIDと、少なくとも約90%、95%、または99%の配列相同性を持つ標的配列との両方を含有する配列リードの数を決定する工程を含む。
いくつかの態様において、本方法はさらに、試料の1つまたは複数中の1つまたは複数の標的ポリヌクレオチドの量を決定する工程を含む。
いくつかの態様において、本方法はさらに、2つまたはそれ以上の配列、配列リード、アンプリコン配列、ビン化された配列、アラインメントされた配列、クラスター化された配列、または同じUIDを含むアンプリコンセット配列から、コンセンサス配列を形成する工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、99.99%、または100%の精度または信頼度で標的ポリヌクレオチド配列を決定する工程を含む。
いくつかの態様において、シーケンシングエラーおよびPCRエラーは、最小限に抑えられるか、排除されるか、または0.01%、0.001%、0.0001%、0.00001%、0.000001%、もしくは0.0000001%未満である。
いくつかの態様では、第1のCSまたはMCSを増幅する工程が増幅バイアスを制限する。
いくつかの態様において、シーケンシングのエラー率は、0.00001%、0.0001%、0.001%、0.01%未満、もしくは0.00001%、0.0001%、0.001%、0.01%、または0%である。
いくつかの態様において、シーケンシングのエラー率は0ではない。
いくつかの態様では、少なくとも1,000、5,000、10,000、20,000、30,000、40,000、50,000、1000,000、もしくは500,000個、または7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、もしくは9×1012個のポリヌクレオチドがシーケンシングされる。
いくつかの態様において、本方法は、4週間、3週間、2週間、1週間、6日間、5日間、5日間、4日間、3日間、2日間、1日間、18時間、12時間、9時間、6時間、もしくは3時間未満、または4週間、3週間、2週間、1週間、6日間、5日間、5日間、4日間、3日間、2日間、1日間、18時間、12時間、9時間、6時間、もしくは3時間の正の期間内に行われる。
いくつかの態様において、特定の信頼度または塩基コール精度を達成するために使用されるリードの数は、UIDを使用しない同様の方法を使用して同じ、または同様の、またはより高い信頼度または塩基コール精度を達成するために使用されるリードの数の、多くとも約1.1、1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000分の1である。
いくつかの態様において、特定の信頼度または塩基コール精度を達成するために使用されるリードの数は、UIDを使用しない同様の方法を使用して同じ、または同様の、またはより高い信頼度または塩基コール精度を達成するために使用されるリードの数より、少なくとも約1、2、3、4、5、5.5、6、6.5、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、または9×1012リードは少ない。
一局面では、本明細書に記載する方法のいずれかの1つまたは複数のプライマー、試薬、酵素、または基質を含むキットが提供される。
一局面では、パネル中の第1のプライマーのそれぞれが、標的特異的配列およびUIDを含む、第1のプライマーのパネルが提供される。
いくつかの態様において、パネルは、異なる標的特異的配列を含む第1のプライマーを、少なくとも約2、3、4、5、10、50、100、500、1000、5000、10,000、100,000、2500,000個、またはそれ以上を含む。
一局面では、複数のポリヌクレオチド中の各ポリヌクレオチドがUIDを含み、複数のポリヌクレオチド中の各ポリヌクレオチドが非指数関数的に増幅された異なるテンプレートポリヌクレオチド由来の産物である、複数のポリヌクレオチドを含むポリヌクレオチドのライブラリーが提供される。
一局面では、複数のポリヌクレオチド中の各ポリヌクレオチドが、本明細書に記載するいずれかのライブラリーの1つまたは複数のポリヌクレオチド由来のPCR産物を含む、複数のポリヌクレオチドを含むポリヌクレオチドのライブラリーが提供される。
一局面では、(a)標的特異的配列を含む第1のプライマーを使用して、試料から標的ポリヌクレオチドの第1の相補配列(CS)を作製する工程;(b)第1のプライマー結合配列(PBS)またはその一部分を含むアダプターを第1のCSに付着させ、それにより修飾相補配列(MCS)を形成する工程;(c)MCSにハイブリダイズした第2のプライマーを伸長させ、それにより第2のCSを形成する工程であって、第2のプライマーが、(i)標的特異的領域と、(ii)第2のPBSとを含む、工程;ならびに(d)第1のPBSおよび第2のPBSにそれぞれハイブリダイズする複数のプライマーを使用して、第2のCSを増幅する工程を含む、ポリヌクレオチドのライブラリーを作製する方法が提供される。
一局面では、(a)標的ポリヌクレオチドにハイブリダイズした、標的特異的な第1のプライマーを伸長させて、第1のCSを形成する工程;(b)第1のCSにアダプターを付着させて、MCSを形成する工程;(c)MCSにハイブリダイズした第2のプライマーを伸長させて、第2のCSを形成する工程;および(d)第2のCSを増幅する工程を含み、工程(a)または(c)が指数関数的増幅を含まない、ポリヌクレオチドのライブラリーを作製する方法が提供される。
一局面では、(a)標的ポリヌクレオチドから、第1のCSまたはその修飾型(MCS)を作製する工程;(b)第1のCSの配列を含むポリヌクレオチドから、第2のCSを作製する工程であって、第2のCSが非指数関数的増幅反応によって作製される、工程;および(c)第2のCSを増幅する工程を含む、ポリヌクレオチドのライブラリーを作製する方法が提供される。
一局面では、(a)標的ポリヌクレオチドから作製された第1のCSまたはその修飾型(MCS)から、第2のCSを作製する工程であって、第1のCSおよび第2のCSがそれぞれ個別に、(i)プライマー伸長反応、または(ii)線形増幅反応によって作製される、工程;(b)第2のCSを増幅する工程;(c)増幅された第2のCSの少なくとも1つをシーケンシングする工程;(d)少なくとも10%の配列同一性を含む、工程(c)からの少なくとも2つの配列を、アラインメントする工程;ならびに(e)工程(d)に基づいて、標的ポリヌクレオチド配列に正確に相当するコンセンサス配列を決定する工程を含む、標的ポリヌクレオチドの配列を正確に決定する方法が提供される。
いくつかの態様において、工程(a)は、標的ポリヌクレオチドに第1のプライマーをハイブリダイズさせ、かつハイブリダイズした第1のプライマーを伸長させることによって、第1のCSを作製することを含む。
いくつかの態様において、工程(a)は、標的ポリヌクレオチドにハイブリダイズした第1のプライマーを伸長させることによって、第1のCSを作製することを含む。
いくつかの態様において、第1のプライマーは標的特異的配列を介して標的ポリヌクレオチドにハイブリダイズする。
いくつかの態様において、工程(a)はプライマー伸長反応または逆転写反応を行うことを含む。
いくつかの態様において、工程(a)はプライマー伸長反応を含む。
いくつかの態様において、標的ポリヌクレオチドはDNAである。
いくつかの態様において、工程(a)はDNAポリメラーゼを使用して行われる。
いくつかの態様において、工程(a)は逆転写反応を含む。
いくつかの態様において、標的ポリヌクレオチドはRNAである。
いくつかの態様において、工程(a)は逆転写酵素を使用して行われる。
いくつかの態様において、アダプターは第1のPBSを含む。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、第2のプライマーは標的特異的領域を含む。
いくつかの態様において、第2のプライマーは第2のPBSを含む。
いくつかの態様において、第1のCSは第1のPBSを含む。
いくつかの態様において、本方法はさらに、第1のCSにアダプターを付着させて、MCSを形成する工程を含む。
いくつかの態様において、アダプターは第1のPBSを含む。
いくつかの態様において、第1のCSの配列を含むポリヌクレオチドはMCSである。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、付着させることは、工程(a)の後に行われる。
いくつかの態様において、付着させることは、工程(b)の前に行われる。
いくつかの態様において、第2のCSを作製する工程は、第1のCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のCSを作製する工程は、MCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のプライマーは標的特異的領域を含む。
いくつかの態様において、第2のプライマーは第2のPBSを含む。
いくつかの態様において、第2のCSは第1のCSから作製される。
いくつかの態様において、第1のCSは第1のPBSを含む。
いくつかの態様において、第2のCSはMCSから作製される。
いくつかの態様において、MCSは、第1のCSにアダプターを付着させてMCSを形成することによって作製される。
いくつかの態様において、MCSは第1のPBSを含む。
いくつかの態様において、第2のCSを作製する工程は、第1のCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のCSを作製する工程は、MCSにハイブリダイズした第2のプライマーを伸長させることを含む。
いくつかの態様において、第2のプライマーは標的特異的領域を含む。
いくつかの態様において、第2のプライマーは第2のPBSを含む。
いくつかの態様において、第1のプライマーはユニバーサルライゲーション配列(ULS)を含む。
いくつかの態様において、アダプターは、ULSに相補的な配列を含む一本鎖領域を含む。
いくつかの態様において、ULSに相補的な配列はアダプターの一本鎖領域の5'端にある。
いくつかの態様において、第1のプライマーはさらに、リン酸化された5'端を含む。
いくつかの態様において、本方法はさらに、アダプターを付着させる前に、リン酸化された5'端を作製する工程を含む。
いくつかの態様において、第1のプライマーはさらに、部分的なプライマー結合部位の第1の部分を含み、完全なプライマー結合部位は2つの部分を含む。
いくつかの態様において、アダプターは部分的なプライマー結合部位の第2の部分を含む。
いくつかの態様において、完全なプライマー結合部位は、第1のCSにアダプターを付着させることによって形成される。
いくつかの態様において、第2のプライマーはさらにユニバーサルプライミング配列(UPS)を含む。
いくつかの態様において、アダプターはさらにUPSを含む。
いくつかの態様において、アダプターは一本鎖ポリヌクレオチドを含む。
いくつかの態様において、本方法はさらに、アダプターにハイブリダイズした第1のプライマーを伸長させる工程を含み、第1のプライマーの伸長部分は、アダプターまたはその一部分に相補的な領域を含む。
いくつかの態様において、アダプターは二本鎖ポリヌクレオチドを含む。
いくつかの態様において、アダプターはさらにオーバーハング領域を含む。
いくつかの態様において、オーバーハング領域は、第1のCSの一部分に相補的な配列を含む。
いくつかの態様において、アダプターのオーバーハング領域に相補的である、第1のCSの部分は、第1のCSの端部である。
いくつかの態様において、アダプターはさらに、第1のCSに相補的でない領域を含む。
いくつかの態様において、アダプターはさらに、試料バーコード(SBC)配列を含む。
いくつかの態様において、アダプターはさらに、SBC配列を含む。
いくつかの態様において、第1のCSに相補的でない領域はSBC配列を含む。
いくつかの態様において、アダプターはさらにアフィニティ分子または捕捉配列を含む。
いくつかの態様において、アダプターは、ビオチンであるアフィニティ分子を含む。
いくつかの態様において、MCSはさらにアフィニティ分子または捕捉配列を含む。
いくつかの態様において、MCSは、ビオチンであるアフィニティ分子を含む。
いくつかの態様において、本方法はさらに、アフィニティ分子または捕捉配列を、固体表面に結合する工程を含む。
いくつかの態様において、固体表面はビーズである。
いくつかの態様において、本方法はさらに、結合しているMCSから標的ポリヌクレオチドまたは非標的ポリヌクレオチドを分離する工程を含む。
いくつかの態様において、第1のCSの一部分に相補的な配列はSBCに対して5'側にある。
いくつかの態様において、第1のCSの一部分に相補的な配列はUPSに対して3'側または5'側にある。
いくつかの態様において、MCSはアダプターを含む。
いくつかの態様において、MCSは二本鎖アダプターの一本の鎖を含む。
いくつかの態様において、MCSはUPSを含む。
いくつかの態様において、MCSの第1のPBSはUPSを含む。
いくつかの態様において、MCSの第1のPBSはUPSを含まない。
いくつかの態様において、第2のプライマーはUPSを含む。
いくつかの態様において、第2のプライマーの第2のPBSはUPSを含む。
いくつかの態様において、第2のプライマーの第2のPBSはUPSを含まない。
いくつかの態様において、MCSは第1のUPSを含み、かつ第2のプライマーは第2のUPSを含む。
いくつかの態様において、MCSの第1のPBSは第1のUPSを含む。
いくつかの態様において、第2のプライマーの第2のPBSは第2のUPSを含む。
いくつかの態様において、第2のCSは、第1のPBS、MCS、第2のPBS、標的配列、それらの相補鎖、またはそれらの任意の組合せを含む。
いくつかの態様において、第2のCSは、第1のPBSに相補的な配列を含む。
いくつかの態様において、第2のCSは、MCSに相補的な配列を含む。
いくつかの態様において、第2のCSは第2のPBSを含む。
いくつかの態様において、第2のCSは標的配列を含む。
いくつかの態様において、第2のCSはUPSを含む。
いくつかの態様において、第2のCSは、第1のUPSに相補的な配列を含む。
いくつかの態様において、第2のCSは第2のUPSを含む。
いくつかの態様において、第2のCSは非指数関数的増幅反応から作製される。
いくつかの態様において、第2のCSは単一の第2のプライマーから作製される。
いくつかの態様において、第2のCSはプライマー伸長反応から作製される。
いくつかの態様において、第2のCSは線形増幅反応から作製される。
いくつかの態様において、増幅反応は単一ラウンドの増幅を含む。
いくつかの態様において、増幅反応は2ラウンドまたはそれ以上の増幅を含む。
いくつかの態様において、増幅反応は10ラウンドまたはそれ以上の増幅を含む。
いくつかの態様において、第2のCSは、指数関数的増幅反応が行われる前に作製される。
いくつかの態様において、標的ポリヌクレオチドは複数の標的ポリヌクレオチドを含む。
いくつかの態様において、複数の標的ポリヌクレオチドのそれぞれは、異なる配列を含む。
いくつかの態様において、複数の標的ポリヌクレオチドのそれぞれは、同じ配列を含む。
いくつかの態様において、第1のプライマーは、それぞれが標的特異的領域を含む複数の第1のプライマーを含む。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は異なっている。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は同じである。
いくつかの態様において、第2のプライマーは、それぞれが標的特異的領域に相補的な配列を含む複数の第2のプライマーを含む。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は異なっている。
いくつかの態様において、複数の第1のプライマーのそれぞれの標的特異的領域は同じである。
いくつかの態様において、第1のプライマーは、標的ポリヌクレオチドの3'端、5'端、または内部領域にハイブリダイズする。
いくつかの態様において、第2のプライマーは、第1のCSまたはMCSの3'端、5'端、または内部領域にハイブリダイズする。
いくつかの態様において、第1のCSは複数の第1のCSを含む。
いくつかの態様において、複数の第1のCSのそれぞれは異なる配列を含む。
いくつかの態様において、複数の第1のCSのそれぞれは同じ配列を含む。
いくつかの態様において、アダプターは複数のアダプターを含む。
いくつかの態様において、複数のアダプターのそれぞれは異なる配列を含む。
いくつかの態様において、複数のアダプターのそれぞれは同じ配列を含む。
いくつかの態様において、MCSは複数のMCSを含む。
いくつかの態様において、複数のMCSのそれぞれは異なる配列を含む。
いくつかの態様において、複数のMCSのそれぞれは同じ配列を含む。
いくつかの態様において、第2のCSは複数の第2のCSを含む。
いくつかの態様において、複数の第2のCSのそれぞれは異なる配列を含む。
いくつかの態様において、複数の第2のCSのそれぞれは同じ配列を含む。
いくつかの態様において、各第1のプライマーは、同じUPS、同じ第1のPBS、またはその両方を含む。
いくつかの態様において、各第1のCSは、同じUPS、同じ第1のPBS、またはその両方を含む。
いくつかの態様において、各アダプターは、同じUPS、同じ第1のPBS、同じSBC、またはそれらの組合せを含む。
いくつかの態様において、各MCSは、同じUPS、同じ第1のPBS、同じSBC、またはそれらの組合せを含む。
いくつかの態様において、各第2のプライマーは、同じUPS、同じ第2のPBS、またはその両方を含む。
いくつかの態様において、各第2のCSは、同じUPS、同じ第1のUPS、同じ第2のUPS、同じSBC、同じ第1のPBS、同じ第2のPBS、またはそれらの組合せを含む。
いくつかの態様において、各アダプターは、異なるUPS、異なる第1のPBS、異なるSBC、またはそれらの組合せを含む。
いくつかの態様において、各MCSは、異なるUPS、異なる第1のPBS、異なるSBC、またはそれらの組合せを含む。
いくつかの態様では、第1の複数の第1のプライマーの各第1のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、標的ポリヌクレオチドに同時にハイブリダイズさせるか、または同じ反応チャンバ中で標的ポリヌクレオチドにハイブリダイズさせる。
いくつかの態様では、第1の複数の第1のCSまたはMCSの各第1のCSまたはMCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様では、第1の複数の第2のプライマーの各第2のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、第1のCSまたはMCSに同時にハイブリダイズさせるか、または同じ反応チャンバ中で第1のCSまたはMCSにハイブリダイズさせる。
いくつかの態様では、第1の複数の第2のCSの各第2のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様において、試料は生物学的試料である。
いくつかの態様において、試料は対象由来の生物学的試料である。
いくつかの態様において、対象は、ある疾患またはある状態を持つ対象である。
いくつかの態様において、対象は、ある疾患またはある状態を持たない対象である。
いくつかの態様において、対象は動物である。
いくつかの態様において、動物はヒトである。
いくつかの態様において、試料は血液試料である。
いくつかの態様において、標的ポリヌクレオチドは試料から単離される。
いくつかの態様において、標的ポリヌクレオチドは試料から直接増幅される。
いくつかの態様において、試料は、第1の試料と第2の試料とを含む複数の試料である。
いくつかの態様において、複数の試料は、少なくとも3、4、5、10、20、30、40、50、60、70、80、90、もしくは100個またはそれ以上の試料を含む。
いくつかの態様において、複数の試料は、少なくとも約100、200、300、400、500、600、700、800、900、もしくは1000個またはそれ以上の試料を含む。
いくつかの態様において、複数の試料は、少なくとも約1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、100,000、もしくは1,000,000個またはそれ以上の試料を含む。
いくつかの態様において、複数の試料は少なくとも約10,000個の試料を含む。
いくつかの態様において、第1の試料は第1の対象に由来し、第2の試料は第2の対象に由来する。
いくつかの態様において、第1の対象は、ある疾患またはある状態を持つ対象である。
いくつかの態様において、第2の対象は、ある疾患またはある状態を持たない対象である。
いくつかの態様では、第1の複数の第1のプライマーの各第1のプライマーを第1の試料と接触させ、第2の複数の第1のプライマーの各第1のプライマーを第2の試料と接触させる。
いくつかの態様では、第2の複数の第1のプライマーの第1のプライマーを同時に伸長させるか、同じ反応チャンバ中で伸長させるか、標的ポリヌクレオチドに同時にハイブリダイズさせるか、または同じ反応チャンバ中で標的ポリヌクレオチドにハイブリダイズさせる。
いくつかの態様では、第1の複数の第1のプライマーおよび第2の複数の第1のプライマーを、同時に伸長させるか、または標的ポリヌクレオチドに同時にハイブリダイズさせる。
いくつかの態様では、第1の複数の第2のプライマーの各第2のプライマーを、第1の試料と接触させ、第2の複数の第2のプライマーの各第2のプライマーを第2の試料と接触させる。
いくつかの態様では、第2の複数の第2のプライマーの各第2のプライマーを同時に伸長させるか、同じ反応チャンバ中で伸長させるか、標的ポリヌクレオチドに同時にハイブリダイズさせるか、または同じ反応チャンバ中で標的ポリヌクレオチドにハイブリダイズさせる。
いくつかの態様では、第1の複数の第2のプライマーおよび第2の複数の第2のプライマーを、同時に伸長させるか、同じ反応チャンバ中で伸長させるか、第1のCSまたはMCSに同時にハイブリダイズさせるか、または同じ反応チャンバ中で第1のCSまたはMCSにハイブリダイズさせる。
いくつかの態様において、第1の複数の第1のCSまたはMCSの各第1のCSまたはMCSは第1の試料中の標的ポリヌクレオチドから作製され、第2の複数の第1のCSまたはMCSの各第1のCSまたはMCSは第2の試料中の標的ポリヌクレオチドから作製される。
いくつかの態様では、第2の複数の第1のCSまたは第2のMCSの各第1のCSまたはMCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様では、第1の複数の第1のCSおよび第2の複数の第1のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様において、第1の複数の第2のCSの各第2のCSは第1の試料中の標的ポリヌクレオチドから作製され、第2の複数の第2のCSの各第2のCSは第2の試料中の標的ポリヌクレオチドから作製される。
いくつかの態様では、第2の複数の第2のCSの各第2のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様では、第1の複数の第2のCSおよび第2の複数の第2のCSを、同時に作製するか、同じ反応チャンバ中で作製するか、同時に増幅するか、または同じ反応チャンバ中で増幅する。
いくつかの態様において、本方法はさらに、第1の試料と第2の試料とを混和する工程を含む。
いくつかの態様において、混和は第1の複数の第1のCSまたはMCSを作製した後に行われる。
いくつかの態様において、標的ポリヌクレオチドの1つもしくは複数、または複数の標的ポリヌクレオチドは、バリアント配列を含む。
いくつかの態様において、バリアント配列は、変異、多型、欠失、または挿入を含む。
いくつかの態様において、多型は一塩基多型である。
いくつかの態様において、標的ポリヌクレオチドの1つまたは複数は病原体に由来する。
いくつかの態様において、病原体はウイルス、細菌、または真菌である。
いくつかの態様において、付着させることは、ライゲーションを含む。
いくつかの態様において、付着させることは増幅を含む。
いくつかの態様において、第2のCSは指数関数的増幅反応によって増幅される。
いくつかの態様において、第2のCSはPCRによって増幅される。
いくつかの態様において、第2のCSは、第1のPBSに対するプライマーと第2のPBSに対するプライマーとを含むプライマーセットを使用して増幅される。
いくつかの態様において、第2のCSはUPSを使用して増幅される。
いくつかの態様において、第2のCSは、第1のUPSに対するプライマーと第2のUPSに対するプライマーとを含むプライマーセットを使用して増幅される。
いくつかの態様において、本方法はさらに、1つもしくは複数の第2のCSまたは1つもしくは複数の複数の第2のCS由来の増幅産物をシーケンシングする工程を含む。
いくつかの態様において、シーケンシングは同時に行われる。
いくつかの態様において、シーケンシングはハイスループットシーケンシングである。
いくつかの態様において、本方法はさらに、決定された配列を解析する工程を含む。
いくつかの態様において、解析はコンピュータを使用して行われる。
いくつかの態様において、本方法はさらに、増幅エラー率を決定する工程を含む。
いくつかの態様において、本方法はさらに、シーケンシングエラー率を決定する工程を含む。
いくつかの態様において、本方法はさらに、1つまたは複数の標的ポリヌクレオチドの頻度を決定する工程を含む。
いくつかの態様において、本方法はさらに、1つまたは複数の標的ポリヌクレオチドにおけるバリアントの有無を決定する工程を含む。
いくつかの態様において、本方法はさらに、対象が、あるアレルに関してホモ接合であるかヘテロ接合であるかを決定する工程を含む。
いくつかの態様において、本方法はさらに、ある疾患またはある状態を持つ対象を診断し、予後判定し、または処置する工程を含む。
いくつかの態様において、本方法はさらに、増幅エラーを修正する工程を含む。
いくつかの態様において、本方法はさらに、シーケンシングエラーを修正する工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列をビン化する工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列をグループ分けする工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列をクラスター化する工程を含む。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列をアラインメントする工程を含む。
いくつかの態様において、クラスター化またはアラインメントはコンピュータまたはアルゴリズムを用いて行われる。
いくつかの態様において、本方法はさらに、少なくとも約90%、95%、または99%の配列相同性を持つ配列リードの数を決定する工程を含む。
いくつかの態様において、本方法はさらに、試料の1つまたは複数中の1つまたは複数の標的ポリヌクレオチドの量を決定する工程を含む。
いくつかの態様において、本方法はさらに、2つまたはそれ以上の配列、配列リード、アンプリコン配列、ビン化された配列、アラインメントされた配列、またはクラスター化された配列からコンセンサス配列を形成する工程を含む。
いくつかの態様において、本方法はさらに、標的ポリヌクレオチド配列を少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%、99.99%、または100%の精度または信頼度で決定する工程を含む。
いくつかの態様において、シーケンシングエラーおよびPCRエラーは、最小限に抑えられるか、排除されるか、または0.01%、0.001%、0.0001%、0.00001%、0.000001%、もしくは0.0000001%未満である。
いくつかの態様では、第1のCSまたはMCSを増幅する工程が増幅バイアスを制限する。
いくつかの態様において、シーケンシングのエラー率は、0.00001%、0.0001%、0.001%、0.01%未満、もしくは0.00001%、0.0001%、0.001%、0.01%、または0%である。
いくつかの態様において、シーケンシングのエラー率は0ではない。
いくつかの態様では、少なくとも1,000、5,000、10,000、20,000、30,000、40,000、50,000、1000,000、もしくは500,000個、または1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、もしくは9×1012個のポリヌクレオチドがシーケンシングされる。
いくつかの態様において、本方法は、4週間、3週間、2週間、1週間、6日間、5日間、5日間、4日間、3日間、2日間、1日間、18時間、12時間、9時間、6時間、もしくは3時間未満、または4週間、3週間、2週間、1週間、6日間、5日間、5日間、4日間、3日間、2日間、1日間、18時間、12時間、9時間、6時間、もしくは3時間の正の期間内に行われる。
いくつかの態様において、試料は全血試料である。
いくつかの態様において、試料はFFPE試料である。
いくつかの態様において、10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージは、精製ポリヌクレオチド試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージに等しい。
いくつかの態様において、10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージは、精製ポリヌクレオチド試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージより、約1%、2%、3%、4%、5%、6%、7%、8%、もしくは9%未満低いか、または最大で10%低いに過ぎない。
いくつかの態様において、オンターゲット特異性は、精製ポリヌクレオチド試料から観察されるオンターゲット特異性に等しい。
いくつかの態様において、オンターゲット特異性は、精製ポリヌクレオチド試料から観察されるオンターゲット特異性より、約1%、2%、3%、4%、5%、6%、7%、8%、もしくは9%未満低いか、または最大で10%低いに過ぎない。
いくつかの態様において、被覆度均一性は、精製ポリヌクレオチド試料から観察される被覆度均一性に等しい。
いくつかの態様において、被覆度均一性は、精製ポリヌクレオチド試料から観察される被覆度均一性より、約1%、2%、3%、4%、5%、6%、7%、8%、もしくは9%未満低いか、または最大で10%低いに過ぎない。
いくつかの態様において、本方法は、線形増幅中の遅いランピング速度を含む。
いくつかの態様において、本方法は、伸長中の遅いランピング速度を含む。
いくつかの態様において、伸長は、第1の期間中は反応を約90℃〜99℃に維持し、温度を約0.1℃/秒で約60℃まで低下させ、第2の期間中は反応を約55℃〜60℃に維持し、DNAポリメラーゼを加え、温度を約0.1℃/秒で約65℃まで上昇させ、第3の期間中は反応を約65℃に維持し、温度を約0.1℃/秒で約80℃まで上昇させ、第4の期間中は反応を約80℃に維持する工程を含む。
いくつかの態様において、伸長は、第1の期間中は反応を約90℃〜99℃に維持し、温度を約0.1℃/秒で約68℃まで低下させ、第2の期間中は反応を約68℃に維持し、温度を約0.1℃/秒で約55℃まで低下させ、第3の期間中は反応を約55℃に維持し、DNAポリメラーゼを加え、温度を約0.1℃/秒で約65℃まで上昇させ、第4の期間中は反応を約65℃に維持し、温度を約0.1℃/秒で約80℃まで上昇させ、第5の期間中は反応を約80℃に維持する工程を含む。
いくつかの態様において、線形増幅は、第1の期間中は反応を約90℃〜99℃に維持し、温度を約0.1℃/秒で約60℃まで低下させ、第2の期間中は反応を約60℃に維持し、温度を約0.1℃/秒で約72℃まで上昇させ、第3の期間中は反応を約72℃に維持する工程を含む。
いくつかの態様において、伸長は、温度を約0.1℃/秒の速度で低下させかつ/または上昇させる工程を含む。
いくつかの態様において、線形増幅は、温度を約0.1℃/秒の速度で低下させかつ/または上昇させる行程を含む。
いくつかの態様では、第1のプライマー、第2のプライマー、またはその両方の濃度が、固定されている。
いくつかの態様では、伸長、増幅、またはその両方が、塩化マグネシウム、硫酸アンモニウム、D-(+)-トレハロース、ベタイン、またはそれらの組合せの存在下で行われる。
いくつかの態様において、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、60℃〜68℃の融解温度を含む。
いくつかの態様において、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、21〜32ヌクレオチドの長さを含む。
いくつかの態様において、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、それぞれの3'端にある最後の5つのヌクレオチド中に4つまたはそれ以上のピリミジンを含有しない。
いくつかの態様において、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、30%〜70%のGC含量を持つアンプリコンを生産するように設計される。
いくつかの態様において、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、225〜300塩基対の長さを持つアンプリコンを生産するように設計される。
いくつかの態様では、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、初期プライマーパネルから、伸長時、増幅時、またはその両方の読み間違いの数が最も高いプライマーを除外する。
いくつかの態様では、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、初期プライマーパネルから、主として二量体を形成するプライマーを除外する。
いくつかの態様では、第1のプライマー、第2のプライマー、またはその両方のそれぞれは、初期プライマーパネルから、標的ポリヌクレオチドの1つまたは複数に関して最も高い総リード数の1つまたは複数を生成する原因となるプライマーを除外する。
一局面では、複数の第1のプライマーと複数の第2のプライマーとを含むプライマーパネルのためにプライマーを選択する方法であって、
選択されるプライマーが、60℃〜68℃の融解温度、21〜32ヌクレオチドの長さ、それぞれの3'端にある最後の5つのヌクレオチド中に3つまたはそれ未満のピリミジン、GC 30%〜70%の配列リードを生成するプライマー、および225〜300ヌクレオチドの長さを持つ配列リードを生成するプライマーを含む、第1の段階;
選択されるプライマーが、伸長または増幅中に最も高い読み間違い数を生成する1つまたは複数のプライマー、1%超のプライマー二量体配列を含む複数の配列リードを生成するプライマー、ならびに伸長または増幅中の1%またはそれ以上の読み間違いおよび0.3%超のプライマー二量体配列を含む複数の配列リードを生成するプライマーを含まない、第2の段階;および
選択されるプライマーが、最も高い総配列リード数を生成するプライマーの1つまたは複数を含まない、第3の段階
を含む、方法が提供される。
一局面では、複数の第1のプライマーと複数の第2のプライマーとを含むプライマーパネルからプライマーを除外する方法であって、
除外されるプライマーが、60℃未満または68℃超の融解温度、21ヌクレオチド未満または32ヌクレオチド超の長さ、およびそれぞれの3'端にある最後の5つのヌクレオチド中に4つまたはそれ以上のピリミジン、30%未満のGC含量または70%超のGC含量を持つ配列リードを生成するプライマー、および225ヌクレオチド未満または300ヌクレオチド超の長さを持つ配列リードを生成するプライマーを含む、第1の段階;
除外されるプライマーが、伸長または増幅中に最も高い読み間違い数を生成する1つまたは複数のプライマー、1%超のプライマー二量体配列を含む複数の配列リードを生成するプライマー、ならびに伸長または増幅中の1%またはそれ以上の読み間違いおよび0.3%超のプライマー二量体配列を含む複数の配列リードを生成するプライマーを含む、第2の段階;および
除外されるプライマーが、最も高い総配列リード数を生成するプライマーの1つまたは複数を含む、第3の段階
を含む、方法が提供される。
一局面では、複数のプライマー中のプライマーのそれぞれが、60℃〜68℃の融解温度、21〜32ヌクレオチドの長さ、それぞれの3'端にある最後の5つのヌクレオチド中に3つまたはそれ未満のピリミジンを含み、GC 30%〜70%および225〜300ヌクレオチドの長さを持つ配列リードを生成する、複数のプライマーを含むプライマーパネルが、本明細書において提供される。
いくつかの態様において、プライマーパネルは、伸長反応または増幅反応中に最も高い読み間違い数を生成する1つまたは複数のプライマー、1%超のプライマー二量体配列を含む複数の配列リードを生成するプライマー、ならびに伸長反応または増幅反応中の1%またはそれ以上の読み間違いおよび0.3%超のプライマー二量体配列を含む複数の配列リードを生成するプライマー、および最も高い総配列リード数を生成するプライマーの1つまたは複数を含まない。
[本発明1001]
(a)標的特異的配列を含む第1のプライマーを使用して、試料から標的ポリヌクレオチドの第1の相補配列(CS)を作製する工程;
(b)第1のプライマー結合配列(PBS)またはその一部分を含むアダプターを、該第1のCSに付着させ、それにより修飾相補配列(MCS)を形成する工程;
(c)該MCSにハイブリダイズした第2のプライマーを伸長させ、それにより第2のCSを形成する工程であって、該第2のプライマーが、
(i)標的特異的領域と、
(ii)第2のPBSと
を含む、工程;ならびに
(d)該第1のPBSおよび該第2のPBSにそれぞれハイブリダイズする複数のプライマーを使用して、該第2のCSを増幅する工程
を含み、
該第1のプライマーまたは該第2のプライマーがユニーク識別(UID)配列を含む、
ポリヌクレオチドのライブラリーを作製する方法。
[本発明1002]
(a)標的ポリヌクレオチドにハイブリダイズした、標的特異的な第1のプライマーを伸長させて、第1のCSを形成する工程;
(b)該第1のCSにアダプターを付着させて、MCSを形成する工程;
(c)該MCSにハイブリダイズした第2のプライマーを伸長させて、第2のCSを形成する工程;および
(d)該第2のCSを増幅する工程;
を含み、
工程(a)または(c)が指数関数的増幅を含まず、かつ
該第1のプライマーまたは該第2のプライマーがUIDを含む、
ポリヌクレオチドのライブラリーを作製する方法。
[本発明1003]
(a)標的ポリヌクレオチドから、第1のCSまたはその修飾型(MCS)を作製する工程;
(b)該第1のCSの配列を含むポリヌクレオチドから、第2のCSを作製する工程であって、該第2のCSが非指数関数的増幅反応によって作製される、工程;および
(c)該第2のCSを増幅する工程;
を含み、
該第1のCSまたは該第2のCSがUIDを含む、
ポリヌクレオチドのライブラリーを作製する方法。
[本発明1004]
(a)標的ポリヌクレオチドから作製された第1のCSまたはその修飾型(MCS)から、第2のCSを作製する工程であって、該第1のCS、該第2のCS、または該MCSがUIDを含み、かつ該第1のCSおよび該第2のCSがそれぞれ個別に、
(i)プライマー伸長反応、または
(ii)線形増幅反応
によって作製される、工程;
(b)該第2のCSを増幅する工程;
(c)増幅された該第2のCSの少なくとも1つをシーケンシングする工程;
(d)同じUIDを含有する、工程(c)からの少なくとも2つの配列を、アラインメントする工程;ならびに
(e)工程(d)に基づいて、該標的ポリヌクレオチド配列に正確に相当するコンセンサス配列を決定する工程
を含む、標的ポリヌクレオチドの配列を正確に決定する方法。
[本発明1005]
前記第1のプライマーがユニバーサルライゲーション配列(ULS)を含む、本発明1001〜1004のいずれかの方法。
[本発明1006]
前記第2のプライマーがユニバーサルプライミング配列(UPS)をさらに含む、本発明1001〜1005のいずれかの方法。
[本発明1007]
前記アダプターが試料バーコード(SBC)配列をさらに含む、本発明1001〜1006のいずれかの方法。
[本発明1008]
前記MCSがアフィニティ分子または捕捉配列をさらに含む、本発明1001〜1007のいずれかの方法。
[本発明1009]
前記UIDが、配列
Figure 0006494045
を含み、Nが任意の核酸残基である、本発明1001〜1008のいずれかの方法。
[本発明1010]
前記UIDが、配列
Figure 0006494045
を含み、Nが任意の核酸残基でありかつWがアデニンまたはチミンである、本発明1001〜1008のいずれかの方法。
[本発明1011]
前記付着させることがライゲーションを含む、本発明1001〜1010のいずれかの方法。
[本発明1012]
前記付着させることが増幅を含む、本発明1001〜1011のいずれかの方法。
[本発明1013]
(a)標的ポリヌクレオチドから作製された第1のCSまたはその修飾型(MCS)から、第2のCSを作製する工程であって、該第1のCSおよび該第2のCSがそれぞれ個別に、
(i)プライマー伸長反応、または
(ii)線形増幅反応
によって作製される、工程;
(b)該第2のCSを増幅する工程;
(c)増幅された該第2のCSの少なくとも1つをシーケンシングする工程;
(d)少なくとも10%の配列同一性を含む、工程(c)からの少なくとも2つの配列を、アラインメントする工程;ならびに
(e)工程(d)に基づいて、該標的ポリヌクレオチド配列に正確に相当するコンセンサス配列を決定する工程
を含む、標的ポリヌクレオチドの配列を正確に決定する方法。
[本発明1014]
(a)本発明1001〜1012のいずれかのライブラリーを作製する工程;
(b)該ライブラリーの少なくとも一部分をシーケンシングする工程;
(c)少なくとも10%の配列同一性を含む、工程(b)からの少なくとも2つの配列を、アラインメントする工程;および
(c)に基づいて、正確に標的ポリヌクレオチド配列に相当するコンセンサス配列を決定する工程
を含む、該標的ポリヌクレオチドの配列を正確に決定する方法。
本明細書に記載する新規な特徴は本願の特許請求の範囲に詳しく説明する。本明細書に記載する特徴および本明細書に記載する特徴の利点は、本明細書に記載する特徴の原理を利用する説明的な例を述べる以下の詳細な説明および添付の図面を参照することによって、より良く理解されるであろう。
本明細書に記載する例示的な標的シーケンシング法の概略図である。 本明細書に記載する例示的な標的シーケンシング法の概略図である。 改良された標的シーケンシング法を作製するための例示的処理の概略図である。処理時間を示している。 本明細書に記載する非改良型および改良型標的シーケンシング法による表示のプライマーパネルを使用した場合のオンターゲット特異性パーセントを、当技術分野において公知の他のプライマーパネル(別法#1および別法#2)と比較して示す一覧表である。Tex-1パネルは23個の遺伝子(全てエクソン)に対するキャリアパネルである。CS-23は18遺伝子に対するrsSNPフォーカスプライマーパネルである。 表示の反応条件での標的リード被覆度のグラフである。表示の反応条件での被覆度を上回る遺伝子の割合対リード深度を示す。配列被覆度に対して正の効果を有する条件をボールド体で表す。 図6Aは、30プライマーのパネルに使用した低ストリンジェント条件での例示的な標的シーケンシング法の表示の工程に関するランピングおよびアニーリング条件の概略図である。図6Bは、十分な標的生産量を生じるには不十分であった図6Aのランピングおよびアニーリング条件下で使用した約350プライマーのパネルにおけるプライマーの濃度を表す。 低ストリンジェント(上)および高ストリンジェント(下)なランピングおよびアニーリング条件下での例示的な標的シーケンシング法の概略図である。第2のプライマー伸長工程のランピング速度を遅くすることによってストリンジェンシーを増加させた。第1のプライマー伸長工程に68℃保持工程を加えることによってストリンジェンシーを増加させた。最低アニーリング温度を55℃まで下げることによってストリンジェンシーを増加させた。 約350プライマーのパネルから全部、半分、四分の一またはごく一部のプライマーを使用して、図8に示したより低いストリンジェント条件下でプライマーごとの濃度を固定した場合(グループ1)および総プライマー濃度を固定した場合(グループ2)のプライマーの濃度と結果を表す。 図9Aは、添加物なしで行った例示的な標的シーケンシング法の表示のPCRサイクル数後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。標的産物と二量体産物を示す。図9Bは、ベタインを添加して行った例示的な標的シーケンシング法の表示のPCRサイクル数後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。標的産物と二量体産物を示す。図9Cは、トレハロースを添加して行った例示的な標的シーケンシング法の表示のPCRサイクル数後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。標的産物と二量体産物を示す。 図9Dは、塩化マグネシウムを添加して行った例示的な標的シーケンシング法の表示のPCRサイクル数後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。標的産物と二量体産物を示す。図9Eは、硫酸アンモニウムを添加して行った例示的な標的シーケンシング法の表示のPCRサイクル数後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。標的産物と二量体産物を示す。 表示の条件下で行った例示的な標的シーケンシング法での33PCRサイクル後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。 配列の長さ(the length of the sequence)対配列長(sequence length)の二量体配列解析のグラフである。シーケンシングした対応する二量体産物を右側のゲルに示す。 二量体シーケンシング解析によって決定された第2のプライマー伸長工程中の不要産物形成について提案される機序を表す図解である。二量体形成は、高い融解温度を持つプライマーにより、低いアニーリング温度で助長される。二量体形成は、UIDと相互作用するGC含量の高いプライマーによって助長される。この図は、記載の順にSEQ ID NO 90〜91、92、91、および93を開示している。 例示的プライマーパネルCS-350の遺伝子および関連する疾患、エクソンの数、プローブセットの数を示す一覧表である。右側のプライマーのないエクソンのリストは、本明細書に記載するプライマー設計法以外のプライマー設計法ではプライマー配列が得られなかったエクソンを示している。 約350個のプライマーを含有するプライマーパネルからプライマーサブパネルを作成するために使用した除外基準の図解である。 表示の約350個プライマーのプライマーパネルのおよびそれから図14に示す除外基準を使用して作成されたサブパネルの100×capでの、オンターゲット特異性および被覆度の均一性を示すプロットである。 表示の約350個のプライマーのプライマーパネルのおよびそれから図14に示す除外基準を使用して作成されたサブパネルの100×capでの、オンターゲット特異性、被覆度の均一性、およびアンプリコン1個あたりの平均リード深度を示す一覧表である。 表示の約350個プライマーのパネルおよびそれから図14に示す除外基準を使用して作成されたサブパネルの、表示のインシリコcap範囲にわたる被覆度の均一性を示すプロットである。 図17Aは、3つの異なるUID(BC_01、BC_02、BC_03)を使用した、本明細書に記載する例示的な標的シーケンシング法のオンターゲット特異性を示すグラフである。図17Bは、3つの異なるUIDを使用した、本明細書に記載する例示的な標的シーケンシング法のPCR後の産物を示す。図17Cは、図17Aからの対応する値を示す一覧表である。 表示のインシリコcap範囲での、平均の20%を上回るアンプリコンのパーセンテージのプロットであり、3つの異なるUIDを使用した本明細書に記載する例示的な標的シーケンシング法の被覆度の均一性を示している。 生リード(UIDなし)をUIDで強化された精度と比較したプロットである。 例示的な標的シーケンシング法を使用したSNP検出および配列解析ワークフローの概略図である。 表示のUIDを使用する、本明細書に記載の例示的な標的シーケンシング法を使用した場合に、試料間で合致するSNPコールの相対的パーセンテージを示すプロットおよび対応する一覧表である。BC_6では少ないサイクリング数で高いユニーク分子数が得られた。 本明細書に記載する例示的な標的シーケンシング法を使用した場合の、各アンプリコンのリード数パーセンテージ対アンプリコンのGC含量%のプロットである。多数の低パフォーマーがグループAに存在する。 本明細書に記載する例示的な標的シーケンシング法を使用した場合の、各アンプリコンのリード数パーセンテージ対アンプリコンのGC含量%のプロットである。 各々のプライマー融解温度によってマッピングした低パフォーマンスアンプリコンのプロットである。 各々のプライマー融解温度によってマッピングした低パフォーマンスアンプリコンのプロットである。 各々のプライマー融解温度によってマッピングした低、中、および高パフォーマンスアンプリコンのプロットである。 標的シーケンシング法において使用するための改良されたプライマー設計に関する設定を要約した一覧表である。 標的シーケンシング法において使用するための改良されたオフターゲットヒットのコーリング(calling)基準の略図である。 標的シーケンシング法において使用するための改良されたプライマー設計の概略図である。一つの改良されたプライマー設計では約20ntイントロンバッファー配列を加えている。一つの改良されたプライマー設計では、被覆度の向上およびフレキシビリティの強化のために、エクソンを均等に分割している。 本明細書に記載するプライマー設計法を使用して設計された改良型プライマーパネル(v.3.0)を、先行技術の方法(v.1.0)を使用して設計されたプライマーパネルと比較して示すグラフである。この改良型パネルは、増幅効率の向上および検出されるユニーク分子数の増加をもたらし、それがSNPコーリング能の強化、シーケンシング被覆度要件の低減につながり、試料投入量の要件を低下させる。 改良されたプライマー設計基準に適合する表示のサブパネル中のプライマーと改良されたプライマー設計基準に適合しない同じサブパネル中のプライマーに関して被覆度の均一性を比較したプロットである。改良されたプライマー設計基準に適合するサブパネル中のプライマーの方が、高い被覆度の均一性、高いオンターゲット特異性、および高いリードカウントを示す。 均一性および被覆度ならびにオンターゲット特異性に関する全血試料パフォーマンスを、全血から抽出したDNAの試料と比較して示すグラフである。 表示の体積の全血試料を使用して行った例示的な標的シーケンシング法の表示のPCRサイクル数後の産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。わずか1μLの全血でも使用することができる。 全血試料および全血から抽出されたDNAの試料由来の、ユニーク分子が10個超であるアンプリコンの数を比較した解析のグラフ(上)および対応する表(下)である。3×全血試料は、アダプターライゲーションに先だって、3つの第1のプライマー伸長反応を合わせている。 全血試料と全血から抽出されたDNAの試料とのSNPコーリングの相違を示す一覧表である。上側の一覧表は、全血試料を使用して見落とされたSNPコールを示している。上側の一覧表は、全血から抽出されたDNAの試料を使用して見落とされたSNPコールを示している。この図は、記載の順にそれぞれSEQ ID NO 94〜95、94〜96、および96〜97を開示している。 均一性および被覆度ならびにオンターゲット特異性に関してFFPE前立腺組織試料パフォーマンスを、全血試料および全血から抽出されたDNAの試料と比較して示すグラフである。 さまざまな試料を使用した例示的な標的シーケンシング法からの産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。本明細書に記載する方法は、事前のヌクレオチド抽出なしで第1のプライマー伸長反応への全血または唾液の直接投入、頬側試料およびFFPE試料を含む、さまざまな試料に適応することができる。 FFPE試料、全血試料、および全血から抽出されたDNAの試料由来の、ユニーク分子が10個超であるアンプリコンの数を比較した解析のグラフ(上)および対応する表(下)である。3×全血試料は、アダプターライゲーションに先だって、3つの第1のプライマー伸長反応を合わせている。 表示のPCRサイクル数および表示のUIDを使用して検出されるユニーク分子の数のグラフである。このグラフは、PCRサイクル数を下げると、過剰に増幅された大きな産物の形成が防止され、PCR重複が低減すると共に、要求されるシーケンシング深度の低減が可能になり、低投入量の試料でのデータを改良することができ、PCRサイクリングの低減を相殺するために線形増幅を活用するできることを実証している。 例示的な標的シーケンシング法から作製されたライブラリーを使用したシーケンシングデータ品質を、ゲル精製したものと、Ampure精製したライブラリーとで比較して示すグラフである。 10超または10のユニーク分子被覆度を有するアンプリコンのパーセントを示すインシリコ・リード・タイトレーションのグラフである。Tex_01プライマーパネル(336アンプリコン)では、1アンプリコンあたり500×平均リード深度でのシーケンシングにより、アンプリコンの95%について十分なユニーク分子被覆度が得られた。これにより、実行(run)1回あたり90試料のマルチプレックスが可能になる(336×500=168,000リード)。 各バーコード化試料に関する予想配列数および実際の配列数ならびにバーコード化試料1個あたりの総配列リードのパーセンテージの一覧表である。 1遺伝子あたりの捕捉されるユニーク分子の比を示すコピー数定量化のグラフである。ある所与の遺伝子に関するユニークリード(フィルタリングされたUID)の比を、常染色体上の遺伝子とX染色体上の遺伝子とで比較した。男性参照患者と3人の試験患者の間のリードの比を示す。これは、標的シーケンシングにUID解析を使用する方法の定量的能力を実証している。 700bp長を上回る産物を増幅する能力が実証されている、例示的なRNAベースのプライマー伸長標的シーケンシング法の概略図である。 図42Aは、表示のRNA投入量を使用して行った、表示のPCRサイクル後の、例示的RNA標的シーケンシング法からの産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。図42Bは、本明細書に記載する例示的RNA標的シーケンシング法を適用することに成功した標的の例示的なリストである。 技術的反復実験(technical repeat)として行った例示的標的シーケンシング法からの産物を、アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。これは、本明細書に記載する方法の再現性を示している。 プライマーパネルを作成するために開発された例示的なプライマー設計ソフトウェアの概略図である。 表示のインシリコcap範囲で平均の20%超であるアンプリコンのパーセンテージのプロットである。表示のリード被覆度倍率においてプライマーサブパネルを使用して行った本明細書に記載の例示的な標的シーケンシング法の被覆度の均一性を、100×メジアンに標準化して示している。 表示の約350プライマーのプライマーパネルと、図15に示す除外基準および本明細書に記載する他の方法を使用してそこから作成されたサブパネルの、被覆度の均一性を比較したグラフである。 本明細書に記載する方法の品質測定規準を要約した一覧表である。 DNA標的シーケンシング法の産物を、2% アガロースゲル上に、100塩基対(bp)ラダーと並べて示す。表示のPCR増幅サイクル数後の、2人の患者(B1およびB2)由来の試料を示す。 RNA標的シーケンシング法の産物を、2%アガロースゲル上に、100bpラダーと並べて示す。表示のPCR増幅サイクル数後の、2人の患者(B1およびB2)由来の試料を示す。各患者について、出発RNA投入材料のタイトレーションを1000ngから1ngまで行った。 標的シーケンシングの方法を使用した次世代シーケンシング(NGS)後データフィルタリング処理の結果のヒストグラムである。図49Bのヒストグラムは図49Aの対数尺度版である。ペアエンドリード(R1およびR2)アプローチを使用してNGSを行い、表示の試料について合計約600万リードを得た。30のまたはそれより高いphred Qスコアを持つ配列をさらに解析した(品質合格R1およびR2)。次に、配列データを、DNA標的ライブラリープロトコールで使用した予想されるプライマーパネルの存在についてのクエリを実行した(プライマー合格R1およびR2)。予想されるプライマー配列の一つで始まっていないシーケンシングはいずれも破棄した。R1上に既知のまたは予想されるプライマー配列を持つ各リードについて、R2上の予想されるプライマーを適格とした(ペアードR1およびR2)。それゆえに、既知のR1プライマーがR2上の異なる標的プライマーとミスマッチである場合(またはその逆の場合)、それは非特異的増幅産物に相当する(明るい灰色で示す)。既知のR1プライマーがR2上の異なる標的プライマーとミスマッチでない場合(またはその逆の場合)、それは特異的増幅産物に相当する(暗い灰色で示す)。 DNA標的パネルのシーケンシングリードカウントのグラフである。表示の各遺伝子が、DNA試料の調製に使用した特異的プライマー対の標的となった。図50Aは、UIDを持たない(左)およびUIDを持つ(右)第1のプライマー対(BC3)による、DNA標的パネルのシーケンシングリードカウントのグラフである。 DNA標的パネルのシーケンシングリードカウントのグラフである。表示の各遺伝子が、DNA試料の調製に使用した特異的プライマー対の標的となった。図50Bは、標的シーケンシングの方法を使用した、UIDを持たない(左)およびUIDを持つ(右)第2のプライマー対(BC1)による、DNA標的パネルのシーケンシングリードカウントのグラフである。 DNA標的パネルのシーケンシングリードカウントのグラフである。表示の各遺伝子が、DNA試料の調製に使用した特異的プライマー対の標的となった。図50Cは、事後UIDフィルタリングを伴った標的シーケンシング法を使用した、DNA標的パネルのシーケンシングリードカウントのグラフである。 UIDフィルタリングを伴った標的シーケンシング法を使用したRNA標的パネルのシーケンシングリードカウントを示す。表示の各遺伝子転写産物が、RNA試料の調製に使用した特異的プライマー対の標的となった。図51Aは、RNA標的パネルのシーケンシングリードカウントのグラフ(左)およびシーケンシングリード頻度のグラフ(右)である。 UIDフィルタリングを伴った標的シーケンシング法を使用したRNA標的パネルのシーケンシングリードカウントを示す。表示の各遺伝子転写産物が、RNA試料の調製に使用した特異的プライマー対の標的となった。図51Bは、図51Aに示したシーケンシングリード頻度のグラフ(左)の対数尺度版である。ここに示すデータは、フィルタリング後のリード/発現カウントを表す。 標的シーケンシング法を使用した表示の標的および条件に関する標的特異性解析の結果のプロットである。さまざまなプロトコール条件を試験した(サイクル数、緩衝液、アニーリング条件など)。図示するように、いくつかの条件下で99.2%の標的特異性が達成された(例えばシーケンシングリードの99.2%が所望の標的であり、非特異的増幅はごくわずかである。 UIDフィルタリングを伴った標的シーケンシング法を使用した表示の標的および条件に関するUID分布のプロットである。さまざまなプロトコール条件を試験した(サイクル数、緩衝液、アニーリング条件など)。UID1個あたりの生配列数は使用する条件に依存して変動しうる。 UIDフィルタリングを伴った標的シーケンシング法を使用したUID配列1個あたりのリード数に関するシーケンシング精度phredスコア(Q)の推定される増加のプロットである。 UIDフィルタリングを適用した場合の、標的シーケンシング法を使用した各表示の標的の精度の改良を示すプロットである。 UIDフィルタリングを伴った標的シーケンシング法を使用したUIDコンセンサス解析およびSNPジェノタイピング解析の精度の一覧表である。さまざまなDNA標的領域(y軸)を、さまざまな実験条件(x軸)に対して試験した。表示の各標的のコンセンサス配列を灰色で示し、変異/SNPを白色で示す。ホモ接合遺伝子では灰色が優勢になる。ヘテロ接合遺伝子は、その配列の約50%が共通配列を白色で示すことによって示される。PCRエラーまたはシーケンシングエラーによる変異および挿入欠失を黒色で示す。 UIDフィルタリングを伴った標的シーケンシング法を使用したGBA遺伝子の配列解析を表す。患者試料由来のGBA遺伝子の両アレルをClustal Wを使用してアラインメントした。患者は、UIDフィルタリング後に、ヘテロ接合性を示した。両アレルをEnsemblヒトゲノム参照と比較した。「*」印の欠如は、前記3つの配列の1つにおける誤った対形成アラインメントを表す。ここに提示する患者のGBA遺伝子は、ヒト参照ゲノムと同一な一つのアレルと、6つの配列多型/変異が観察される第2のアレルとを有する。この図は、記載の順に、それぞれSEQ ID NO 98〜100を開示している。 図12で試験した患者と同じ患者におけるGBA遺伝子のSNPジェノタイピング解析を表す。ここに提示するデータは、本明細書に記載するUIDフィルタリングを伴った標的シーケンシング法を使用した発見されたGBA遺伝子標的中に存在する病因性SNP(rs 1064644)の場所を示している。 本発明の態様例に関連して使用することができるコンピュータシステムの第1のアーキテクチャ例を例示するブロック図である。 本発明の態様例に関連して使用することができるコンピュータネットワークを例示する図解である。 本発明の態様例に関連して使用することができるコンピュータシステムの第2のアーキテクチャ例を例示するブロック図である。
詳細な説明
本明細書において使用する場合、増幅は、増幅反応を行うことを含む。プライマー伸長反応の産物は、プライマーの伸長中に生産されるテンプレートの相補鎖と共にプライマー配列を含みうる。いくつかの態様において、増幅反応は、それぞれがポリヌクレオチドの相補鎖にハイブリダイズする2つのプライマーの伸長を含む。ポリヌクレオチドの増幅は、当技術分野において公知の任意の手段によって行うことができる。ポリヌクレオチドはポリメラーゼ連鎖反応(PCR)または等温DNA増幅によって増幅することができる。
増幅反応は1つまたは複数の添加剤を含みうる。いくつかの態様において、前記1つまたは複数の添加剤は、ジメチルスルホキシド(DMSO)、グリセロール、ベタイン(一)水和物(N,N,N-トリメチルグリシン=[カルボキシ-メチル]トリメチルアンモニウム)、トレハロース、7-デアザ-2'-デオキシグアノシン三リン酸(dC7GTPまたは7-デアザ-2'-dGTP)、BSA(ウシ血清アルブミン)、ホルムアミド(メタンアミド)、硫酸アンモニウム、塩化マグネシウム、塩化テトラメチルアンモニウム(TMAC)、他のテトラアルキルアンモニウム誘導体(例えば塩化テトラエチルアンモニウム(TEA-Cl)および塩化テトラプロピルアンモニウム(TPrA-Cl)、ノニオン洗浄剤(例えばTriton X-100、Tween 20、Nonidet P-40(NP-40))、またはPREXCEL-Qである。いくつかの態様において、増幅反応は、0、1、2、3、4、5、6、7、8、9、または10種の異なる添加剤を含みうる。別の例では、増幅反応は、少なくとも0、1、2、3、4、5、6、7、8、9、または10種の異なる添加剤を含みうる。いくつかの態様において、1つまたは複数の添加剤を含む伸長、逆転写または増幅反応は、増加によって特徴づけることができる。
本明細書において使用する場合、ポリメラーゼ連鎖反応(PCR)は、二本鎖ポリヌクレオチドの相補鎖の同時プライマー伸長による特異的ポリヌクレオチド配列のインビトロ増幅反応を含む。PCR反応はプライマー結合部位に挟まれたテンプレートポリヌクレオチドのコピーを生成する。2つのプライマーによる結果は、各サイクルでの両鎖のテンプレートポリヌクレオチドコピー数の指数関数的増加である。なぜなら各サイクルで両鎖が複製されるからである。ポリヌクレオチド二重鎖は、使用したプライマーの端部に対応する末端を有する。PCRは、テンプレートポリヌクレオチドの変性、プライマー結合部位へのプライマーのアニーリング、およびヌクレオチドの存在下でのDNAポリメラーゼまたはRNAポリメラーゼによるプライマーの伸長の1回または複数回の繰り返しを含みうる。各工程における特定温度、継続時間、および工程間の変化速度は、当業者に周知の数多くの因子に依存する(McPherson et al., IRL Press,オックスフォード(1991および1995))。例えば、Taq DNAポリメラーゼを使用する従来のPCRでは、二本鎖テンプレートポリヌクレオチドを90℃超の温度で変性させることができ、プライマーを50〜75℃の範囲の温度でアニールさせることができ、プライマーを72〜78℃の範囲の温度で伸長させることができる。いくつかの態様において、PCRは、逆転写PCR(RT-PCR)、リアルタイムPCR、ネステッドPCR、定量PCR、マルチプレックスPCRなどを含む。いくつかの態様において、PCRはRT-PCRを含まない(米国特許第5,168,038号、同第5,210,015、同第6,174,670号、同第6,569,627号、および同第5,925,517号; Mackay et al., Nucleic Acids Research, 30:1292-1305(2002))。RT-PCRは、PCR反応の前に逆転写反応を含み、その結果得られたcDNAが増幅される。ネステッドPCRは2段階のPCRを含み、第1のプライマーセットを用いる第1のPCR反応のアンプリコンは、少なくとも一方のプライマーが第1のPCR反応のアンプリコンの内部にある場所に結合する第2のプライマーセットを用いる第2のPCR反応の試料になる。マルチプレックスPCRは、複数種類のポリヌクレオチド配列が同じ反応混合物中で同時にPCRに付されるPCR反応を含む。PCR反応体積は0.2nL〜1000μLのいずれでもよい。定量PCRは、試料中の1つまたは複数の配列の絶対量または相対量、存在量、または濃度を測定するために設計されたPCR反応を含む。定量的測定には、1つまたは複数の参照配列または標品を、関心対象のポリヌクレオチド配列と比較することを含めることができる(Freeman et al., Biotechniques, 26:112-126(1999); Becker-Andre et al., Nucleic Acids Research, 17: 9437-9447(1989); Zimmerman et al., Biotechniques, 21:268-279(1996); Diviacco et al., Gene, 122:3013-3020(1992); Becker-Andre et al., Nucleic Acids Research, 17: 9437-9446(1989))。
本明細書において使用する場合、アレルは、遺伝子配列内の少なくとも1つのバリアント部位の配列が、同じ遺伝子の他の配列とは異なる、細胞内、個体内、または集団内のある特異的遺伝子配列であることができる。異なるアレル間で異なるバリアント部位の配列は、多型または変異などのバリアントであることができる。バリアントは、点変異、多型、一塩基多型(SNP)、一塩基変動(SNV)、転座、挿入、欠失、増幅、逆位、中間部欠損、コピー数変動(CNV)、ヘテロ接合性の消失、またはそれらの任意の組合せを含むことができる。試料は、それがある染色体遺伝子座に2つの異なるアレルを有するのであれば、その遺伝子座において、「ヘテロ接合」である。試料は、それがある染色体遺伝子座に2つの同一アレルを有するのであれば、その遺伝子座において「ホモ接合」である。
いくつかの態様において、バリアントは、ポリペプチドに影響を及ぼす変化、例えば発現レベル、配列、機能、局在化、結合パートナーの変化、またはそれらの任意の組合せを含みうる。いくつかの態様において、遺伝子変動は、フレームシフト変異、ナンセンス変異、ミスセンス変異、中立変異、またはサイレント変異であることができる。例えば、参照ヌクレオチド配列と比較した場合、配列の相違には、フレームシフトをもたらす1ヌクレオチドまたは2つ以上のヌクレオチドの挿入または欠失;コードされているアミノ酸の変化をもたらす少なくとも1ヌクレオチドの変化;未成熟停止コドンの生成をもたらす少なくとも1ヌクレオチドの変化;ヌクレオチドがコードする1つまたは複数のアミノ酸の欠失をもたらす数ヌクレオチドの欠失;読み枠のコード配列の中断をもたらす、非等価組換えまたは遺伝子変換などによる1ヌクレオチドまたは数ヌクレオチドの挿入;ある配列の全部または一部の重複;転位;またはヌクレオチド配列の再編成が含まれうる。そのような配列変化は、核酸がコードするポリペプチドを変化させうる。例えば核酸配列中の変化がフレームシフトを引き起こすのであれば、そのフレームシフトはコードされているアミノ酸の変化をもたらす場合があり、かつ/または切断型ポリペプチドの生成を引き起こす未成熟停止コドンの生成をもたらす場合がある。いくつかの態様において、バリアントは、1つまたは複数のヌクレオチドの同義的変化、例えばアミノ酸配列の変化をもたらさない変化であることができる。そのような多型は、例えばスプライス部位を変化させ、mRNAの安定性または輸送に影響を及ぼし、またはコードされているポリペプチドの転写もしくは翻訳に他の形で影響を及ぼしうる。いくつかの態様において、同義的変異は、翻訳中のポリペプチドフォールディングに強い影響を及ぼす希なコドン使用ゆえに変化した構造を有するポリペプチド産物をもたらすことがあり、その変化した構造は、その機能を変化させ、かつ/またはそれが薬物標的であれば、薬物結合特性を変化させうる場合もある。いくつかの態様において、DNAを改変しうる変化は、増幅または欠失などの構造変化が体細胞レベルで起こる可能性を増加させる。
本明細書において使用する場合、多型は、2つまたはそれ以上の、遺伝的に決定された選択的配列またはアレルが集団中に存在することでありうる。多型部位は多様性が発生する遺伝子座を含む。いくつかの態様において、多型は、0.5%、1%、2%、または5%を下回る頻度で発生する。いくつかの態様において、多型は1%、5%、10%、20%、または30%を上回る頻度で発生する。いくつかの態様において、バイオマーカーは、選択された集団において、それぞれが1%、5%、10%、または20%を上回る頻度で発生する、少なくとも2つのアレルを有する。いくつかの態様において、多型はウイルス配列または細菌配列を含み、選択された集団において、0.5%、1%、2%、または5%を下回る頻度で発生する。多型は、1つまたは複数の塩基の塩基変化、挿入、反復、または欠失などといった1つまたは複数のバリアントを含みうる。多型は一塩基多型(SNP)を含みうる。コピー数バリアント(CNV)、塩基転換および他の再編成も、バリアントの形態である。多型には、制限断片長多型、可変タンデムリピート数(VNTR)、超可変領域、ミニサテライト、ジヌクレオチドリピート、トリヌクレオチドリピート、テトラヌクレオチドリピート、単純反復配列、および挿入因子が含まれる。選択された集団の最も頻度の高いアレル配列は野生型アレルでありうる。二倍体生物はアレルに関してホモ接合またはヘテロ接合でありうる。
本明細書において使用する場合、ジェノタイピングは、1つまたは複数のゲノム位置で対象の遺伝子配列を決定することを含む。例えば、ジェノタイピングは、1つのSNPまたは2つもしくはそれ以上のSNPに関して対象がどの1つまたは複数のアレルを有するかを決定することを含みうる。二倍体対象は、考えうる2つのアレルのそれぞれについてホモ接合またはヘテロ接合でありうる。1つまたは複数の遺伝子座においてヘテロ接合である正常細胞は、それらの遺伝子座においてホモ接合である腫瘍細胞を生じうる。このヘテロ接合性の消失(LOH)は、正常遺伝子の欠失、正常遺伝子を保因する染色体の喪失、有糸分裂組換え、または正常遺伝子を持つ染色体の喪失および遺伝子が欠失もしくは不活化している染色体の重複の結果として起こりうる。LOHは、コピーニュートラルであるか、または欠失または増幅の結果として起こりうる。
本明細書において使用する場合、対象、個体、および患者には、哺乳動物などの生きている生物が含まれる。対象および宿主の例として、ウマ、ウシ、ラクダ、ヒツジ、ブタ、ヤギ、イヌ、ネコ、ウサギ、モルモット、ラット、マウス(例えばヒト化マウス)、スナネズミ、非ヒト霊長類(例えばマカク)、ヒトなど、非哺乳動物、例えば非哺乳類脊椎動物、例えば鳥類(例えばニワトリまたはアヒル)、魚類(例えばサメ)またはカエル(例えばアフリカツメガエル(Xenopus))、および非哺乳類無脊椎動物、ならびにそれらのトランスジェニック種が挙げられるが、それらに限定されるわけではない。ある特定の局面において、対象は、単一の生物(例えばヒト)を指す。あるいは、ある特定の局面において、研究すべき共通の免疫因子および/または疾患を有する小さなコホートおよび/または疾患を持たない個体(例えば陰性/正常対照)のコホートを構成する個体のグループが用意される。試料採取を受ける対象は、疾患および/または障害(例えば1つまたは複数のアレルギー、感染症、がんまたは自己免疫障害など)を患っている対象であることができ、疾患に冒されていない陰性対照対象と比較することができる。
標的シーケンシング法全般
本明細書に記載する方法は、シーケンシング用のポリヌクレオチドのライブラリーを作製するために使用することができる。試料中のポリヌクレオチドに関して決定される配列は、塩基コールにおいて高い精度および信頼度で決定することができる。本方法は、試料中に存在するDNA配列またはRNA配列を特異的にターゲティングし、ユニークにエンコードし、修飾し、増幅し、シーケンシングし、かつ/または定量することを含みうる。これらの方法は、シーケンシングまたは他の分子解析用のポリヌクレオチドアンプリコンのライブラリーをフォーマットする(format)ことができる配列の付加を可能にする。これらの方法によって作製されるシーケンシングライブラリーは、試料中の同じ初期RNAまたはDNA分子に由来する配列リードのビン化を可能にすることができるUIDを組み込みうる。これらの方法は、RNA分子またはDNA分子の集団に見いだされる観測された配列バリアントが真の多型または変異であるか、それとも観察された配列バリアントが増幅エラーまたは増幅バイアスなどの増幅アーチファクトによってもたらされたものであるかについての決定を下すことを可能にすることができる。本明細書に記載する方法のいずれにおいても、UIDは任意であると考えられる。したがって「UID」という叙述はいずれも、任意のUIDを指す。
これらには、NGSプラットフォームでシーケンシングするために、標的特異的プライマーを使用して作製されたポリヌクレオチドのライブラリーを調製する方法が含まれる。生物学的患者試料など由来の多くの生物学的標的は、NGS適合ライブラリーから、シーケンシング後に解析することができる。本方法は、標的頻度(例えば遺伝子発現またはアレル分布)の同定を可能にする。本方法は、例えば、正確な配列情報を導き出すことができる罹患対象または非罹患対象由来のゲノムまたはトランスクリプトームにおける同定および変異またはSNPも可能にする。本方法は、例えば細菌や真菌などの外来生物またはウイルスに対する標的特異的なプライマーを使用することにより、対象由来の生物学的試料における汚染または感染の有無を決定することも可能にする。
本明細書に記載する方法は、感度と特異度との有利なバランスおよび線形プライマー伸長反応および/またはUIDタギングによって付与される利点を提供する。いくつかの態様において、本方法は、臨床的関心対象のパネルなどといった小さなパネルサイズ用に設計される。これらの方法は初期費用を極めて低くすることができ、迅速に行うことができ、RNA標的またはDNA標的に適用することができる。さらにまた、これらの方法において使用するためのプライマーの設計は煩わしくなく、標準的なPCR反応用のプライマー設計と同様に容易である。本方法は、さまざまなシーケンシングおよび他の分子解析のためのポリヌクレオチドのライブラリーをフォーマットするために使用することができる。加えて、さまざまな応用を個別にまたは同時に行うことができる。例えば、がん変異プロファイリングに必要な標的のシーケンシング、SNPおよび変異の解析、キャリアに関する検査、感染の検出、疾患の診断、および遺伝子発現の解析を、個別にまたは同時に行うことができる。
初回ターゲティング:標的ポリヌクレオチドに相補的なUIDタグ付きポリヌクレオチドの形成
解析すべきポリヌクレオチド標的のタイプに応じて、本方法は、逆転写(RT)またはプライマー伸長(PE)を用いることができる。プライマー伸長反応は、単一プライマー伸長工程であることができる。プライマー伸長反応は、1つまたは複数の個別プライマーの1回の伸長を含むことができる。プライマー伸長反応は、1工程での1つまたは複数の個別プライマーの伸長を含むことができる。いくつかの態様において、DNA標的に相補的なポリヌクレオチドは、プライマー伸長反応を行うことによって作製することができる。例えば、DNA標的に相補的なUIDタグ付きポリヌクレオチドは、プライマー伸長反応を行うことによって作製することができる。いくつかの態様において、標的ポリヌクレオチド相補配列、例えばRNA標的に相補的なUIDタグ付きポリヌクレオチドは、逆転写反応を行うことによって作製することができる。標的ポリヌクレオチド相補配列、例えばRNA標的に相補的なUIDタグ付きポリヌクレオチドは、逆転写反応によって作製することができる。標的ポリヌクレオチドには、試料中に最初に存在するポリヌクレオチドが含まれる。
本明細書において使用する場合、「標的ポリヌクレオチド相補配列」とは、標的配列に相補的な配列またはその相補鎖(標的配列に相補的な配列の相補鎖)を含むポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチド相補配列は第1の相補配列を含む。「第1の相補配列」は、標的ポリヌクレオチドから逆転写されたポリヌクレオチド、または標的ポリヌクレオチド上でのプライマー伸長反応から形成されるポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチド相補配列は修飾相補配列を含む。「修飾相補配列」は、標的ポリヌクレオチドから逆転写されるかまたは標的ポリヌクレオチド上でのプライマー伸長反応から形成される、ポリヌクレオチドであり、アダプターを含む。いくつかの態様では、標的ポリヌクレオチド相補配列は第2の相補配列を含む。「第2の相補配列」は、第1の相補配列または修飾相補配列に相補的な配列を含むポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチド相補配列はUIDを含む。例えば、第1の相補配列はUIDを含みうる。例えば、修飾相補配列はUIDを含みうる。例えば、第2の相補配列はUIDを含みうる。例えば第2の相補配列は、第1の相補配列または修飾相補配列のUIDに相補的な配列を含みうる。いくつかの態様において、標的ポリヌクレオチド相補配列はUIDを含まない。例えば第1の相補配列はUIDを含まなくてもよい。例えば、修飾相補配列はUIDを含まなくてもよい。例えば第2の相補配列はUIDを含まなくてもよい。
本方法は第1の工程にRT反応またはPE反応を含むことができる。本方法は後続の工程において線形プライマー伸長反応を含むことができる。線形プライマー伸長反応は、指数関数的増幅ではなく、線形増幅をもたらすことができる。数多くのポリヌクレオチドの標的シーケンシングには、個々の標的特異的なプライマーのそれぞれが、さまざまな酵素による伸長の変動または各々の標的へのアニーリング効率の相違が引き起こすある程度の効率変動を伴いうる。これは、PCRによって指数関数的に拡大されうるバイアスを生じうる。本明細書に記載する方法では、このバイアスを低減しまたは回避するために線形プライマー伸長を用いて、標的相互間の変動頻度の低減または回避をもたらし、改良された信頼度および頻度または塩基コール解析および精度を得ることができる。本明細書に記載する方法では、これらのバイアス問題が回避されることが見いだされ、標的の出発プールの真の頻度表現を維持することができる。いくつかの態様において、本方法で行われるPCR反応などの唯一の指数関数的増幅反応は、ライブラリー作製の最終段階におけるものであり、これには、ユニバーサルプライマーセットを用いることができる。これらの態様では、指数関数的増幅工程中に、遺伝子特異的な変動またはバイアスを導入することなく、全ての標的を均一に増幅させることができる。
逆転写(相補的UIDタグ付きポリヌクレオチドを形成するための標的ポリヌクレオチドのRT)
本明細書に記載するプライマーを使用することで、当技術分野において公知の適切な試薬を使用してRNAポリヌクレオチドを逆転写することができる。RNAはmRNAを含むことができる。
いくつかの態様において、ある方法は、cDNAを形成するために、1つまたは複数のプライマー(RTプライマー)を使用して、標的RNAポリヌクレオチドを逆転写する工程を含む。いくつかの態様において、RTプライマーは、オリゴdTプライマーまたは配列特異的プライマーを含む。いくつかの態様において、複数のRTプライマーは、1つまたは複数のオリゴdTプライマーまたは1つもしくは複数の配列特異的プライマーを含む。いくつかの態様において、逆転写反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する最初の工程である。いくつかの態様において、標的ポリヌクレオチドはRT-PCRに付されない。いくつかの態様において、標的ポリヌクレオチドは指数関数的増幅に付されない。いくつかの態様では、逆転写後の次の工程において、指数関数的増幅は行われない。いくつかの態様では、逆転写後の次の2工程において、指数関数的増幅は行われない。いくつかの態様では、逆転写後の次の3工程において、指数関数的増幅は行われない。いくつかの態様において、逆転写工程から生産される標的ポリヌクレオチドのcDNAは、この工程中にさらに増幅されることがない。いくつかの態様において、本方法は、1サイクルだけの逆転写を含む。別の態様において、本方法は、標的RNA分子を繰り返し逆転写して、複数のcDNA分子、例えばUIDを含有していてもよい第1の相補配列を生産する工程を含む。
RTプライマーはさらに、RNAの領域とは相補的でない領域を含むことができる。いくつかの態様において、RTプライマーはさらにUIDを含みうる。例えば、複数のRTプライマーの各RTプライマーは異なるUIDを含むことができる。これにより、逆転写されるRNA分子からコピーされたcDNAのそれぞれに、ユニークにバーコードを付加することを可能にすることができる。いくつかの態様において、標的RNAの領域に相補的でないRTプライマーの領域は、UIDを含みうる。いくつかの態様において、標的RNAの領域に相補的でない、複数のRTプライマーの各RTプライマーの領域は、UIDを含みうる。いくつかの態様において、RTプライマーはさらに、既知の配列、例えばユニバーサルプライマー結合部位、またはユニバーサルプライミング部位に相補的な配列を含むことができる。いくつかの態様において、RTプライマーはさらにリン酸化された5'端を含むことができる。いくつかの態様において、RTプライマーはさらに、既知の配列、例えばユニバーサルプライマー結合部位、またはユニバーサルプライミング部位に相補的な配列を、5'端に含むことができる。いくつかの態様において、RNAの領域に相補的でない領域は、RNAに相補的であるプライマーの領域に対して5'側にある。いくつかの態様において、RNAの領域に相補的でない領域は5'オーバーハング領域である。いくつかの態様において、標的RNAの領域に相補的でない領域は、増幅反応および/またはシーケンシング反応のためのプライミング部位を含む。
いくつかの態様において、RTプライマーはユニバーサルライゲーション配列を含むことができる。いくつかの態様において、ユニバーサルライゲーション配列はUIDの5'側にある。いくつかの態様において、ユニバーサルライゲーション配列は標的特異的領域に対して5'側にある。いくつかの態様において、ユニバーサルライゲーション配列はUIDの5'側かつ標的特異的領域の5'側にある。いくつかの態様において、ユニバーサルライゲーション配列はRTプライマーの5'端にある。いくつかの態様において、複数のRTプライマーは、第1のユニバーサルライゲーション配列を持つ第1のRTプライマーと、少なくとも第2のユニバーサルプライマー配列を含む1つまたは複数の第2のRTプライマーとを含むことができる。
相補的UIDタグ付きポリヌクレオチドを形成するための、一本鎖または二本鎖DNAの標的ポリヌクレオチドのプライマー伸長
本明細書に記載するプライマーを使用して、DNAポリヌクレオチドをプライマーにハイブリダイズさせ、当技術分野において公知の適切な試薬を使用してプライマー伸長(gPEまたはPE)を行うことができる。いくつかの態様において、プライマー伸長は、プライマーの1回の伸長を含む。いくつかの態様において、プライマー伸長はプライマーの複数回の伸長を含まない。いくつかの態様において、プライマー伸長は、プライマーの1回だけの伸長を含まない。いくつかの態様において、プライマー伸長は、プライマーの複数回の伸長を含む。いくつかの態様において、ある方法は、1つまたは複数のプライマー(PEプライマー)を使用して、標的ポリヌクレオチド相補配列、例えば第1の相補配列を形成するために、標的DNAポリヌクレオチド上でプライマー伸長を行う工程を含む。いくつかの態様において、PEプライマーは配列特異的プライマーを含む。いくつかの態様において、複数のPEプライマーは1つまたは複数の配列特異的プライマーを含む。いくつかの態様において、プライマー伸長反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する最初の工程である。いくつかの態様において、標的ポリヌクレオチドはPCRに付されない。いくつかの態様において、標的ポリヌクレオチドは指数関数的増幅に付されない。いくつかの態様において、指数関数的増幅は、プライマー伸長後の次の工程において行われない。いくつかの態様において、指数関数的増幅はプライマー伸長後の次の2工程において行われない。いくつかの態様において、指数関数的増幅はプライマー伸長後の次の3工程において行われない。いくつかの態様において、プライマー伸長工程で生産される標的ポリヌクレオチドの相補的ポリヌクレオチドは、この工程中にさらに増幅されることがない。いくつかの態様において、本方法は、1サイクルだけのプライマー伸長を含む。別の態様において、本方法は、標的DNA分子にハイブリダイズしたプライマーの繰り返しの伸長または線形増幅によって、複数コピーのDNA分子、例えばUIDを含有していてもよい標的ポリヌクレオチド相補配列を生産する工程を含む。
1つまたは複数のPEプライマーは、標的DNAの領域または配列に相補的な領域、例えばバイオマーカーなどの標的ポリヌクレオチドにハイブリダイズする標的特異的領域を含むことができる。1つまたは複数のPEプライマーは、標的DNAの領域に相補的または実質上相補的な領域を含むことができる。いくつかの態様において、1つまたは複数のPEプライマーは、第1の標的ポリヌクレオチドの配列の相補的な配列を持つ第1のPEプライマーと、第2の標的ポリヌクレオチドの配列に相補的な領域を持つ第2のPEプライマーとを含むことができる。例えば第1の標的ポリヌクレオチドは第1のDNA分子であることができ、第2の標的ポリヌクレオチドは第2のDNA分子であることができる。いくつかの態様において、1つまたは複数のPEプライマーは、第1のDNAの配列に相補的な領域を持つ第1のPEプライマーと、それぞれが1つまたは複数の第2のDNAの配列に相補的な領域を持つ1つまたは複数の第2のPEプライマーとを含むことができる。いくつかの態様において、第1の標的配列と第2の標的配列は同じである。いくつかの態様において、第1の標的配列と第2の標的配列は異なる標的配列である。
PEプライマーはさらに、DNAの領域に相補的でない領域を含むことができる。PEプライマーはさらにUIDを含むことができる。例えば、複数のPEプライマーの各PEプライマーは異なるUIDを含むことができる。これにより、プライマー伸長反応に付されるDNA分子からコピーされる相補的DNAのそれぞれにユニークにバーコードを付加することを可能にすることができる。いくつかの態様において、標的DNAの領域に相補的でないPEプライマーの領域はUIDを含みうる。いくつかの態様において、標的DNAの領域に相補的でない、複数のPEプライマーの各PEプライマーの領域は、UIDを含みうる。いくつかの態様において、PEプライマーはさらに、既知の配列、例えばユニバーサルプライマー結合部位、またはユニバーサルプライミング部位に相補的な配列を含むことができる。いくつかの態様において、PEプライマーはさらに、リン酸化された5'端を含むことができる。いくつかの態様において、PEプライマーはさらに、既知の配列、例えばユニバーサルプライマー結合部位、またはユニバーサルプライミング部位に相補的な配列を、5'端に含むことができる。いくつかの態様において、DNAの領域に相補的でない領域は、DNAに相補的であるプライマーの領域に対して5'側にある。いくつかの態様において、DNAの領域に相補的でない領域は5'オーバーハング領域である。いくつかの態様において、標的DNAの領域に相補的でない領域は、増幅反応および/またはシーケンシング反応のためのプライミング部位を含む。
いくつかの態様では、プライマー伸長工程中にPEプライマーのライブラリーを使用することができる。
いくつかの態様において、PEプライマーはユニバーサルライゲーション配列を含むことができる。いくつかの態様において、ユニバーサルライゲーション配列はUIDの5'側にある。いくつかの態様において、ユニバーサルライゲーション配列は、標的特異的領域に対して5'側にある。いくつかの態様において、ユニバーサルライゲーション配列は、UIDの5'側かつ標的特異的領域の5'側にある。いくつかの態様において、ユニバーサルライゲーション配列はPEプライマーの5'端にある。いくつかの態様において、複数のPEプライマーは、第1のユニバーサルライゲーション配列を持つ第1のPEプライマーと、少なくとも第2のユニバーサルプライマー配列を含む1つまたは複数の第2のPEプライマーとを含むことができる。
いくつかの態様では、低い方のプライマー融解温度に適応するために、55℃のアニーリング温度を使用する。いくつかの態様では、初回PE工程において68℃における保持工程を使用する。いくつかの態様では、プライマーの総濃度をある濃度に固定する。いくつかの態様では、プライマー伸長工程中に、塩化マグネシウム、硫酸アンモニウム、D-(+)-トレハロース、ベタイン、またはそれらの組合せを使用する。
標的に相補的なUIDタグ付きポリヌクレオチドの部分的フォーマット
第1の相補配列などの標的ポリヌクレオチド相補配列を作製した後、ポリヌクレオチドアダプター配列を第1の相補配列に付加することができる。アダプター配列が付加されていて、UIDを含有していてもよい、第1の相補配列などの標的ポリヌクレオチド相補配列は、修飾相補配列(MCS)であることができる。いくつかの態様において、ポリヌクレオチドアダプター配列は、標的ポリヌクレオチド相補配列の作製に続く次の工程において、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に付加することができる。いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有する標的ポリヌクレオチド相補配列の作製に続く第2の工程において、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に付加することができる。いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有する標的ポリヌクレオチド相補配列の作製に続く第3の工程において、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に付加することができる。いくつかの態様において、ポリヌクレオチドアダプター配列はUIDを含有しない。
いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、ライゲーションによって付加することができる(米国特許第4,883,750号、同第5,476,930号、同第5,593,826号、同第5,426,180号、同第5,871,921号、および米国特許出願公開第2004/0110213号)。ライゲーション技法には、平滑末端ライゲーションおよび粘着末端ライゲーションを含めることができる。ライゲーション反応は、DNAリガーゼI、DNAリガーゼIII、DNAリガーゼIV、およびT4 DNAリガーゼなどのDNAリガーゼを含みうる。ライゲーション反応は、T4 RNAリガーゼIやT4 RNAリガーゼIIなどのRNAリガーゼを含みうる。方法には、平滑末端および粘着末端を持つ二重鎖DNAまたはRNAにおいて、隣り合って並んだ5'リン酸末端と3'ヒドロキシル末端との間で、ホスホジエステル結合の形成を触媒する、T4 DNAリガーゼ;相補的標的DNAにハイブリダイズした2つの隣接するオリゴヌクレオチドの隣り合って並んだ5'リン酸末端と3'ヒドロキシル末端との間で、ホスホジエステル結合の形成を触媒する、Taq DNAリガーゼ;突出末端を含有する二重鎖DNAにおいて、隣り合って並んだ5'リン酸末端と3'ヒドロキシル末端との間で、ホスホジエステル結合の形成を触媒する、大腸菌(E. coli)DNAリガーゼ;および3'→5'ホスホジエステル結合の形成によって3'ヒドロキシル末端核酸アクセプターへの5'ホスホリル末端核酸ドナーのライゲーションを触媒する、T4 RNAリガーゼの使用が含まれ、基質には、一本鎖RNAおよび一本鎖DNAならびにジヌクレオシドピロホスフェートが含まれる。
いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、ライゲーションによって付加されない。いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、増幅反応によって付加することができる。いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、アダプター配列を含有する1つまたは複数のプライマーを使用する増幅反応によって付加することができる。いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、増幅反応によって付加されない。いくつかの態様において、ポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、アダプター配列を含有する1つまたは複数のプライマーを使用する増幅反応によって付加されない。いくつかの態様において、ポリヌクレオチドアダプター配列は、後述のPCR富化工程中に、UIDを含有していてもよい第2の相補配列などの標的ポリヌクレオチド相補配列に付加することができる。
いくつかの態様において、ポリヌクレオチドアダプター配列は、標的ポリヌクレオチド相補配列の作製に続く次の工程において、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に、ライゲーションによって付加することができる。いくつかの態様において、アダプターは一本鎖ポリヌクレオチドであることができる。いくつかの態様において、アダプターは二本鎖ポリヌクレオチドであることができる。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域、例えばオーバーハング領域とを含有する、ブリッジポリヌクレオチドであることができる。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域とを含有するブリッジポリヌクレオチドであることができ、一本鎖領域を含有する鎖は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に連結されない。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域とを含有するブリッジポリヌクレオチドであることができ、一本鎖領域を含有しない鎖が、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に連結される。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域とを含有するブリッジポリヌクレオチドであることができ、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に相補的な領域を含有しない鎖が、標的ポリヌクレオチド相補配列に連結される。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域とを含有するブリッジポリヌクレオチドであることができ、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に相補的な領域を含有する鎖は、標的ポリヌクレオチド相補配列に連結されない。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域とを含有するブリッジポリヌクレオチドであることができ、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に相補的な領域を含有する鎖が、標的ポリヌクレオチド相補配列にハイブリダイズする。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域とを含有するブリッジポリヌクレオチドであることができ、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に相補的な領域を含有しない鎖は、標的ポリヌクレオチド相補配列にハイブリダイズしない。
いくつかの態様において、5'オーバーハング領域は、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものに相補的であることができる。いくつかの態様において、5'オーバーハング領域は、1つまたは複数のポリヌクレオチド相補配列、例えばUIDを含有するものの5'領域に相補的であることができる。いくつかの態様において、5'オーバーハング領域は、ユニバーサルライゲーション配列、例えばRTプライマーまたはPEプライマーのユニバーサルライゲーション配列に相補的な配列を含むことができる。いくつかの態様において、5'オーバーハング領域は、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものの5'領域に相補的であることができ、その5'領域はUIDに対して5'側にある。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域、例えば5'オーバーハング領域または5'オーバーハング端とを含有するブリッジポリヌクレオチドであることができる。いくつかの態様において、アダプターは、二本鎖領域と一本鎖領域、例えば3'オーバーハング領域または3'オーバーハング端とを含有するブリッジポリヌクレオチドであることができる。いくつかの態様において、アダプターは、二本鎖領域と、2つの一本鎖領域、例えば3'オーバーハング領域または3'オーバーハング端および5'オーバーハング領域または5'オーバーハング端とを含有するブリッジポリヌクレオチドであることができる。いくつかの態様において、5'オーバーハング領域は、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものの5'領域に相補的であることができ、このアダプターは、ハイブリダイズすると、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものに連結することができる。いくつかの態様において、5'オーバーハング領域は、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものの5'領域に相補的であることができ、このアダプターは、ハイブリダイズすると、UIDを含有する1つまたは複数の標的ポリヌクレオチド相補配列の5'端に近接または隣接することができる。いくつかの態様において、5'オーバーハング領域は、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものの5'領域に相補的であることができ、このアダプターは、ハイブリダイズすると、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものの5'リン酸端に近接または隣接することができる。いくつかの態様において、5'オーバーハング領域は、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有するものの上で、それが相補的である配列と、同じ長さであるか、実質的に同じ長さであることができる。
いくつかの態様において、プライマー結合部位またはプライマー結合部位の相補鎖を含むポリヌクレオチドアダプター配列は、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列に付加することができる。いくつかの態様において、例えば指数関数的増幅またはシーケンシングなどのために、プライマー結合セットの第1のプライマー結合部位を含有する、UIDを含有していてもよい第1の相補配列などの標的ポリヌクレオチド相補配列は、部分的にフォーマットされた標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列であることができる。いくつかの態様において、例えば指数関数的増幅またはシーケンシングなどのために、第1のプライマーセットの第1のプライマー結合部位と第2のプライマー結合セットの第1のプライマー結合部位とを含有する、標的ポリヌクレオチド相補配列、例えば第1の相補配列は、完全にフォーマットされた標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列であることができる。いくつかの態様において、プライマー結合部位またはその相補鎖は、UIDを含有していてもよい第1の相補配列などの複数の標的ポリヌクレオチド相補配列のそれぞれに付加される。いくつかの態様において、UIDを含有していてもよい第1の相補配列などの複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖は、同じ配列である。いくつかの態様において、UIDを含有していてもよい第1の相補配列などの複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖は、異なる配列である。いくつかの態様において、第1のアンプリコンまたはアンプリコンセットにおける複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖は、第2のアンプリコンまたはアンプリコンセットにおける複数の標的ポリヌクレオチド相補配列のそれぞれにおいて付加されるプライマー結合部位またはその相補鎖と、同じ配列である。本明細書において使用する場合、アンプリコンは、増幅反応のポリヌクレオチド産物を含む。アンプリコンセットは、増幅反応から生産されたポリヌクレオチドのクローン集団を含む。いくつかの態様において、アンプリコンセットは、単一の出発配列の増幅によって形成される。いくつかの態様において、アンプリコンセットは、増幅反応において単一のポリヌクレオチドに由来するポリヌクレオチドの集団を含む。いくつかの態様において、アンプリコンセットは、増幅反応において、単一のポリヌクレオチドまたはこのポリヌクレオチドのアンプリコンに由来するポリヌクレオチドの集団を含む。アンプリコンはさまざまな増幅反応によって生産されうる。アンプリコンは、1つまたは複数の核酸のコピーを含むことができる。いくつかの態様において、アンプリコンまたはアンプリコンセットはPCRによって生産される。いくつかの態様において、アンプリコンまたはアンプリコンセットはPCRによって生産されない。
いくつかの態様において、第1のアンプリコンまたはアンプリコンセットにおける複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖は、第2のアンプリコンまたはアンプリコンセットにおける複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖とは異なる配列である。いくつかの態様において、第1の試料由来の複数のUID含有ポリヌクレオチドのそれぞれに付加されるプライマー結合部位またはその相補鎖は、第2の試料由来の複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖とは異なる配列である。いくつかの態様において、第1の試料由来の複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖は、第2の試料由来の複数の標的ポリヌクレオチド相補配列のそれぞれに付加されるプライマー結合部位またはその相補鎖と同じ配列である。いくつかの態様において、プライマー結合部位またはその相補鎖は既知の配列を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、増幅のためのプライマー結合部位を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、ユニバーサルプライミング配列を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、プライマーセットの第1のプライマーのための第1のプライマー結合を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、例えば後述のPCR富化工程において使用するために、PCRなどの指数関数的増幅反応を行うための第1のプライマー結合を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、非指数関数的増幅反応を行うための第1のプライマー結合を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、シーケンシングのためのプライマー結合部位を含む。いくつかの態様において、プライマー結合部位またはその相補鎖は、解析のためのプライマー結合部位を含む。
いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、試料バーコード配列(SBC)を含む。記載する方法では、一般アダプター配列への試料バーコード付加により、使用する各UID用の多数のプローブセットの必要を排除することができる。本明細書において使用する場合、ポリヌクレオチド上の試料バーコード(SBC)は、ポリヌクレオチドの由来源を同定するために使用することができる配列を含む。例えば核酸試料は、複数の異なる試料に由来するポリヌクレオチド(例えば異なる個体、異なる組織または細胞に由来するポリヌクレオチド、または異なる時点で単離されたポリヌクレオチド)のプールであってよく、複数の異なる試料のそれぞれ由来のポリヌクレオチドは、ユニークなSBCでタグ付けされる。こうして、SBCは、ポリヌクレオチドとその供給源との間の相関関係を与える(米国特許第7,537,897号、同第7,544,473号、および同第7,393,665号)。いくつかの態様では、異なる実験で処理される異なる試料をタグ付けするために、同じSBCを使用しうる。いくつかの態様では、ある実験で処理される異なる試料のそれぞれまたは試料のサブセットをタグ付けするために、異なるSBCを使用しうる。例えば、ある疾患またはある状態を持つ1つまたは複数の対象由来の試料は第1のSBCを有し、ある疾患またはある状態を持たない1つまたは複数の対象由来の試料は第2の異なるSBCを有することができる。例えば、同じ試料に由来する異なる試料に異なるSBCでタグ付けすることができる。
いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、アダプターのプライマー結合部位配列またはその相補鎖と、1つまたは複数の標的ポリヌクレオチド相補配列の配列に相補的な5'オーバーハング領域などのアダプターの領域との間にあるSBCまたはその相補鎖を含む。いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、アダプターの二重鎖領域内にあるSBCを含む。いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、アダプターの二重鎖領域内にないSBCを含む。いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、アダプターの一本鎖領域内にあるSBCを含む。いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、1つまたは複数の標的ポリヌクレオチド相補配列に対して相補性を有する領域、例えば5'オーバーハング領域を含有する鎖とは異なる鎖上にあるSBCを含む。いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、1つまたは複数の標的ポリヌクレオチド相補配列、例えば第1の相補配列に対して相補性を有する領域、例えば5'オーバーハング領域を含有する鎖と同じ鎖上にあるSBCを含む。いくつかの態様において、ポリヌクレオチドアダプター配列はさらに、1つまたは複数の標的ポリヌクレオチド相補配列、例えば第1の相補配列に対して相補性を有する領域、例えば5'オーバーハング領域を含有しない鎖上にあるSBCを含む。いくつかの態様において、複数の標的ポリヌクレオチド相補配列、例えば第1の相補配列に付加されるプライマー結合部位またはその相補鎖は、アダプターのSBC配列に対して5'側にある。いくつかの態様において、複数の標的ポリヌクレオチド相補配列、例えば第1の相補配列に付加されるプライマー結合部位またはその相補鎖は、アダプターのSBC配列に対して3'側にある。
ある方法はさらに、1つまたは複数の反応のいずれかを行う前に、第1の試料と第2の試料とを混和する工程を含みうる。いくつかの態様において、ある方法はさらに、第1の試料と第2の試料から作製されたポリヌクレオチドを混和する工程を含む。いくつかの態様において、ある方法はさらに、プライマー伸長反応を行った後に、第1の試料と第2の試料から作製されたポリヌクレオチドを混和する工程を含む。いくつかの態様において、ある方法はさらに、第1の試料または第2の試料中のポリヌクレオチドにアダプターを付着させた後に、第1の試料と第2の試料から作製されたポリヌクレオチドを混和する工程を含む。いくつかの態様において、ある方法はさらに、第1の試料または第2の試料中のポリヌクレオチドに、SBCを含むアダプターを付着させた後に、第1の試料と第2の試料から作製されたポリヌクレオチドを混和する工程を含む。いくつかの態様において、ある方法はさらに、第1の試料と第2の試料から作製された標的ポリヌクレオチド相補配列を混和する工程を含む。いくつかの態様において、ある方法はさらに、1つまたは複数のプライマー結合部位、例えば1つまたは複数のユニバーサルプライマー結合部位を含む第1の試料と第2の試料から作製されたポリヌクレオチドを混和する工程を含む。いくつかの態様において、ある方法はさらに、第1の試料および/または第2の試料中のポリヌクレオチドの指数関数的増幅を行った後に、第1の試料と第2の試料から作製されたポリヌクレオチドを混和する工程を含む。いくつかの態様において、第1の試料および第2の試料から派生したポリヌクレオチドの試料起源は、SBCを使用して決定することができる。いくつかの態様において、第1の試料および第2の試料から派生したポリヌクレオチドの試料起源は、UIDを使用して決定することができる。第1の試料および第2の試料から派生したポリヌクレオチドの試料起源は、プライマー結合部位配列を使用して決定することができる。第1の試料および第2の試料から派生したポリヌクレオチドの試料起源は、標的特異的配列を使用して決定することができる。
任意のクリーンアップ
いくつかの態様において、ある方法はさらに、任意で、アダプタータグ付きポリヌクレオチド、例えばUIDを含有していてもよい修飾相補配列の1つまたは複数を、精製する工程を含む。いくつかの態様において、複数の標的ポリヌクレオチド相補配列、例えば第1の相補配列に付加されるアダプターは、アフィニティタグを含む。アフィニティタグは結合パートナーに結合させることができ、結合パートナーに結合しない分子(例えばアフィニティタグを持たない分子)は洗い流すか、またはアフィニティタグ付き分子を、アフィニティタグを持たない分子から単離することができる。いくつかの態様において、アフィニティタグは、第2の分子の特異的に結合する第1の分子であることができる。いくつかの態様において、アフィニティタグは既知のヌクレオチド配列であることができる。いくつかの態様において、アフィニティタグは、化学的部分であることができる。いくつかの態様において、アフィニティタグは、ビオチンまたはストレプトアビジンであることができる。いくつかの態様において、アフィニティタグは、抗体などのペプチドまたはタンパク質であることができる。したがってアダプターは、タンパク質-核酸複合体を含むことができる。当技術分野において公知の任意のアフィニティタグを使用することができる。いくつかの態様において、アフィニティタグは、アダプター修飾(例えば連結または増幅)された標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列を、1つまたは複数の他のポリヌクレオチドから精製するために使用することができる。アフィニティタグに結合する1つまたは複数の固定化ポリヌクレオチド、化学分子、またはタンパク質性分子を含有する支持体または表面を使用することができる。例えば、アダプター標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列を、アダプター修飾標的ポリヌクレオチド相補配列のビオチンをストレプトアビジン部分を含む表面または基材に結合させることによって、1つまたは複数の他のポリヌクレオチドから精製するために、アフィニティタグを使用することができる。本明細書において使用する場合、固定化は、1つまたは複数の共有結合または非共有結合による固形支持体への直接的または間接的付着を含む。いくつかの態様において、固定化は、ハイブリダイゼーションによる固形支持体への直接的または間接的付着を含む。いくつかの態様では、アダプター標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列を、関心対象ではない1つまたは複数のポリヌクレオチド配列、例えば非標的ポリヌクレオチドから精製するために、アフィニティタグを使用することができる。いくつかの態様では、アダプター標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列を、先行する反応または方法工程において使用された1つまたは複数のプライマーから精製するために、アフィニティタグを使用することができる。いくつかの態様では、アダプター標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列を、先行する反応または方法工程において使用された1つまたは複数のプライマーから、または関心対象ではない1つまたは複数のポリヌクレオチド配列、例えば非標的ポリヌクレオチドから精製するために、アフィニティタグを使用することができる。いくつかの態様において、アフィニティタグは、記載する方法では使用されない。例えばいくつかの態様において、アダプターはアフィニティタグを含まない。例えばいくつかの態様において、アフィニティタグは、標的分子がRNAである場合には、記載の方法において使用されない。
線形プライマー伸長/線形増幅
ある方法はさらに、プライマー伸長または線形プライマー伸長(線形増幅ともいう)の2回目の単一ラウンドを行う工程を含むことができる。いくつかの態様において、線形伸長/増幅に使用される1つまたは複数のプライマーは、逆転写工程またはプライマー伸長工程において使用した1つまたは複数のRTプライマーまたはPEプライマーから、1つまたは複数の独立した反応に分離される。このようにしてプライマー対を分離することにより、不要なプライマー相互作用を低減することができる。本明細書において使用する場合、線形増幅または線形プライマー伸長とは、産物コピー数の非指数関数的拡大のプロセスを指す。いくつかの態様では、線形増幅の各サイクル中に、テンプレート鎖だけが複製される。いくつかの態様では、線形増幅中に、プライマー伸長物そのものはコピーされない。2つのプライマーを使用する代わりに対でない単一プライマーを使用した場合、その結果は、PCRの場合のような両鎖の指数関数的増殖ではなく、伸長産物コピー数の線形的増殖である。
本明細書に記載するプライマーを使用して、上記の方法または方法工程の1つまたは複数から生産されるDNAポリヌクレオチドを、プライマー(LPEプライマー)にハイブリダイズさせることができ、線形プライマー伸長は、当技術分野において公知の適切な試薬を使用して行うことができる。例えば、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列をLPEプライマーにハイブリダイズさせることができ、線形プライマー伸長を行うことができる。例えば、アダプターが、例えばライゲーションまたは増幅などによって既に付加されている、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい第1の相補配列を、LPEプライマーにハイブリダイズさせることができ、線形プライマー伸長を行うことができる。いくつかの態様において、LPEはUIDを含む。いくつかの態様において、LPEはUIDを含み、RTプライマーまたはPEプライマーはUIDを含有しない。いくつかの態様において、LPEはUIDを含み、RTプライマーまたはPEプライマーはUIDを含む。いくつかの態様において、LPEおよびRTプライマーはUIDを含み、PEプライマーはUIDを含有しない。いくつかの態様において、LPEおよびPEプライマーはUIDを含み、RTプライマーはUIDを含有しない。
いくつかの態様において、線形プライマー伸長は、LPEプライマーの複数回の伸長を含む。いくつかの態様において、線形プライマー伸長は、複数のLPEプライマー中の各LPEプライマーの複数回の伸長を含む。いくつかの態様において、線形プライマー伸長は、複数のLPEプライマー中の各LPEプライマーの複数回の伸長を含み、複数のLPEプライマー中の各LPEプライマーは、異なるポリヌクレオチドを標的とする。いくつかの態様において、線形プライマー伸長は、複数のLPEプライマー中の各LPEプライマーの複数回の伸長を含み、複数のLPEプライマー中の各LPEプライマーは、同じポリヌクレオチドを標的とする。いくつかの態様において、第2のラウンドのプライマー伸長は、LPEプライマーの単回の伸長を含む。いくつかの態様において、線形プライマー伸長は、プライマーの複数回の伸長を含まない。いくつかの態様において、ある方法は、アダプターを含む、1つまたは複数の標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい修飾相補配列上で、線形プライマー伸長を行うことで、1つまたは複数のプライマー(LPEプライマー)を使用して相補的ポリヌクレオチド、例えばDNAを形成する工程を含む。いくつかの態様において、ある方法は、1つまたは複数の標的ポリヌクレオチド相補配列上で線形プライマー伸長を行う工程を含み、1つまたは複数の標的ポリヌクレオチド相補配列は、アダプターを含まない、例えばUIDを含有していてもよい第1の相補配列である。いくつかの態様において、LPEプライマーは配列特異的プライマーを含む。いくつかの態様において、複数のLPEプライマーは、1つまたは複数の配列特異的プライマーを含む。いくつかの態様において、線形プライマー伸長反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第1、第2、第3、または第4の工程である。いくつかの態様において、線形プライマー伸長反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第3の工程である。いくつかの態様において、線形プライマー伸長反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第4の工程である。いくつかの態様において、線形プライマー伸長反応はRT反応後またはPE反応後に行われる。いくつかの態様において、線形プライマー伸長反応は、標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい第1の相補配列にアダプターを付加する反応の後に行われる。いくつかの態様において、線形プライマー伸長反応は、RT反応後またはPE反応後、かつ標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい第1の相補配列にアダプターを付加する反応の後に行われる。いくつかの態様において、線形プライマー伸長反応は、PCRなどの指数関数的増幅反応を行う前に行われる。いくつかの態様において、指数関数的増幅は、線形プライマー伸長後の次の工程において行われる。いくつかの態様において、指数関数的増幅は、線形プライマー伸長後の次の工程では行われない。いくつかの態様において、指数関数的増幅は、線形プライマー伸長後の次の2工程では行われない。いくつかの態様において、指数関数的増幅は、線形プライマー伸長後の次の3工程では行われない。いくつかの態様において、線形プライマー伸長工程で生産される、標的ポリヌクレオチド相補配列の相補的ポリヌクレオチド、例えばUIDを含有していてもよい第2の相補配列は、この工程の後に、それ以上増幅されない。いくつかの態様において、本方法は、1サイクルだけの線形プライマー伸長を含む。別の態様において、本方法は、標的ポリヌクレオチド相補配列にハイブリダイズしたプライマーを繰り返し伸長して、標的ポリヌクレオチド相補配列、例えばUIDを含有していてもよい第2の相補配列の複数コピーを生産する工程を含む。本方法は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、または20回の線形プライマー伸長反応または線形プライマー伸長サイクルを実行する工程を含むことができる。いくつかの態様では、本明細書に記載する線形増幅/伸長を用いる方法において使用される試料投入量を、非線形増幅工程を使用する類似の方法よりも少なくすることができる。いくつかの態様において、本明細書に記載する線形増幅/伸長を使用して、用いられるPCRサイクル数を、非線形増幅工程を使用する類似の方法よりも少なくすることができる。例えば、線形増幅/伸長を使用する方法では20回のPCRサイクルで十分であり、一方、非線形増幅工程を使用する類似の方法では、24回のPCRサイクルが必要になりうる。
1つまたは複数のLPEプライマーは、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列の配列または相補配列に相補的な配列を含むことができる。例えば、1つまたは複数のLPEプライマーは、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列または初期試料中の標的ポリヌクレオチドの配列または相補配列に相補的な配列を含むことができる。例えば、1つまたは複数のLPEプライマーは、増幅反応、ライゲーション反応、プライマー伸長、またはそれらの組合せの産物である、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列の配列または相補配列に相補的な配列を含むことができる。
いくつかの態様において、1つまたは複数のLPEプライマーは、標的ポリヌクレオチドの相補配列に相補的な配列を含む。いくつかの態様において、1つまたは複数のLPEプライマーは、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列の配列に相補的な配列を含む。いくつかの態様において、1つまたは複数のLPEプライマーは、標的ポリヌクレオチドの相補配列に相補的な第1の配列と、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列の配列に相補的な第2の配列とを含む。いくつかの態様において、第1の配列と第2の配列は同じ配列である。いくつかの態様において、第1の配列と第2の配列は異なる配列である。いくつかの態様において、1つまたは複数のLPEプライマーの、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列に相補的な配列は、標的配列には相補的でない。いくつかの態様において、1つまたは複数のLPEプライマーの、UID含有ポリヌクレオチドに相補的な配列は、UIDを含有しないどのポリヌクレオチドにも相補的でない。いくつかの態様において、1つまたは複数のLPEプライマーの、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列に相補的な配列は、試料中の他のどのポリヌクレオチドにも相補的でない。
いくつかの態様において、標的ポリヌクレオチド相補配列は一本鎖ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチド相補配列は二本鎖ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチド相補配列、例えば第1の相補配列は、PE反応またはRT反応由来の伸長産物である。いくつかの態様において、標的ポリヌクレオチド相補配列はさらに、アダプター配列、例えば連結されたアダプター配列、または修飾相補配列を含む。いくつかの態様において、標的ポリヌクレオチド相補配列は、さらにアダプター配列を含む、PE反応またはRT反応由来の伸長産物、例えば修飾相補配列である。いくつかの態様において、標的ポリヌクレオチド相補配列は、PCR、シーケンシング、またはユニバーサルプライミング部位などの第1のプライマー部位をさらに含む、PE反応またはRT反応由来の伸長産物である。いくつかの態様において、標的ポリヌクレオチド相補配列、例えば第1の相補配列、第2の相補配列または修飾相補配列は、基材または表面に固定化される。いくつかの態様において、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列は、SBCを含む。
いくつかの態様において、1つまたは複数のLPEプライマーの、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列に相補的な配列は、どの標的ポリヌクレオチドの第1の鎖にも相補的な配列ではない。いくつかの態様において、1つまたは複数のLPEプライマーの、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列に相補的な配列は、RT反応またはPE反応中に作製される配列に相補的である。いくつかの態様において、1つまたは複数のLPEプライマーの、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列に相補的な配列は、RTプライマーまたはPEプライマーに相補的な標的ポリヌクレオチドの配列に対して5'側にある標的ポリヌクレオチドの配列にハイブリダイズすることができる標的ポリヌクレオチドの相補配列に相補的である。いくつかの態様において、1つまたは複数のLPEプライマーの、標的ポリヌクレオチド相補配列に相補的な配列は、RTプライマーまたはPEプライマーに相補的な標的ポリヌクレオチドの配列に対して3'側にある標的の配列にハイブリダイズする標的ポリヌクレオチドの相補配列に相補的である。いくつかの態様において、本明細書に記載する方法のいずれかによる解析のためのバリアントまたは領域を含有する標的ポリヌクレオチドの配列は、1つまたは複数のRTプライマーまたはPEプライマーに相補的な標的ポリヌクレオチドの配列と、1つまたは複数のLPEプライマーに相補的である相補鎖を持つ標的ポリヌクレオチドの配列との間にあることができる。
いくつかの態様において、1つまたは複数のLPEプライマーの、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列に相補的な配列は、1つまたは複数のPEプライマーまたはRTプライマーの配列に相補的な配列ではない。いくつかの態様において、1つまたは複数のLPEプライマーの、標的ポリヌクレオチド相補配列、第1の相補配列または修飾相補配列に相補的な配列は、1つまたは複数のPEプライマーまたはRTプライマーの標的特異的配列に相補的な配列ではない。
いくつかの態様において、1つまたは複数のLPEプライマーは、第1のテンプレートポリヌクレオチドの配列に相補的な領域を持つ第1のLPEプライマーと、第2のテンプレートポリヌクレオチドの配列に相補的な領域を持つ第2のLPEプライマーとを含む。例えば、第1のテンプレートポリヌクレオチドは第1のDNA分子であることができ、第2の第1のテンプレートポリヌクレオチドは第2のDNA分子であることができる。例えば、第1のテンプレートポリヌクレオチドは試料中の第1の標的ポリヌクレオチドに由来する第1のDNA分子であることができ、第2の第1のテンプレートポリヌクレオチドは試料中の第2の標的ポリヌクレオチドに由来する第2のDNA分子であることができる。いくつかの態様において、1つまたは複数のLPEプライマーは、第1のDNAの配列に相補的な領域を持つ第1のLPEプライマーと、それぞれが1つまたは複数の第2のDNAの配列に相補的な領域を持つ1つまたは複数の第2のLPEプライマーとを含む。いくつかの態様において、第1のDNAと第2のDNAの配列は同じである。いくつかの態様において、第1のDNAと第2のDNAの配列は異なる。いくつかの態様において、第1のテンプレート配列と第2のテンプレート配列は同じである。いくつかの態様において、第1のテンプレート配列と第2のテンプレート配列は異なる。いくつかの態様において、第1の標的配列と第2の標的配列は同じである。いくつかの態様において、第1の標的配列と第2の標的配列は異なる。
LPEプライマーはさらに、テンプレートの領域に相補的でない領域を含むことができる。いくつかの態様において、LPEプライマーはさらに、既知の配列、例えばユニバーサルプライマー結合部位、またはユニバーサルプライミング部位に相補的な配列を含むことができる。いくつかの態様において、LPEプライマーはさらに、既知の配列、例えばユニバーサルプライマー結合部位、またはユニバーサルプライミング部位に相補的な配列を5'端に含むことができる。いくつかの態様において、テンプレートの領域に相補的でない領域は、テンプレートに相補的であるプライマーの領域に対して5'側にある。いくつかの態様において、テンプレートの領域に相補的でない領域は、5'オーバーハング領域または3'オーバーハング領域である。いくつかの態様において、テンプレートの領域に相補的でない領域は、増幅反応および/またはシーケンシング反応のためのプライミング部位を含む。いくつかの態様において、テンプレートの領域に相補的でない領域は、PCR反応またはPCR富化工程などの増幅反応および/またはシーケンシング反応のためのプライマーセットの第2のプライマーのためのプライミング部位を含む。任意で、テンプレートの領域に相補的でない領域は、ハイスループットシーケンシングプラットフォームにおいてクラスター化するためのユニバーサル配列を含む。いくつかの態様において、テンプレートの領域に相補的でない領域は、増幅反応および/またはシーケンシング反応のためのプライマーセットの第2のプライマー用のプライミング部位を含み、プライマーセットの第1のプライマー用のプライミング部位は、LPEテンプレート内に含まれる。いくつかの態様において、LPEテンプレート内に含まれるプライマーセットの第1のプライマー用のプライミング部位は、先のRT、PE、LPE、またはアダプター付加(例えばライゲーション)反応において付加される。いくつかの態様において、LPE反応はDNAポリメラーゼを使用して行われる。
いくつかの態様において、LPEプライマーはさらに、第2のUIDを含むことができる。例えば、複数のLPEプライマーの各LPEプライマーは、異なる第2のUIDを含むことができる。これにより、線形プライマー伸長反応に付されるDNA分子からコピーされるDNAのそれぞれに第2のUIDでバーコード付加することを可能することができる。いくつかの態様において、第2のUIDは、線形プライマー伸長反応に付されるDNA分子上のUIDと同じである。いくつかの態様において、第2のUIDは、線形プライマー伸長反応に付されるDNA分子上のUIDとは異なる。いくつかの態様において、テンプレートの領域に相補的でないLPEプライマーの領域は、第2のUIDを含む。いくつかの態様において、標的DNAの領域に相補的でない複数のLPEプライマーの各LPEプライマーの領域は第2のUIDを含む。
いくつかの態様では、線形伸長/増幅工程に遅いランピング速度が使用される。いくつかの態様では、線形伸長/増幅プライマーが固定された総濃度で使用される。いくつかの態様では、線形増幅/伸長工程中に、塩化マグネシウム、硫酸アンモニウム、D-(+)-トレハロース、ベタイン、またはそれらの組合せが使用される。
PCR富化
ある方法はさらに、指数関数的増幅反応を行う工程を含むことができる。いくつかの態様において、ある方法はさらに、PCRを行う工程を含むことができる。例えば指数関数的増幅反応には、複数のフォワード/リバースプライマーおよびリバースプライマーを用いることができる。いくつかの態様において、指数関数的増幅反応は、2つまたはそれ以上の指数関数的増幅を含むことができる。いくつかの態様において、第1のPCR反応および/または第2のPCR反応には、複数のフォワード/リバースプライマーおよび複数のリバースプライマーを用いることができる。複数のフォワード/リバースプライマーの第1のプライマーおよび/または第2のプライマーは、DNA分子またはcDNA分子などのテンプレートポリヌクレオチドに相補的な領域を含有するフォワード/リバースプライマーであることができる。いくつかの態様において、複数のフォワード/リバースプライマーは、1つまたは複数のフォワード/リバースプライマーを含み、それら複数のフォワード/リバースプライマー中のフォワード/リバースプライマーのそれぞれは、ユニバーサルプライマー結合部位などの1つまたは複数の上流または下流プライマー結合部位に相補的な領域を含む。
いくつかの態様において、指数関数的増幅反応は、プライマー伸長または逆転写反応の前には行われない。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列を作製する前には行われず、その作製後に行われる。
いくつかの態様において、指数関数的増幅反応は、テンプレートポリヌクレオチドにアダプターを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、テンプレートポリヌクレオチドにライゲーションによってアダプターを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列にアダプターを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列にライゲーションによってアダプターを付着させる前には行われず、その後に行われる。
いくつかの態様において、指数関数的増幅反応は、指数関数的増幅のためにテンプレート配列またはその相補鎖に第1のプライミング部位を付着させる前には行われず、その後に行われる。例えば、指数関数的増幅反応は、テンプレート配列またはその相補鎖に、プライマーセットの第1のプライマーのためのプライミング部位を付着させる前には行わず、その後に行うことができる。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列に、第1のプライマイング部位を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列を含むポリヌクレオチドに、ライゲーションによって第1のプライミング部位を付着させる前には行われず、その後に行われる。
いくつかの態様において、指数関数的増幅反応は、テンプレート配列またはその相補鎖にSBCを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列にSBCを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、テンプレート配列またはその相補鎖に増幅によってSBCを導入しながら行われる。いくつかの態様において、指数関数的増幅反応は、第2の相補配列などの標的ポリヌクレオチド相補配列に増幅によってSBCを導入しながら行われる。
いくつかの態様において、指数関数的増幅反応は、テンプレート配列またはその相補鎖にユニバーサルプライミング配列を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチド相補配列にユニバーサルプライミング配列を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、テンプレート配列またはその相補鎖に、ライゲーションによってユニバーサルプライミング配列を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチド相補配列に、ライゲーションによってユニバーサルプライミング配列を付着させる前には行われず、その後に行われる。
いくつかの態様において、指数関数的増幅は、線形増幅反応の前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、線形増幅テンプレート配列にアダプターを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、線形増幅テンプレート配列にライゲーションによってアダプターを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、線形増幅テンプレート配列に第1のプライミング部位を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、線形増幅テンプレート配列にSBCを付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、線形増幅テンプレート配列にユニバーサルプライミング配列を付着させる前には行われず、その後に行われる。
例えば、指数関数的増幅反応は、線形プライマー伸長反応の前には行われないであろう。例えば指数関数的増幅反応は、線形プライマー伸長反応の後に行われうる。いくつかの態様において、指数関数的増幅反応は、第2の相補配列などの標的ポリヌクレオチド相補配列の1つまたは複数のコピーを作製する前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、LPEプライマーを使用して第2の相補配列などの標的ポリヌクレオチド相補配列の1つまたは複数のコピーを作製する前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、複数のLPEプライマーを使用して第2の相補配列などの複数の標的ポリヌクレオチド相補配列の1つまたは複数のコピーを作製する前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、指数関数的増幅用の第1のプライミング部位および第2のプライミング部位を付着させる前には行われず、その後に行われる。例えば指数関数的増幅反応は、プライマーセットの第1のプライマー用の第1のプライミング部位およびプライマーセットの第2のプライマー用の第2のプライミング部位を付着させる前には行わず、その後に行うことができる。いくつかの態様において、指数関数的増幅反応は、第1のプライミング部位をライゲーションによって付着させ、指数関数的増幅用の第2のプライミング部位を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、指数関数的増幅のために線形プライマー伸長反応によって第1のプライミング部位および第2のプライミング部位を付着させる前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、指数関数的増幅用にライゲーションによって第1のプライミング部位またはその相補鎖を付着させ、線形プライマー伸長反応によって第2のプライミング部位を付着させる前には行われず、その後に行われる。例えば、第1のプライミング部位および第2のプライミング部位は、指数関数的増幅反応に使用される一対のプライマーのためのプライミング部位であることができる。例えば、第1のプライミング部位および第2のプライミング部位は、ユニバーサルプライミング部位であることができる。例えば、第1のプライミング部位および第2のプライミング部位はシーケンシング用のプライミング部位であることができる。
いくつかの態様において、指数関数的増幅反応は、表面または支持体にポリヌクレオチドを固定化する前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、表面または支持体に固定化されたポリヌクレオチドのコピー上で行われる。いくつかの態様において、指数関数的増幅反応は、線形プライマー伸長反応で作製された、表面または支持体に固定化されたポリヌクレオチドのコピー上で行われる。
いくつかの態様において、指数関数的増幅反応は、1つまたは複数の標的ポリヌクレオチド相補配列を表面または支持体に固定化する前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、1つまたは複数の固定化標的ポリヌクレオチド相補配列で線形プライマー反応を行う前には行われず、その後に行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合したポリヌクレオチドからコピーされたポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合された、UIDを含有していてもよい、第1の相補配列または修飾相補配列などの標的ポリヌクレオチド相補配列からコピーされた第2の相補配列などのポリヌクレオチド相補配列上で行われる。
いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたUID含有ポリヌクレオチドからコピーされたSBC含有ポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたUID含有ポリヌクレオチドからコピーされた、第1のプライマー結合部位、第2のプライマー結合部位、またはその両方を含有するポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたUID含有ポリヌクレオチドからコピーされた、第1のプライマー結合部位、第2のプライマー結合部位、第1のユニバーサルプライミング部位、第2のユニバーサルプライミング部位、またはそれらの任意の組合せを含有するポリヌクレオチド上で行われる。
いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたSBC含有ポリヌクレオチドからコピーされたSBC含有ポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたSBC含有ポリヌクレオチドからコピーされたUID含有ポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたSBC含有ポリヌクレオチドからコピーされた、第1のプライマー結合部位、第2のプライマー結合部位、またはその両方を含有するポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合されたSBC含有ポリヌクレオチドからコピーされた、第1のプライマー結合部位、第2のプライマー結合部位、第1のユニバーサルプライミング部位、第2のユニバーサルプライミング部位、またはそれらの任意の組合せを含有するポリヌクレオチド上で行われる。
いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合された第1のプライマー部位および/または第2のプライマー部位含有ポリヌクレオチドからコピーされたポリヌクレオチドを含有する第1のプライマー部位および/または第2のプライマー部位で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合された第1のプライマー部位および/または第2のプライマー部位含有ポリヌクレオチドからコピーされたSBC含有ポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合された第1のプライマー部位および/または第2のプライマー部位含有ポリヌクレオチドからコピーされたUID含有ポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合された第1のプライマー部位および/または第2のプライマー部位含有ポリヌクレオチドからコピーされた、第1のユニバーサルプライマー結合部位、第2のユニバーサルプライマー結合部位、またはその両方を含有するポリヌクレオチド上で行われる。いくつかの態様において、指数関数的増幅反応は、表面または固形支持体に結合された第1のプライマー部位および/または第2のプライマー部位含有ポリヌクレオチドからコピーされた、第1のプライマー結合部位、第2のプライマー結合部位、第1のユニバーサルプライミング部位、第2のユニバーサルプライミング部位、またはそれらの任意の組合せを含有するポリヌクレオチド上で行われる。
本明細書に記載するプライマーを使用して、上記の方法または方法工程の1つまたは複数から生産されるDNAポリヌクレオチドを、プライマーセット(例えばPCRプライマーセットまたは指数関数的増幅プライマーセット)にハイブリダイズさせ、当技術分野において公知の適切な試薬を使用して、指数関数的増幅を行うことができる。例えば、1つまたは複数の第2の相補配列を、プライマーセットの第1のプライマー(例えばリバースプライマー)にハイブリダイズさせてプライマー伸長を行い、次にプライマーセットの第2のプライマー(例えばフォワードプライマー)を伸長反応の産物にハイブリダイズさせてプライマー伸長を行うことができる。
いくつかの態様において、指数関数的増幅は複数のサイクルを含む。いくつかの態様では、複数のテンプレートポリヌクレオチドの指数関数的増幅反応に、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーが使用される。いくつかの態様において、指数関数的増幅プライマーの1つまたは複数は、標的特異的なプライマーではない。いくつかの態様において、指数関数的増幅プライマーセットの両プライマーは標的特異的なプライマーではない。いくつかの態様では、同じ反応槽における複数のテンプレートポリヌクレオチドの指数関数的増幅反応に、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーが使用される。いくつかの態様では、同じ反応における複数のテンプレートポリヌクレオチドの指数関数的増幅反応に、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーが使用される。いくつかの態様では、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーが、複数のテンプレートポリヌクレオチドの指数関数的増幅反応に同時に使用される。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、複数の標的ポリヌクレオチド相補配列、例えば異なる標的配列に由来する複数の第2の相補配列を指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、複数の標的ポリヌクレオチド相補配列、例えば異なる標的配列に由来する複数の第2の相補配列を指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、同じ標的配列またはその相補鎖を含む第2の相補配列などの複数の標的ポリヌクレオチド相補配列を指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、あるアンプリコンの複数の標的ポリヌクレオチド相補配列を指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、複数の標的ポリヌクレオチド相補配列、例えばあるアンプリコンセットの複数の第2の相補配列を指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、本明細書に記載する方法のいずれかを使用して作製される複数の標的ポリヌクレオチド相補配列のそれぞれを指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、アダプター配列を含有する複数の標的ポリヌクレオチド相補配列のそれぞれを指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、SBCを含有する複数の標的ポリヌクレオチド相補配列のそれぞれを指数関数的に増幅するために使用することができる。例えば、あるプライマーセットの同じ第1のプライマーおよび第2のプライマーは、第1のユニバーサルプライミング部位および第2のユニバーサルプライミング部位を含有する複数の標的ポリヌクレオチド相補配列のそれぞれを指数関数的に増幅するために使用することができる。
いくつかの態様において、あるプライマーセットの第1のプライマーおよび第2のプライマーは、UID、SBC、標的領域、それらの任意の相補鎖、またはそれらの任意の組合せを指数関数的に増幅するために使用することができる。例えば、第1のプライマー結合部位および第2のプライマー結合部位は、UID、SBC、標的領域、それらの任意の相補鎖、またはそれらの任意の組合せに対して、それぞれ5'側および3'側にハイブリダイズすることができる。
いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第2、第3、第4、または第5の工程である。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第2の工程ではない。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する方法において行われる最初の増幅反応ではない。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第3の工程である。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第4の工程である。いくつかの態様において、指数関数的増幅反応は、標的ポリヌクレオチドを含有する試料からポリヌクレオチドのライブラリーを作製する第5の工程である。いくつかの態様において、指数関数的増幅反応は、RT反応後またはPE反応後に行われる。いくつかの態様において、指数関数的増幅反応は、第1の相補配列などの標的ポリヌクレオチド相補配列にアダプターを付加する反応後に行われる。いくつかの態様において、指数関数的増幅反応は、RT反応後またはPE反応後かつ第1の相補配列などの標的ポリヌクレオチド相補配列にアダプターを付加する反応後に行われる。いくつかの態様において、指数関数的増幅反応は、PCRなどの第2の指数関数的増幅反応を行う前に行われる。いくつかの態様において、指数関数的増幅は、線形プライマー伸長後の次の工程において行われる。いくつかの態様において、指数関数的増幅は、線形プライマー伸長後の次の工程において行われない。いくつかの態様において、指数関数的増幅は、RT反応後またはPE反応後の次の工程において行われない。いくつかの態様において、指数関数的増幅は、RT反応後またはPE反応後の次の2工程において行われない。いくつかの態様において、指数関数的増幅は、RT反応後またはPE反応後の次の3工程において行われない。いくつかの態様において、指数関数的増幅工程から生産される、UIDを含有していてもよいポリヌクレオチド配列のライブラリーは、この工程後にそれ以上増幅されない。いくつかの態様において、本方法は、1サイクルだけの指数関数的増幅を含む。いくつかの態様において、本方法は、あるプライマーセットの両プライマーを繰り返し伸長して、UIDを含有していてもよいポリヌクレオチド配列の複数コピーを生産する工程を含む。
指数関数的増幅プライマーは、標的ポリヌクレオチド相補配列の配列または相補配列に相補的な配列を含むことができる。例えば、1つまたは複数の指数関数的増幅プライマーは、標的ポリヌクレオチド相補配列の配列もしくは相補配列または初期試料中の標的ポリヌクレオチドに相補的な配列を含むことができる。例えば、1つまたは複数の指数関数的増幅プライマーは、増幅反応、ライゲーション反応、プライマー伸長、線形プライマー伸長、またはそれらの組合せの産物である標的ポリヌクレオチド相補配列の配列または相補配列に相補的な配列を含むことができる。例えば、1つまたは複数の指数関数的増幅プライマーは、第1の配列、第2の配列、または修飾配列の配列または相補配列に相補的な配列を含むことができる。
いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、標的ポリヌクレオチドの配列または相補配列に相補的な配列を含まない。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、標的ポリヌクレオチド相補配列の配列または相補配列に相補的な配列を含まない。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、標的ポリヌクレオチドの配列または相補配列に相補的である配列を含まず、標的ポリヌクレオチド相補配列の配列または相補配列に相補的である配列を含まない。
いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、標的ポリヌクレオチドの配列または相補配列に相補的な配列を含む。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、UID含有ポリヌクレオチドの配列または相補配列に相補的な配列を含む。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、標的ポリヌクレオチドの配列または相補配列に相補的である配列を含み、UID含有ポリヌクレオチドの配列または相補配列に相補的である配列を含む。
いくつかの態様において、1つまたは複数の指数関数的増幅プライマーのUID含有ポリヌクレオチドに相補的な配列は、標的配列には相補的でない。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーのUID含有ポリヌクレオチドに相補的な配列は、UIDを含有しないどのポリヌクレオチドにも相補的でない。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーのUID含有ポリヌクレオチドに相補的な配列は、試料中の他のどのポリヌクレオチドにも相補的でない。
いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列は、一本鎖ポリヌクレオチドである。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列は二本鎖ポリヌクレオチドである。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列は、PE反応またはRT反応由来の伸長産物のコピーである。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列はさらに、アダプター配列、例えば連結されたアダプター配列を含む。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列は、さらにアダプター配列を含むPE反応またはRT反応由来の伸長産物の相補鎖である。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列は、PCR部位、シーケンシング部位、またはユニバーサルプライミング部位などの第1のプライマー結合部位および/または第2のプライマー結合部位をさらに含むPE反応またはRT反応由来の伸長産物の相補配列の相補鎖である。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列は、基材または表面上に固定化される。いくつかの態様において、指数関数的に増幅される標的ポリヌクレオチド相補配列はSBCを含む。
いくつかの態様において、1つまたは複数の指数関数的増幅プライマーの指数関数的に増幅される標的ポリヌクレオチド相補配列に相補的な配列は、標的ポリヌクレオチド中の配列ではない。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーの指数関数的に増幅される標的ポリヌクレオチド相補配列に相補的な配列は、RT反応中またはPE反応中に作製される配列の相補配列に相補的である。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーの指数関数的に増幅される標的ポリヌクレオチド相補配列に相補的な配列は、RTプライマーまたはPEプライマーに相補的な標的ポリヌクレオチドの配列に対して5'側にある標的の配列にハイブリダイズする標的ポリヌクレオチドの配列に相補的である。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーの指数関数的に増幅される標的ポリヌクレオチド相補配列に相補的な配列は、RTプライマーまたはPEプライマーに相補的な標的ポリヌクレオチドの配列に対して3'側にある標的の配列にハイブリダイズする標的ポリヌクレオチドの配列に相補的である。いくつかの態様において、本明細書に記載する方法のいずれかによる解析のためのバリアントまたは領域を含有する標的ポリヌクレオチドの配列は、1つまたは複数のRTプライマーまたはPEプライマーに相補的な標的ポリヌクレオチドの配列と、1つまたは複数の指数関数的増幅プライマーに相補的な標的ポリヌクレオチドの配列との間にあることができる。
いくつかの態様において、1つまたは複数の指数関数的増幅プライマーの指数関数的に増幅される標的ポリヌクレオチド相補配列に相補的な配列は、1つまたは複数のPEプライマーまたはRTプライマーの配列に相補的な配列ではない。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーの指数関数的に増幅される標的ポリヌクレオチド相補配列に相補的な配列は、1つまたは複数のPEプライマーまたはRTプライマーの標的特異的配列に相補的な配列ではない。
いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、第1のテンプレートポリヌクレオチドの配列に相補的な領域を持つ第1の指数関数的増幅プライマーと、第2のテンプレートポリヌクレオチドの配列に相補的な領域を持つ第2の指数関数的増幅プライマーとを含む。例えば、第1のテンプレートポリヌクレオチドは第1のDNA分子であることができ、第2の第1のテンプレートポリヌクレオチドは第2のDNA分子であることができる。例えば、第1のテンプレートポリヌクレオチドは、試料中の第1の標的ポリヌクレオチドに由来する第1のDNA分子であることができ、第2の第1のテンプレートポリヌクレオチドは、試料中の第2の標的ポリヌクレオチドに由来する第2のDNA分子であることができる。いくつかの態様において、1つまたは複数の指数関数的増幅プライマーは、第1のDNAの配列に相補的な領域を持つ第1の指数関数的増幅プライマーと、それぞれが1つまたは複数の第2のDNAの配列に相補的な領域を持つ1つまたは複数の第2の指数関数的増幅プライマーとを含む。いくつかの態様において、第1のDNAと第2のDNAの配列は同じである。いくつかの態様において、第1のDNAと第2のDNAの配列は異なる。いくつかの態様において、第1のテンプレート配列と第2のテンプレート配列は同じである。いくつかの態様において、第1のテンプレート配列と第2のテンプレート配列は異なる。いくつかの態様において、第1の標的配列と第2の標的配列は同じである。いくつかの態様において、第1の標的配列と第2の標的配列は異なる。
シーケンシング
本明細書に記載する方法または方法工程の1つまたは複数を行った後、作製されたポリヌクレオチドのライブラリーをシーケンシングすることができる。
シーケンシングは、当技術分野において公知の任意のシーケンシング法によって行うことができる。いくつかの態様において、シーケンシングはハイスループットで行うことができる。適切な次世代シーケンシング技術には、454 Life Sciencesプラットフォーム(Roche,コネチカット州ブランフォード)(Margulies et al., Nature, 437, 376-380(2005));IlluminaのGenome Analyzer、GoldenGateメチル化アッセイ法、またはInfiniumメチル化アッセイ法、すなわちInfiniumヒトメチル化27K BeadArrayまたはVeraCode GoldenGateメチル化アレイ(Illumina, カリフォルニア州サンディエゴ; Bibkova et al., Genome Res., 16, 383-393(2006);および米国特許第6,306,597号、同第7,598,035号、同第7,232,656号)、またはライゲーションによるDNAシーケンシング、SOLiDシステム(Applied Biosystems/Life Technologies;米国特許第6,797,470号、同第7,083,917号、同第7,166,434号、同第7,320,865号、同第7,332,285号、同第7,364,858号、および同第7,429,453号);またはHelicos True Single Molecule DNAシーケンシング技術(Harris et al., Science, 320, 106-109(2008);および米国特許第7,037,687号、同第7,645,596号、同第7,169,560号、および同第7,769,400号)、Pacific Biosciencesの1分子リアルタイム(SMRT(商標))技術、およびシーケンシング(Soni et al., Clin. Chem., 53, 1996-2001(2007))などがある。ある方法はさらに、ライブラリー中の1つまたは複数のポリヌクレオチドをシーケンシングする工程を含むことができる。ある方法はさらに、ライブラリー中の1つまたは複数のポリヌクレオチド配列、配列リード、アンプリコン配列、またはアンプリコンセット配列を互いにアラインメントする工程を含むことができる。
本明細書において使用する場合、アラインメントする工程は、配列リードなどの試験配列を1つまたは複数の他の試験配列、参照配列、またはそれらの組合せと比較することを含む。いくつかの態様において、アラインメントする工程は、複数の配列またはアラインメントされた配列からコンセンサス配列を決定するために使用することができる。いくつかの態様において、アラインメントする工程は、それぞれが同一UIDを有する複数の配列からコンセンサス配列を決定する工程を含む。いくつかの態様において、比較目的でアラインメントされる配列の長さは、参照配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%である。2つまたはそれ以上の配列の実際の比較は、周知の方法により、例えば数学的アルゴリズムを使用して達成することができる。そのような数学的アルゴリズムの非限定的な例はKarlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90- 5873-5877(1993)に記載されている。そのようなアルゴリズムは、Altschul, S. et al., Nucleic Acids Res., 25:3389-3402(1997)に記載のNBLASTプログラムおよびXBLASTプログラム(バージョン2.0)に組み込まれている。BLASTプログラムおよびGapped BLASTプログラムを用いる場合は、各プログラム(例えばNBLAST)の任意の関連パラメータを使用することができる。例えば、配列比較用のパラメータはスコア(score)=100、ワード長(word length)=12に設定するか、または変更(例えばW=5またはW=20)することができる。他の例には、Myers and Miller, CABIOS(1989)のアルゴリズム、ADVANCE、ADAM、BLAT、およびFASTAなどがある。いくつかの態様において、2つのアミノ酸配列間のパーセント同一性は、例えばGCGソフトウェアパッケージ中のGAPプログラム(Accelrys,英国ケンブリッジ)などを使用して得ることができる。
いくつかの局面において、配列が異なるポリヌクレオチド、アンプリコン、またはアンプリコンセットの数を決定する工程は、ポリヌクレオチド、アンプリコン、またはアンプリコンセットの配列を決定する工程を含むことができる。いくつかの局面において、異なるUID含有ポリヌクレオチド、アンプリコン、またはアンプリコンセットの数を決定する工程は、UID含有ポリヌクレオチド、アンプリコン、またはアンプリコンセットの配列を決定する工程を含むことができる。ポリヌクレオチドの配列を決定する工程は、標的領域の少なくとも一部分、UID、SBC、ポリヌクレオチドの少なくとも一部分、それらの相補鎖、それらの逆相補鎖、またはそれらの任意の組合せの配列を決定するために、シーケンシング反応を実行する工程を含みうる。いくつかの態様では、UIDのみまたはUIDの一部分のみがシーケンシングされる。いくつかの態様では、SBCのみまたはSBCの一部分のみがシーケンシングされる。いくつかの態様では、標的領域のみまたは標的領域の一部分のみがシーケンシングされる。いくつかの態様において、シーケンシング反応は、本明細書に記載するように、支持体上で、連続流において、希釈液において、または1つもしくは複数の物理的に分離した体積において、行うことができる。
シーケンシングは、実行1回あたり少なくとも約200、300、400、500、600、700、800、900、1000個、またはそれ以上のシーケンシングリードを含むことができる。本明細書において使用する場合、シーケンシングリードは、シーケンシング技法によって作製されたデータの配列またはストリームから決定されるヌクレオチドの配列を含む。いくつかの態様において、シーケンシングは、実行1回あたり少なくとも約1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000個、またはそれ以上のシーケンシングリードをシーケンシングする工程を含む。シーケンシングは、実行1回あたり約1,000,000,000シーケンシングリード超または約1,000,000,000シーケンシングリード未満または約1,000,000,000シーケンシングリードを含むことができる。シーケンシングは、実行1回あたり約200,000,000リード超または約200,000,000リード未満または約200,000,000リードを含むことができる。
ある方法は、2つまたはそれ以上の配列リードからコンセンサス配列を決定することによって標的ポリヌクレオチドの配列を決定する工程を含むことができる。いくつかの態様では、UID1個あたり平均で5〜50個または20〜30個の生リードが、コンセンサス配列精度と十分なシーケンシング深度の望ましいバランスを与える(さらに高い生リードカウントはさらに大きなシーケンシング深度を必要としうる)。いくつかの態様において、精度(例えば総合正規分布(aggregate normal distribution))は、UID情報を使用して配列リードをアラインメントし、コンセンサス配列に集約すれば、改良することができる。UIDコンセンサス精度の特徴は、第2のアレル上の変異またはSNPの有無を正確に決定し、検出されたSNPを持つ患者のヘテロ接合性の正確なコールをもたらす能力が強化されている点である。
ある方法は、1つまたは複数のアラインメントから、例えばライブラリー中の1つまたは複数のポリヌクレオチド配列、配列リード、アンプリコン配列、またはアンプリコンセット配列の1つまたは複数の互いのアラインメントから、コンセンサス配列を作製する工程を含むことができる。本明細書に記載する方法と本明細書に記載するように作製されたライブラリーとを使用して決定されるコンセンサス配列は、塩基コール精度を改良することができる。例えば、決定されたコンセンサス配列は、当技術分野における他の方法と比較して改良された品質スコアを有することができる。本明細書において使用する場合、品質スコアは、ある特定配列位置における塩基割り当てが正しい確率の尺度を含む。したがって品質スコア値は正しい塩基コーリングの確率に関係づけることができる。本明細書に記載する方法は、標的ポリヌクレオチド配列を約10または少なくとも約10の品質スコアで決定するために使用することができる。本明細書に記載する方法は、同じかそれ以上の配列精度の信頼度を達成するための配列リード数を低下させること、または少ない配列リード数を使用して同じかそれ以上の配列精度の信頼度を達成することができる。いくつかの態様において、UIDを用いる本明細書に記載の方法では、UIDを使用しない類似する方法よりも少ない配列リードを使用して、類似するまたは同じ信頼度または塩基コーリング精度で配列が決定される。
いくつかの態様において、両方の指数関数的増幅プライミング部位またはその相補鎖、アダプター配列、SBC、任意のUID、2つのユニバーサルプライミング配列、またはそれらのどの組合せも持たない配列リードは、読み間違いでありうる。ある方法は、読み間違いをシーケンシングする工程を含むことができる。ある方法は、例えば反応条件を決定するために、またはプライマー配列を設計するために、読み間違いの数を決定する工程を含むことができる。1つまたは複数の第1の条件または条件セット下で生成した読み間違い数を比較する工程を使用して、好ましい条件または条件セットを決定することができる。例えば、第1の方法をPCR反応中に高い塩濃度で、また第2の方法をPCR反応中に低い塩濃度で行い、塩濃度の相違以外は、第1の方法と第2の方法を実質的に同じように行うことができる。もし、第1の方法の方が高い読み間違い数をもたらすのであれば、例えばある特定の標的ポリヌクレオチド配列またはプライマーに関して第1の方法の方が高い読み間違い数をもたらすのであれば、その特定の標的ポリヌクレオチド配列またはプライマーにとっては低塩反応条件の方が好ましいと決定することができる。
いくつかの態様では、コンセンサス配列をアラインメントしまたは決定するために、両方の指数関数的増幅プライミング部位またはその相補鎖、アダプター配列、SBC、任意のUID、2つのユニバーサルプライミング配列、またはそれらの任意の組合せを持つ配列リードだけを使用する。いくつかの態様において、両方の指数関数的増幅プライミング部位またはその相補鎖、アダプター配列、SBC、任意のUID、2つのユニバーサルプライミング配列、またはそれらのどの組合せも持たない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。
いくつかの態様において、両方の指数関数的増幅プライミング部位またはその相補鎖を持たない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。いくつかの態様において、1つの指数関数的増幅プライミング部位(例えばPCRプライミング部位)またはその相補鎖を1つも有さない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。いくつかの態様において、2つの指数関数的増幅プライミング部位またはその相補鎖を含む1つまたは複数の配列リードは、それら2つの指数関数的増幅プライミング部位が使用したプライマー対、例えばPCR反応において使用したプライマー対の指数関数的増幅プライミング部位と一致していない場合には、コンセンサス配列をアラインメントしまたは決定するためには使用しない。
いくつかの態様では、両方の指数関数的増幅プライミング部位またはその相補鎖を持つ配列リードだけを、コンセンサス配列をアラインメントしまたは決定するために使用する。いくつかの態様では、使用したプライマー対、例えばPCR反応において使用したプライマー対の指数関数的増幅プライミング部位と一致する2つの指数関数的増幅プライミング部位またはその相補鎖を持つ配列リードだけを、コンセンサス配列をアラインメントしまたは決定するために使用する。いくつかの態様において、SBCを持たない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。いくつかの態様では、SBCを持つ配列リードだけを、コンセンサス配列をアラインメントしまたは決定するために使用する。大半の態様において、UIDを持たない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。大半の態様では、UIDを持つ配列リードだけを、コンセンサス配列をアラインメントしまたは決定するために使用する。いくつかの態様において、アダプター配列を持たない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。いくつかの態様では、アダプター配列を持つ配列リードだけを、コンセンサス配列をアラインメントしまたは決定するために使用する。いくつかの態様において、2つのユニバーサルプライミング配列を持たない1つまたは複数の配列リードは、コンセンサス配列をアラインメントしまたは決定するためには使用しない。いくつかの態様では、2つのユニバーサルプライミング配列を持つ配列リードだけを、コンセンサス配列をアラインメントしまたは決定するために使用する。
いくつかの態様において、同じUIDを含有する配列、あるアンプリコン中の配列、またはあるアンプリコンセット中の配列の少なくとも5%が存在する場合に、配列は正確であると決定することができる。例えば、同じUIDを含有する配列、あるアンプリコン中の配列またはあるアンプリコンセット中の配列の少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、92%、95%、97%、98%、99%、またはそれ以上が存在する場合に、配列は正確であると決定することができる。例えば、同じUIDを含有する配列、あるアンプリコン中の配列またはあるアンプリコンセット中の配列の少なくとも約75%〜約99%が存在する場合に、配列は正確であると決定することができる。例えば、同じUIDを含有する配列、あるアンプリコン中の配列またはあるアンプリコンセット中の配列の少なくとも約85%〜約99%が存在する場合に、配列は正確であると決定することができる。例えば、同じUIDを含有する配列、あるアンプリコン中の配列またはあるアンプリコンセット中の配列の少なくとも約92%〜約99%が存在する場合に、配列は正確であると決定することができる。
いくつかの態様では、比較的高いエラー率を有するシーケンシングケミストリーが使用される。そのような態様において、そのようなケミストリーによってもたらされる平均品質スコアは、配列リード長の単調減少関数である。一態様において、そのような減少は、配列リードの0.5パーセントが位置1〜75に少なくとも1つのエラーを有し;配列リードの1パーセントが位置76〜100に少なくとも1つのエラーを有し;配列リードの2パーセントが位置101〜125に少なくとも1つのエラーを有することに相当する。
標的ポリヌクレオチド
本明細書に記載する方法は、シーケンシングのための1つまたは複数の標的ポリヌクレオチドからポリヌクレオチドのライブラリーを作製するために使用することができる。標的ポリヌクレオチドには、増幅反応の産物ではない任意の関心対象のポリヌクレオチドが含まれる。例えば、標的ポリヌクレオチドには、生物学的試料中のポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドには、PCR反応の産物は含まれない。例えば標的ポリヌクレオチドは、増幅反応の産物を生成させるために使用されるポリヌクレオチドを含みうるが、増幅産物そのものは含まない。例えば標的ポリヌクレオチドは、逆転写反応またはプライマー伸長反応に付すことができる関心対象のポリヌクレオチドを含む。例えば標的ポリヌクレオチドはRNAまたはDNAを含む。いくつかの態様において、標的RNAポリヌクレオチドはmRNAである。いくつかの態様において、標的RNAポリヌクレオチドはポリアデニル化されている。いくつかの態様において、RNAポリヌクレオチドはポリアデニル化されていない。いくつかの態様において、標的ポリヌクレオチドはDNAポリヌクレオチドである。DNAポリヌクレオチドはゲノムDNAであってもよい。DNAポリヌクレオチドはエクソン、イントロン、非翻訳領域、またはそれらの任意の組合せを含みうる。
いくつかの態様において、ライブラリーは、標的ポリヌクレオチドの2つまたはそれ以上の領域から作製することができる。いくつかの態様において、本発明のライブラリーは、2つまたはそれ以上の標的ポリヌクレオチドから作製することができる。いくつかの態様において、標的ポリヌクレオチドは、ゲノム核酸または染色体に由来するDNAである。いくつかの態様において、標的ポリヌクレオチドには、多型または変異などのバリアントを含む配列が含まれる。いくつかの態様において、標的ポリヌクレオチドはDNAを含み、RNAを含まない。いくつかの態様において、標的ポリヌクレオチドはRNAを含み、DNAを含まない。いくつかの態様において、標的ポリヌクレオチドはDNAとRNAを含む。いくつかの態様において、標的ポリヌクレオチドはmRNA分子である。いくつかの態様において、標的ポリヌクレオチドはDNA分子である。いくつかの態様において、標的ポリヌクレオチドは一本鎖ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは二本鎖ポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは二本鎖ポリヌクレオチドの一本鎖である。
標的ポリヌクレオチドは、当技術分野において公知の方法を使用して、任意の生物学的試料から取得し、調製することができる。いくつかの態様において、標的ポリヌクレオチドは、増幅を行わずに直接単離される。直接単離のための方法は当技術分野において公知である。非限定的な例として、生物学的試料、生物、または細胞由来のゲノムDNAまたはmRNAの抽出が挙げられる。
いくつかの態様において、1つまたは複数の標的ポリヌクレオチドは、生物学的試料から精製される。いくつかの態様において、標的ポリヌクレオチドは、それを含有する生物学的試料から精製されない。いくつかの態様において、標的ポリヌクレオチドは生物学的試料から単離される。いくつかの態様において、標的ポリヌクレオチドは、それを含有する生物学的試料から単離されない。例えばいくつかの態様において、標的ポリヌクレオチドは試料から抽出も精製もされない。例えばいくつかの態様において、標的mRNAは、ポリA精製法などによって試料から精製されることがない。いくつかの態様において、標的ポリヌクレオチドは無細胞核酸であることができる。いくつかの態様において、標的ポリヌクレオチドは断片化された核酸であることができる。いくつかの態様において、標的ポリヌクレオチドは転写された核酸であることができる。いくつかの態様において、標的ポリヌクレオチドは修飾されたポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは非修飾ポリヌクレオチドである。
いくつかの態様において、標的ポリヌクレオチドは単一細胞由来のポリヌクレオチドである。いくつかの態様において、標的ポリヌクレオチドは個々の細胞に由来する。いくつかの態様において、標的ポリヌクレオチドは複数の細胞を含有する試料由来のポリヌクレオチドである。
いくつかの態様において、標的ポリヌクレオチドはバイオマーカー配列をコードする。いくつかの態様において、標的ポリヌクレオチドは2つまたはそれ以上のバイオマーカー配列をコードする。いくつかの態様では、複数の標的ポリヌクレオチドがバイオマーカー配列をコードする。いくつかの態様では、複数の標的ポリヌクレオチドが2つまたはそれ以上のバイオマーカー配列をコードする。
診断法
いくつかの態様において、ある方法はさらに、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。いくつかの態様において、ある方法はさらに、標的ポリヌクレオチドの有無またはレベルに基づいて、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。いくつかの態様において、ある方法はさらに、1つまたは複数の標的ポリヌクレオチドの有無またはレベルに基づいて、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。
いくつかの態様において、ある方法はさらに、本明細書に記載する方法を使用して得られた配列の1つまたは複数の有無、レベル、または配列に基づいて、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。例えば、本明細書に記載する方法を使用して得られるバリアント配列の有無、レベル、または配列に基づいて、疾患の診断を下すことができる。いくつかの態様において、ある方法はさらに、本明細書に記載する方法を使用して得られる配列リードの1つまたは複数の有無、レベル、または配列に基づいて、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。いくつかの態様において、ある方法はさらに、本明細書に記載する方法を使用して得られるコンセンサス配列の1つまたは複数の有無、レベル、または配列に基づいて、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。いくつかの態様において、ある方法はさらに、試料中の標的ポリヌクレオチドのレベル(例えば量または濃度)の決定に基づいて、ある疾患、障害、症状および/または状態を、対象において診断し、予後判定し、監視し、処置し、改善し、かつ/または防止する工程を含むことができる。試料中の標的ポリヌクレオチドのレベルは、1つまたは複数の配列リード、配列、コンセンサス配列、またはそれらの任意の組合せに基づいて決定することができる。試料中の複数の標的ポリヌクレオチドのそれぞれのレベルは、本明細書に記載する方法を使用して決定することができる。試料中の複数の標的ポリヌクレオチドのそれぞれのレベルは、複数の標的ポリヌクレオチド中の各標的ポリヌクレオチドのいくつかの配列リード、配列、コンセンサス配列、またはそれらの任意の組合せに基づいて決定することができる。例えば第1の標的ポリヌクレオチドのレベルと第2の標的ポリヌクレオチドのレベルを、本明細書に記載する方法を使用して決定することができる。
いくつかの態様において、複数の標的ポリヌクレオチドの第1の標的ポリヌクレオチドと第2の標的ポリヌクレオチドは同じである。例えば第1の標的ポリヌクレオチドはmRNA分子の第1のコピーを含むことができ、第2の標的ポリヌクレオチドはmRNA分子の第2のコピーを含むことができる。いくつかの態様において、第1の標的ポリヌクレオチドと第2の標的ポリヌクレオチドは異なる。例えば第1の標的ポリヌクレオチドは第1のmRNA分子を含むことができ、第2の標的ポリヌクレオチドは第1のmRNA分子とは異なる遺伝子から転写された第2のmRNA分子を含むことができる。例えば第1の標的ポリヌクレオチドは第1のアレルを含むことができ、第2の標的ポリヌクレオチドは第2のアレルを含むことができる。例えば第1の標的ポリヌクレオチドは野生型配列を含むことができ、第2の標的ポリヌクレオチドはバリアント配列を含むことができる。
標的ポリヌクレオチドのパネルは複数のバイオマーカーを含むことができる。バイオマーカーのパネルは、複数の標的ポリヌクレオチドを含むことができる。いくつかの態様において、バイオマーカーのパネルは、複数の異なる標的ポリヌクレオチドのそれぞれ由来の配列を含む。例えばバイオマーカーのパネルは、異なる第1の標的ポリヌクレオチドと第2の標的ポリヌクレオチドの配列を含むことができる。例えば、標的ポリヌクレオチドのパネルは、ある疾患と関連することが公知であるか、またはある疾患と関連しないことが公知である、バリアント配列などの複数のバイオマーカーを含むことができる。例えば標的ポリヌクレオチドのパネルは、複数の遺伝子座のそれぞれについて少なくとも1つのバイオマーカーを含むことができる。いくつかの態様において、標的ポリヌクレオチドのパネル中の2つまたはそれ以上の標的ポリヌクレオチドのタイプは異なる。例えば標的ポリヌクレオチドのパネルは、第1の標的mRNA分子および第2の標的DNA分子を含む複数の標的ポリヌクレオチドを含むことができる。例えば、標的ポリヌクレオチドのパネルは、RNAである第1の標的およびDNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドのパネルは、mRNAである第1の標的およびゲノムDNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。いくつかの態様において、標的ポリヌクレオチドのパネル中の2つまたはそれ以上の標的ポリヌクレオチドのタイプは同じである。例えば標的ポリヌクレオチドのパネルは、RNAである第1の標的およびRNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドのパネルは、mRNAである第1の標的およびmRNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドのパネルは、mRNAである第1の標的およびmiRNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドのパネルは、DNAである第1の標的およびDNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドのパネルは、ゲノムDNAである第1の標的およびゲノムDNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。例えば標的ポリヌクレオチドのパネルは、細胞DNAである第1の標的および循環DNAである第2の標的を含む複数の標的ポリヌクレオチドを含むことができる。
いくつかの態様において、標的ポリヌクレオチドのパネル中の2つまたはそれ以上の標的ポリヌクレオチドのバイオマーカーのタイプは異なる。例えば標的ポリヌクレオチドのパネルは、ある遺伝子座に対する第1のバイオマーカーおよびバリアント配列に関する第2のバイオマーカーを含む複数のバイオマーカーを含むことができる。例えば標的ポリヌクレオチドのパネルは、SNPに関する第1のバイオマーカーおよび変異に関する第2のバイオマーカーを含む複数のバイオマーカーを含むことができる。いくつかの態様において、標的ポリヌクレオチドのパネル中の2つまたはそれ以上の標的ポリヌクレオチドのバイオマーカーのタイプは同じである。例えば標的ポリヌクレオチドのパネルは、ある遺伝子座に対する第1のバイオマーカー、別の遺伝子座に関する第2のバイオマーカーを含む複数のバイオマーカーを含むことができる。例えば標的ポリヌクレオチドのパネルは、SNPに関する第1のバイオマーカー、SNPに関する第2のバイオマーカーを含む複数のバイオマーカーを含むことができる。
いくつかの態様において、ある方法はさらに、ある疾患、障害、症状および/または状態を持つ対象を、少なくとも50%の信頼度で診断し、または予後判定する工程を含むことができる。いくつかの態様では、対象におけるバイオマーカーなどの標的ポリヌクレオチドの有無、レベル、配列、またはそれらの任意の組合せを少なくとも50%の信頼度で決定することができる。いくつかの態様では、対象における標的ポリヌクレオチドの有無、レベル、配列、またはそれらの任意の組合せを、50%〜100%の信頼度で決定することができる。
試料
本明細書において使用する場合、試料は、標的ポリヌクレオチドなどのポリヌクレオチドを含有する生物学的な、環境的な、医学的な、または患者の、供給源または試料を含む。本明細書に記載する方法では、ポリヌクレオチドを含有する任意の生物学的試料を使用することができる。例えば試料は、RNAまたはDNAを含有する対象由来の生物学的試料であることができる。ポリヌクレオチドは生物学的試料から抽出するか、またはポリヌクレオチドの抽出を行わずに試料を直接、本方法に付すことができる。試料は抽出または単離されたDNAまたはRNAであることができる。試料は、生物学的標本から抽出された全RNAもしくはDNA、cDNAライブラリー、ウイルスDNA、またはゲノムDNAであることもできる。一態様において、ポリヌクレオチドは、タンパク質、脂質および非テンプレート核酸などといったさまざまな他の成分を含有する生物学的試料から単離される。核酸テンプレート分子は、任意の細胞材料から得るか、動物、植物、細菌、真菌、または他の任意の細胞性生物から得ることができる。ある特定の態様において、ポリヌクレオチドは単一の細胞から得られる。ポリヌクレオチドは、生物から直接得るか、生物から得られた生物学的試料から得ることができる。任意の組織標本または体液標本を、本発明において使用するための核酸の供給源として使用してよい。ポリヌクレオチドは、初代細胞培養または細胞株などの培養細胞から単離することもできる。テンプレート核酸の取得源となる細胞または組織は、ウイルスまたは他の細胞内病原体に感染している場合もある。
DNA抽出の方法は当技術分野において周知である。古典的DNA単離プロトコールは、フェノールとクロロホルムの混合物などといった有機溶媒を用いる抽出と、それに続くエタノール沈殿に基づく(J. Sambrook et al.,「Molecular Cloning: A Laboratory Manual」1989,第2版, Cold Spring Harbour Laboratory Press:ニューヨーク州ニューヨーク)。他の方法には、塩析DNA抽出(P. Sunnucks et al., Genetics, 1996, 144:747-756; S.M. Aljanabi and I. Martinez, Nucl. Acids Res., 1997, 25:4692-4693)、トリメチルアンモニウム臭化物塩DNA抽出(S. Gustincich et al., BioTechniques, 1991, 11:298-302)およびグアニジウムチオシアネートDNA抽出(J.B.W. Hammond et al., Biochemistry、1996、240: 298-300)などがある。生物学的試料からDNAを抽出するためのキットは種々市販されている(例えばBD Biosciences Clontech(カリフォルニア州パロアルト): Epicentre Technologies(ウィスコンシン州マディソン); Gentra Systems, Inc.(ミネソタ州ミネアポリス); MicroProbe Corp.(ワシントン州ボセル); Organon Teknika(ノースカロライナ州ダーラム);およびQiagen Inc.(カリフォルニア州バレンシア))。
RNA抽出の方法も当技術分野において周知であり(例えば、J. Sambrook et al.,「Molecular Cloning: A Laboratory Manual」1989, 211d Ed., Cold Spring Harbour Laboratory Press: ニューヨーク参照)、体液からRNAを抽出するためのキットはいくつか市販されている(例えばAmbion, Inc.(テキサス州オースティン); Amersham Biosciences(ニュージャージー州ピスカタウェイ); BD Biosciences Clontech(カリフォルニア州パロアルト); BioRad Laboratories(カリフォルニア州ハーキュリーズ); Dynal Biotech Inc.(ニューヨーク州レークサクセス); Epicentre Technologies(ウィスコンシン州マディソン); Gentra Systems, Inc.(ミネソタ州ミネアポリス); GIBCO BRL(メリーランド州ゲイサーズバーグ); Invitrogen Life Technologies(カリフォルニア州カールズバッド); MicroProbe Corp.(ワシントン州ボセル); Organon Teknika(ノースカロライナ州ダーラム); Promega, Inc.(ウィスコンシン州マディソン);およびQiagen Inc.(カリフォルニア州バレンシア))。
1つまたは複数の試料は1つまたは複数の供給源に由来しうる。試料の1つまたは複数は2つもしくはそれ以上の供給源に由来しうる。試料の1つまたは複数は1つまたは複数の対象に由来しうる。試料の1つまたは複数は2つもしくはそれ以上の対象に由来しうる。試料の1つまたは複数は同じ対象に由来しうる。1つまたは複数の対象は同じ種に由来しうる。1つまたは複数の対象は異なる種に由来しうる。1つまたは複数の対象は健康でありうる。1つまたは複数の対象は、疾患、障害または状態に冒されていてもよい。
いくつかの態様において、試料は、血液、唾液、リンパ液、尿、脳脊髄液、精液、喀痰、便、または組織ホモジネートなどの流体である。
試料は、ある状態にある対象から採取することができる。いくつかの態様において、試料を採取する対象は患者、例えばがん患者またはがんを有すると疑われる患者であることができる。対象は哺乳動物、例えばヒトであることができ、雄(男性)または雌(女性)であることができる。いくつかの態様において、雌(女性)は妊娠している。試料は腫瘍生検であることができる。生検は、例えば医師、医師助手、看護師、獣医師、歯科医、カイロプラクター、パラメディック、皮膚科学者、腫瘍学者、消化器病学者、または外科医などといった医療提供者によって行われうる。
いくつかの態様において、疾患または状態は病原体感染である。標的ポリヌクレオチドは病原体に由来することができる。病原体はウイルス、細菌、真菌、または原生動物であることができる。いくつかの態様において、病原体は、アカントアメーバ(Acanthamoeba)(例えばA.アストロニキス(A. astronyxis)、A.カステラーニ(A. castellanii)、A.カルバートソニ(A. culbertsoni)、A.ハチェッティ(A. hatchetti)、A.ポリファーガ(A. polyphaga)、A.リーソデス(A. rhysodes)、A.ヒーリイ(A. healyi)、A.ディビオネンシス(A. divionensis))、ブラキオーラ(Brachiola)(例えばB.コノリ(B. connori)、B.ベシキュララム(B. vesicularum))、クリプトスポリジウム(Cryptosporidium)(例えばC.パルバム(C. parvum))、シクロスポラ(Cyclospora)(例えばC.カイエタネンシス(C. cayetanensis))、エンセファリトゾーン(Encephalitozoon)(例えばE.クニクリ(E. cuniculi)、E.ヘレム(E. hellem)、E.インテスティナリス(E. intestinalis))、エントアメーバ(Entamoeba)(例えば赤痢アメーバ(E.histolytica))、エンテロシトゾーン(Enterocytozoon)(例えばE.ビエヌーシ(E. bieneusi))、ジアルジア(Giardia)(例えばランブル鞭毛虫(G. lamblia))、イソスポラ(Isospora)(例えばI.ベリ(I. belli))、ミクロスポリジウム(Microsporidium)(例えばM.アフリカナム(M. africanum)、M.セイロネンシス(M. ceylonensis))、ネグレリア(Naegleria)(例えばN.フォーレリ(N. fowleri))、ノゼマ(Nosema)(例えばN.アルゲラ(N. algerae)、N.オキュララム(N. ocularum))、プレイストフォラ(Pleistophora)、トラキプリストフォーラ(Trachipleistophora)(例えばT.アントロポフテラ(T.anthropophthera)、T.ホミニス(T. hominis))、およびビタフォルマ(Vittaforma)(例えばV.コルネア(V. corneae))などの原生動物であることができる。病原体は、カンジダ(Candida)、アスペルギルス(Aspergillus)、クリプトコッカス(Cryptococcus)、ヒストプラズマ(Histoplasma)、ニューモシスチス(Pneumocystis)、およびスタキボトリス(Stachybotrys)などの真菌であることができる。病原体は細菌であることができる。例示的な細菌として、ボルデテラ,(Bordetella)、ボレリア(Borrelia)、ブルセラ(Brucella)、カンピロバクター(Campylobacter)、クラミジア(Chlamydia)、クラミドフィラ(Chlamydophila)、クロストリジウム(Clostridium)、コリネバクテリウム(Corynebacterium)、エンテロコッカス(Enterococcus)、エシェリキア(Escherichia)、フランシセラ(Francisella)、ヘモフィラス(Haemophilus)、ヘリコバクター(Helicobacter)、レジオネラ(Legionella)、レプトスピラ(Leptospira)、リステリア(Listeria)、マイコバクテリウム(Mycobacterium)、マイコプラズマ(Mycoplasma)、ナイセリア(Neisseria)、シュードモナス(Pseudomonas)、リケッチア(Rickettsia)、サルモネラ(Salmonella)、シゲラ(Shigella)、スタフィロコッカス(Staphylococcus)、レンサ球菌(Streptococcus)、トレポネーマ(Treponema)、ビブリオ(Vibrio)、またはエルシニア(Yersinia)が挙げられるが、それらに限定されるわけではない。ウイルスは逆転写ウイルスであることができる。逆転写ウイルスの例として、一本鎖RNA-RT(ssRNA-RT)ウイルスおよび二本鎖DNA-RT(dsDNA-RT)ウイルスが挙げられるが、それらに限定されるわけではない。ssRNA-RTウイルスの非限定的な例としては、レトロウイルス、アルファレトロウイルス、ベータレトロウイルス、ガンマレトロウイルス、デルタレトロウイルス、イプシロンレトロウイルス、レンチウイルス、スプーマウイルス、メタウイルス(metavirirus)、およびシュードウイルス(pseudovirus)が挙げられる。dsDNA-RTウイルスの非限定的な例としては、ヘパデノウイルス(hepadenovirus)およびカリモウイルスが挙げられる。ウイルスはDNAウイルスであることができる。ウイルスはRNAウイルスであることができる。DNAウイルスは二本鎖DNA(dsDNA)ウイルスであることができる。いくつかの態様において、dsDNAウイルスはアデノウイルス、ヘルペスウイルス、またはポックスウイルスである。アデノウイルスの例としては、アデノウイルスおよび感染性イヌ肝炎ウイルスが挙げられるが、それらに限定されるわけではない。ヘルペスウイルスの例としては、単純ヘルペスウイルス、水痘帯状疱疹ウイルス、サイトメガロウイルス、およびエプスタイン・バー・ウイルスが挙げられるが、それらに限定されるわけではない。ポックスウイルスの非限定的リストには、痘瘡ウイルス、牛痘ウイルス、羊痘ウイルス、サル痘ウイルス、およびワクシニアウイルスが含まれる。DNAウイルスは一本鎖DNA(ssDNA)ウイルスであることができる。ssDNAウイルスはパルボウイルスであることができる。パルボウイルスの例としては、パルボウイルスB19、イヌパルボウイルス、マウスパルボウイルス、ブタパルボウイルス、ネコ汎白血球減少症、およびミンク腸炎ウイルスが挙げられるが、それらに限定されるわけではない。
ウイルスはRNAウイルスであることができる。RNAウイルスは二本鎖RNA(dsRNA)ウイルス、(+)センス一本鎖RNAウイルス((+)ssRNA)ウイルス、または(-)センス一本鎖((-)ssRNA)ウイルスであることができる。dsRNAウイルスの非限定的なリストには、レオウイルス、オルトレオウイルス、サイポウイルス、ロタウイルス、ブルータングウイルス、およびフィトレオウイルスが含まれる。(+)ssRNAウイルスの例としては、ピコルナウイルスおよびトガウイルスが挙げられるが、それらに限定されるわけではない。ピコルナウイルスの例としては、エンテロウイルス、ライノウイルス、ヘパトウイルス、カルジオウイルス、アフトウイルス、ポリオウイルス、パレコウイルス、エルボウイルス、コブウイルス、テッショウウイルス、およびコクサッキーが挙げられるが、それらに限定されるわけではない。いくつかの態様において、トガウイルスは風疹ウイルス、シンドビスウイルス、東部ウマ脳炎ウイルス、西部ウマ脳炎ウイルス、ベネズエラウマ脳炎ウイルス、ロスリバーウイルス、オニョンニョンウイルス、チクングニア、またはセムリキ森林ウイルスである。(-)ssRNAウイルスの非限定的リストにはオルソミクソウイルスおよびラブドウイルスが含まれる。オルソミクソウイルスの例としては、インフルエンザウイルスa、インフルエンザウイルスB、インフルエンザウイルスC、イサウイルス、およびトゴトウイルスが挙げられるが、それらに限定されるわけではない。ラブドウイルスの例としては、シトラブドウイルス、ジコラブドウイルス(dichorhabdovirus)、エフェメロウイルス、リッサウイルス、ノビラブドウイルス、およびベシクロウイルスが挙げられるが、それらに限定されるわけではない。
試料は、任意の生物またはウイルス由来の生物学的試料であることができる。本発明において使用するための試料には、ウイルス粒子またはウイルス調製物が含まれる。いくつかの態様において、出発材料は、遺伝物質を得ることができる任意の生物由来の核酸含有試料であることができる。試料の1つまたは複数は哺乳動物、細菌、ウイルス、真菌または植物に由来しうる。1つまたは複数の試料は、ヒト、ウマ、ウシ、ニワトリ、ブタ、ラット、マウス、サル、ウサギ、モルモット、ヒツジ、ヤギ、イヌ、ネコ、トリ、魚、カエル、およびミバエに由来することができる。
いくつかの態様において、ポリヌクレオチドは、他の標的分子、例えばタンパク質、酵素、基質、抗体、結合性作用物質、ビーズ、小分子、ペプチド、または他の任意の分子に結合している。一般に核酸は、さまざまな技法によって生物学的試料から抽出することができる(Sambrook et al., Molecular Cloning: A Laboratory Manual, 第3版,ニューヨーク州コールドスプリングハーバー(2001))。
いくつかの態様において、試料は唾液である。いくつかの態様において、試料は全血である。いくつかの態様では、検査用に十分な量のポリヌクレオチドを得るために、少なくとも約0.001、0.005、0.01、0.05、0.1、0.5、1、2、3、4、5、10、20、25、30、35、40、45、または50mLの血液量を採血する。いくつかの態様において、血液は、限定するわけではないが例えばEDTAなどのマグネシウムキレーターを含有する装置に集めることができ、4℃で保存される。任意で、例えば限定するわけではないがEGTAなどのカルシウムキレーターを加えることができる。
いくつかの態様では、限定するわけではないが例えばホルムアルデヒド、ホルムアルデヒド誘導体、ホルマリン、グルタルアルデヒド、グルタルアルデヒド誘導体、タンパク質架橋剤、核酸架橋剤、タンパク質および核酸架橋剤、1級アミン反応性架橋剤、スルフヒドリル反応性架橋剤、スルフヒドリル付加またはジスルフィド還元、糖質反応性架橋剤、カルボキシル反応性架橋剤、光反応性架橋剤、または切断可能な架橋剤などといった、細胞溶解阻害剤が血液に加えられる。いくつかの態様では、酵素処理(例えばプロテアーゼ消化)を使用して非核酸材料を出発材料から除去することができる。
いくつかの態様において、出発材料は組織を含む組織試料であることができ、非限定的な例として、肝臓、肺、腎臓、前立腺、卵巣、脾臓、リンパ節(扁桃を含む)、甲状腺、膵臓、心臓、骨格筋、腸、喉頭、食道、胃、骨、心臓、胸腺、動脈、血管、肺、筋、胃、腸、肝臓、膵臓、脾臓、腎臓、胆嚢、甲状腺、副腎、乳腺、卵巣、前立腺、精巣、皮膚、脂肪、眼または脳が挙げられる。別の例において、出発材料は核酸を含有する細胞であることができる。組織は感染組織、患部組織、悪性組織、石灰化組織、または健常組織を含みうる。試料は、1つまたは複数の生物学的組織由来の少なくとも1つの細胞を含むことができる。例えば、試料は1つまたは複数の悪性細胞を含むことができる。
1つまたは複数の悪性細胞は、腫瘍、癌、肉腫、または白血病に由来しうる。肉腫は、骨、軟骨、脂肪、筋、血管、または他の結合組織もしくは支持組織のがんである。肉腫としては、骨がん、線維肉腫、軟骨肉腫、ユーイング肉腫、悪性血管内皮腫、悪性シュワン細胞腫、両側性前庭神経鞘腫、骨肉腫、軟組織肉腫(例えば胞状軟部肉腫、血管肉腫(angiosarcoma)、葉状嚢肉腫、皮膚線維肉腫、類腱腫、類上皮肉腫、骨外性骨肉腫、線維肉腫、血管外皮腫、血管肉腫(hemangiosarcoma)、カポジ肉腫、平滑筋肉腫、脂肪肉腫、リンパ管肉腫、リンパ肉腫、悪性線維性組織球腫、神経線維肉腫、横紋筋肉腫、および滑膜肉腫)が挙げられるが、それらに限定されるわけではない。癌は、身体の表面を覆い、ホルモンを産生し、腺を構成する細胞である上皮細胞内において始まるがんである。非限定的な例として、癌には、乳がん、膵がん、肺がん、大腸がん、直腸結腸がん、直腸がん、腎がん、膀胱がん、胃がん、前立腺がん、肝がん、卵巣がん、脳がん、膣がん、外陰がん、子宮がん、口腔がん、陰茎がん、精巣がん、食道がん、皮膚がん、ファロピウス管のがん、頭頸部がん、消化管間葉性がん、腺癌、皮膚黒色腫または眼内黒色腫、肛門部のがん、小腸のがん、内分泌系のがん、甲状腺のがん、副甲状腺のがん、副腎のがん、尿道のがん、腎盂のがん、尿管のがん、子宮内膜のがん、子宮頸のがん、下垂体のがん、中枢神経系(CNS)の新生物、原発性CNSリンパ腫、脳幹神経膠腫、および脊椎軸腫瘍などがある。いくつかの態様において、がんは、基底細胞癌、扁平上皮癌、黒色腫、非黒色腫、または光線(日光)角化症などの皮膚がんである。いくつかの態様において、がんは肺がんである。肺がんは、気管から分岐して肺(気管支)または肺の小さな気嚢(肺胞)に入る気道において始まりうる。肺がんには非小細胞肺癌(NSCLC)、小細胞肺癌、および中皮腫(mesotheliomia)が含まれる。NSCLCの例としては、扁平上皮癌、腺癌、および大細胞癌が挙げられる。中皮腫は、肺および胸腔の裏打ち(胸膜)または腹部の裏打ち(腹膜)のがん性腫瘍でありうる。中皮腫は、アスベストばく露によるものでありうる。がんは膠芽腫などの脳がんでありうる。いくつかの態様において、がんは中枢神経系(CNS)腫瘍でありうる。CNS腫瘍は、神経膠腫または非神経膠腫と分類することができる。神経膠腫は、悪性神経膠腫、高悪性度神経膠腫、びまん性内因性橋神経膠腫でありうる。神経膠腫の例として、星状細胞腫、乏突起神経膠腫(または乏突起神経膠腫要素と星状細胞腫(astocytoma)要素との混合物)、および脳室上衣腫が挙げられる。星状細胞腫としては、低悪性度星状細胞腫、退形成性星細胞腫、多型性神経膠芽腫、毛様細胞性星状細胞腫、多形性黄色星状細胞腫、および上衣下巨細胞性星状細胞腫が挙げられるが、それらに限定されるわけではない。乏突起神経膠腫には、低悪性度乏突起神経膠腫(または乏突起星状細胞腫)および退形成乏突起神経膠腫が含まれる。非神経膠腫には、髄膜腫、下垂体腺腫、原発性CNSリンパ腫、および髄芽腫が含まれる。いくつかの態様において、がんは髄膜腫である。白血病は急性リンパ球性白血病、急性骨髄球性白血病、慢性リンパ球性白血病、または慢性骨髄球性白血病でありうる。他のタイプの白血病には、ヘアリー細胞白血病、慢性骨髄性単球性白血病、および若年性骨髄単球性白血病が含まれる。リンパ腫はリンパ球のがんであり、Bリンパ球からもTリンパ球からも発生しうる。主要な2タイプのリンパ腫は、以前はホジキン病と呼ばれていたホジキンリンパ腫と、非ホジキンリンパ腫である。ホジキンリンパ腫はリード-シュテルンベルク細胞の存在を特徴とする。非ホジキンリンパ腫は、ホジキンリンパ腫でない全てのリンパ腫である。非ホジキンリンパ腫は緩徐進行性リンパ腫および急速進行型リンパ腫でありうる。非ホジキンリンパ腫としては、びまん性大細胞型B細胞リンパ腫、濾胞性リンパ腫、粘膜関連リンパ組織リンパ腫(MALT)、小細胞リンパ球性リンパ腫、マントル細胞リンパ腫、バーキットリンパ腫、縦隔大細胞型B細胞リンパ腫、ワルデンシュトレームマクログロブリン血症、節性濾胞辺縁帯B細胞リンパ腫(NMZL)、脾性辺縁帯リンパ腫(SMZL)、節外性辺縁帯B細胞リンパ腫、血管内大細胞型B細胞リンパ腫、原発性滲出性リンパ腫、およびリンパ腫様肉芽腫症が挙げられるが、それらに限定されるわけではない。
複数の試料は、少なくとも5、10、20、30、40、50、60、70、80、90、もしくは100またはそれ以上の試料を含みうる。複数の試料は、少なくとも約100、200、300、400、500、600、700、800、900、もしくは1000個またはそれ以上の試料を含みうる。複数の試料は、少なくとも約1000、2000、3000、4000、5000、6000、7000、もしくは8000個の試料、9000、または10,000個の試料、または100,000個の試料、または1,000,000個、またはそれ以上の試料を含みうる。複数の試料は少なくとも約10,000個の試料を含みうる。
第1の試料中の1つまたは複数のポリヌクレオチドは、第2の試料中の1つまたは複数のポリヌクレオチドとは異なりうる。第1の試料中の1つまたは複数のポリヌクレオチドは、複数の試料中の1つまたは複数のポリヌクレオチドとは異なりうる。試料中の1つまたは複数のポリヌクレオチドは、少なくとも約80%、85%、90%、95%、96%、97%、98%、99%、または100%の配列同一性を含むことができる。いくつかの態様において、試料中の1つまたは複数のポリヌクレオチドの相違は、約100、90、80、70、60、50、40、30、25、20、25、10、9、8、7、6、5、4、3、2、または1ヌクレオチド未満または塩基対未満であることができる。複数の試料の1つまたは複数の試料における複数のポリヌクレオチドは、2つまたはそれ以上の同一配列を含むことができる。複数の試料の1つまたはそれ以上において総ポリヌクレオチドの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、同じ配列を含むことができる。複数の試料の1つまたは複数の試料における複数のポリヌクレオチドは、少なくとも2つの異なる配列を含みうる。複数の試料の1つまたは複数において総ポリヌクレオチドの少なくとも約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%は、少なくとも2つの異なる配列を含みうる。いくつかの態様において、1つまたは複数のポリヌクレオチドは互いのバリアントである。例えば、1つまたは複数のポリヌクレオチドは一塩基多型または他のタイプの変異を含有しうる。別の例では、1つまたは複数のポリヌクレオチドはスプライスバリアントである。
第1の試料は1つまたは複数の細胞を含み、第2の試料は1つまたは複数の細胞を含みうる。第1の試料の1つまたは複数の細胞は第2の試料の1つまたは複数の細胞と同じ細胞タイプであってよい。第1の試料の1つまたは複数の細胞は、複数の試料の1つまたは複数の異なる細胞とは異なる細胞タイプであってもよい。
複数の試料は並行して得ることができる。複数の試料は同時に得ることができる。複数の試料は逐次的に得ることができる。複数の試料は、1つまたは複数の異なる試料を得てから、数年、100年、10年、5年、4年、3年、2年または1年にわたって得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから約1年以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから、12ヶ月、11ヶ月、10ヶ月、9ヶ月、8ヶ月、7ヶ月、6ヶ月、4ヶ月、3ヶ月、2ヶ月または1ヶ月以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから、30日、28日、26日、24日、21日、20日、18日、17日、16日、15日、14日、13日、12日、11日、10日、9日、8日、7日、6日、5日、4日、3日、2日または1日以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから、約24時間、22時間、20時間、18時間、16時間、14時間、12時間、10時間、8時間、6時間、4時間、2時間または1時間以内に得ることができる。1つまたは複数の試料は、1つまたは複数の異なる試料を得てから、約60秒、45秒、30秒、20秒、10秒、5秒、2秒、または1秒以内に得ることができる。1つまたは複数の試料は1つまたは複数の異なる試料を得てから、1秒未満以内に得ることができる。
試料の異なるポリヌクレオチドは、試料中に異なる濃度または異なる量で存在することができる。例えば、あるポリヌクレオチドの濃度または量は、試料中の別のポリヌクレオチドの濃度または量より大きい場合がある。いくつかの態様において、試料中の少なくとも1つのポリヌクレオチドの濃度または量は、試料中の少なくとも1つの他のポリヌクレオチドの濃度または量の少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍、またはそれ以上である。別の例では、1つのポリヌクレオチドの濃度または量が、試料中の別のポリヌクレオチドの濃度または量より少ない。試料中の少なくとも1つのポリヌクレオチドの濃度または量は、試料中の少なくとも1つの他のポリヌクレオチドの濃度または量の、多くても約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000分の1、またはそれ未満でありうる。
いくつかの態様において、2つまたはそれ以上の試料は異なる量または濃度のポリヌクレオチドを含有しうる。いくつかの態様において、ある試料中のあるポリヌクレオチドの濃度または量は、異なる試料中の同じポリヌクレオチドより大きい濃度または量を有しうる。例えば、血液試料は、尿試料より多量の特定ポリヌクレオチドを含有するかも知れない。あるいは、単一の試料を2つまたはそれ以上の部分試料に分割することができる。部分試料は異なる量または濃度の同じポリヌクレオチドを含有しうる。ある試料中の少なくとも1つのポリヌクレオチドの濃度または量は、別の試料中の同じポリヌクレオチドの濃度または量の少なくとも約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000倍、またはそれ以上でありうる。あるいは、ある試料中のあるポリヌクレオチドの濃度または量は、異なる試料中の同じポリヌクレオチドの濃度または量より少ないだろう。例えば、ある試料中の少なくとも1つのポリヌクレオチドの濃度または量は、別の試料中の同じポリヌクレオチドの濃度または量の、多くても約1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000分の1、またはそれ未満でありうる。
全血試料
いくつかの態様において、試料は全血である。いくつかの態様において、全血試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージは、精製ポリヌクレオチド試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージに等しい。いくつかの態様において、全血試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージは、精製ポリヌクレオチド試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージより約1%、2%、3%、4%、5%、6%、7%、8%、9%未満低いか、または最大で10%低いに過ぎない。いくつかの態様において、全血試料から観察されるオンターゲット特異性は、精製ポリヌクレオチド試料から観察されるオンターゲット特異性に等しい。いくつかの態様において、全血試料から観察されるオンターゲット特異性は、精製ポリヌクレオチド試料から観察されるオンターゲット特異性より約1%、2%、3%、4%、5%、6%、7%、8%、9%未満低いか、または最大で10%低いに過ぎない。いくつかの態様において、全血試料から観察される被覆度均一性は、精製ポリヌクレオチド試料から観察される被覆度均一性に等しい。いくつかの態様において、全血試料から観察される被覆度均一性は、精製ポリヌクレオチド試料から観察される被覆度の均一性より約1%、2%、3%、4%、5%、6%、7%、8%、9%未満低いか、または最大で10%低いに過ぎない。
FFPE試料
いくつかの態様において、試料はホルマリン固定パラフィン包埋(FFPE)試料である。いくつかの態様において、FFPE試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージは、精製ポリヌクレオチド試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージに等しい。いくつかの態様において、FFPE試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージは、精製ポリヌクレオチド試料から作製される10個またはそれ以上のUIDを含有するアンプリコンのパーセンテージより約1%、2%、3%、4%、5%、6%、7%、8%、9%未満低いか、または最大で10%低いに過ぎない。いくつかの態様において、FFPE試料から観察されるオンターゲット特異性は精製ポリヌクレオチド試料から観察されるオンターゲット特異性に等しい。いくつかの態様において、FFPE試料から観察されるオンターゲット特異性は、精製ポリヌクレオチド試料から観察されるオンターゲット特異性より約1%、2%、3%、4%、5%、6%、7%、8%、9%未満低いか、または最大で10%低いに過ぎない。いくつかの態様において、FFPE試料から観察される被覆度均一性は、精製ポリヌクレオチド試料から観察される被覆度均一性に等しい。いくつかの態様において、FFPE試料から観察される被覆度均一性は、精製ポリヌクレオチド試料から観察される被覆度均一性より約1%、2%、3%、4%、5%、6%、7%、8%、9%未満低いか、または最大で10%低いに過ぎない。
ライブラリー
本明細書において開示するライブラリーは、さまざまな応用において使用することができる。本明細書において使用する場合、ライブラリーは複数の分子を含む。いくつかの態様において、ライブラリーは、複数のポリヌクレオチドを含む。いくつかの態様において、ライブラリーは複数のプライマーを含む。いくつかの態様において、ライブラリーは複数のRTプライマーを含む。いくつかの態様において、ライブラリーは複数のPEプライマーを含む。いくつかの態様において、ライブラリーは複数の線形プライマー伸長(LPE)プライマーを含む。いくつかの態様において、ライブラリーは複数のアダプターを含む。いくつかの態様において、ライブラリーは、線形増幅などの非指数関数的増幅のための複数のプライマーを含む。いくつかの態様において、ライブラリーは、PCRなどの指数関数的増幅のための複数のプライマーを含む。いくつかの態様において、ライブラリーは、シーケンシングのための複数のポリヌクレオチドを含む。例えばライブラリーは、シーケンシング応用に使用することができるだろう。いくつかの態様において、ライブラリーは、1つまたは複数のポリヌクレオチド、アンプリコン、またはアンプリコンセット由来の複数の配列リードを含む。ライブラリーは保存して、解析用の試料を作製するために複数回使用することができる。いくつかの応用として、例えば多型のジェノタイピング、RNAプロセシングの研究、および本明細書において提供する方法に従ってシーケンシングを行うための代表クローンの選択が挙げられる。シーケンシング用もしくは増幅用のプライマーまたはライブラリーなどの複数のポリヌクレオチドを含むライブラリーを作製することができ、複数のポリヌクレオチドが、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、または900個のUIDまたはユニークポリヌクレオチドを含む。いくつかの態様において、ポリヌクレオチドのライブラリーは、複数の少なくとも約1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000個、またはそれ以上のユニークポリヌクレオチドを含み、各ユニークポリヌクレオチドはUIDを含む。いくつかの態様において、ポリヌクレオチドのライブラリーは複数のアンプリコンセットを含み、各アンプリコンセットは同じUIDを持つ複数のポリヌクレオチドを含む。いくつかの態様において、ポリヌクレオチドのライブラリーは、複数の少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、100、200、300、40、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000個、またはそれ以上のアンプリコンを含み、1つまたは複数のアンプリコン中の各ポリヌクレオチドは、同じUIDを持つ複数のポリヌクレオチドを含む。いくつかの態様において、ポリヌクレオチドのライブラリーは、複数の少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000個、またはそれ以上のアンプリコンセットを含み、各アンプリコンセットは同じUIDを持つ複数のポリヌクレオチドまたはアンプリコンを含む。いくつかの態様において、ポリヌクレオチドのライブラリーは、複数の少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000個、またはそれ以上のポリヌクレオチド、アンプリコンまたはアンプリコンセットを含み、各ポリヌクレオチド、アンプリコンまたはアンプリコンセットは、同じテンプレート配列またはその一部分を持つ複数のポリヌクレオチド、アンプリコンまたはアンプリコンセットを含む。いくつかの態様において、ポリヌクレオチドのライブラリーは、複数の少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000個、またはそれ以上のポリヌクレオチド、アンプリコンまたはアンプリコンセットを含み、各ポリヌクレオチド、アンプリコンまたはアンプリコンセットは、増幅エラーもしくはシーケンシングエラーまたは増幅バイアスもしくはシーケンシングバイアスを原因とする1塩基またはそれ以上によって1つまたは複数の他のポリヌクレオチド、アンプリコンまたはアンプリコンセットとは異なっているテンプレート配列またはその一部分を含む複数のポリヌクレオチド、アンプリコンまたはアンプリコンセットを含む。
プライマー
本明細書において開示する方法の1つまたは複数の反応を行う工程は、1つまたは複数のプライマーの使用を含むことができる。本明細書において使用する場合、プライマーは、テンプレートポリヌクレオチドに対してハイブリダイズするのに十分な相補性を有する二本鎖、一本鎖、または部分的に一本鎖のオリゴヌクレオチドを含む。テンプレートポリヌクレオチドに結合する前は、プライマーは一本鎖DNAであることができる。いくつかの態様では、プライマーは最初は二本鎖配列を含む。プライマー部位は、テンプレートのうちプライマーがハイブリダイズする領域を含む。いくつかの態様において、プライマーは、鋳型指示核酸合成の開始点として作用する能力を有する。例えばプライマーは、4つの異なるヌクレオチドと重合剤または酵素、例えばDNAポリメラーゼもしくはRNAポリメラーゼまたは逆転写酵素を加えると、鋳型指示核酸合成を開始させることができる。プライマー対は、2つのプライマー、すなわち、テンプレート配列の5'端とハイブリダイズする5'上流領域を持つ第1のプライマーと、テンプレート配列の3'端の相補鎖とハイブリダイズする3'下流領域を持つ第2のプライマーとを含む。いくつかの態様において、プライマーは、標的特異的配列およびUID配列を含む。いくつかの態様において、プライマーはバーコード配列を含む。いくつかの態様において、プライマーはUID配列を含む。いくつかの態様において、プライマーは試料バーコード配列を含む。いくつかの態様において、プライマーはユニバーサルプライミング配列を含む。いくつかの態様において、プライマーはPCRプライミング配列を含む。いくつかの態様において、プライマーは、ポリヌクレオチドの増幅を開始させるために使用されるPCRプライミング配列を含む(Dieffenbach, PCR Primer: A Laboratory Manual,第2版(Cold Spring Harbor Press, ニューヨーク(2003))。ユニバーサルプライマー結合部位またはユニバーサルプライマー結合配列は、ポリペプチドおよび/またはアンプリコンへのユニバーサルプライマーの付着を可能にする。ユニバーサルプライマーは当技術分野において周知であり、例えば-47F(M13F)、アルファMF、AOX3'、AOX5'、BGHr、CMV-30、CMV-50、CVMf、LACrmt、ラムダgt10F、ラムダgt10R、ラムダgt11F、ラムダgt11R、M13 rev、M13Forward(-20)、M13Reverse、male、p10SEQPpQE、pA-120、pet4、pGAP Forward、pGLRVpr3、pGLpr2R、pKLAC14、pQEFS、pQERS、pucU1、pucU2、reversA、seqIREStam、seqIRESzpet、seqori、seqPCR、seqpIRES-、seqpIRES+、seqpSecTag、seqpSecTag+、seqretro+PSI、SP6、T3-prom、T7-prom、およびT7-termInvが挙げられるが、それらに限定されるわけではない。本明細書において使用する場合、付着とは、共有結合的相互作用および非共有結合的相互作用の両方またはどちらか一方を指すことができる。ユニバーサルプライマー結合部位へのユニバーサルプライマーの付着は、ポリヌクレオチドおよび/またはアンプリコンの増幅、検出、および/またはシーケンシングに使用することができる。ユニバーサルプライマー結合部位は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、または1000個のヌクレオチドまたは塩基対を含みうる。別の例において、ユニバーサルプライマー結合部位は、少なくとも約1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、または10000個のヌクレオチドまたは塩基対を含む。いくつかの態様において、ユニバーサルプライマー結合部位は、1〜10、10〜20、10〜30または10〜100個のヌクレオチドまたは塩基対を含む。いくつかの態様において、ユニバーサルプライマー結合部位は、約1〜90、1〜80、1〜70、1〜60、1〜50、1〜40、1〜30、1〜20、1〜10、2〜90、2〜80、2〜70、2〜60、2〜50、2〜40、2〜30、2〜20、2〜10、1〜900、1〜800、1〜700、1〜600、1〜500、1〜400、1〜300、1〜200、1〜100、2〜900、2〜800、2〜700、2〜600、2〜500、2〜400、2〜300、2〜200、2〜100、5〜90、5〜80、5〜70、5〜60、5〜50、5〜40、5〜30、5〜20、5〜10、10〜90、10〜80、10〜70、10〜60、10〜50、10〜40、10〜30、10〜20、10〜10、5〜900、5〜800、5〜700、5〜600、5〜500、5〜400、5〜300、5〜200、5〜100、10〜900、10〜800、10〜700、10〜600、10〜500、10〜400、10〜300、10〜200、10〜100、25〜900、25〜800、25〜700、25〜600、25〜500、25〜400、25〜300、25〜200、25〜100、100〜1000、100〜900、100〜800、100〜700、100〜600、100〜500、100〜400、100〜300、100〜200、200〜1000、200〜900、200〜800、200〜700、200〜600、200〜500、200〜400、200〜300、300〜1000、300〜900、300〜800、300〜700、300〜600、300〜500、300〜400、400〜1000、400〜900、400〜800、400〜700、400〜600、400〜500、500〜1000、500〜900、500〜800、500〜700、500〜600、600〜1000、600〜900、600〜800、600〜700、700〜1000、700〜900、700〜800、800〜1000、800〜900、または900〜1000個のヌクレオチドまたは塩基対を含む。
プライマーは、プライマー伸長産物の合成におけるその使用に適合する長さを有することができる。プライマーは、8〜200ヌクレオチド長のポリヌクレオチドであることができる。プライマーの長さは、テンプレートポリヌクレオチドの配列およびテンプレートの遺伝子座に依存しうる。例えばプライマーまたはプライマーセットの長さおよび/または融解温度(Tm)は最適化することができる。ある場合には、プライマーは、約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、または60ヌクレオチド長であるか、それを上回るか、またはそれ未満であることができる。いくつかの態様において、プライマーは約8〜100ヌクレオチド長、例えば10〜75、15〜60、15〜40、18〜30、20〜40、21〜50、22〜45、25〜40、7〜9、12〜15、15〜20、15〜25、15〜30、15〜45、15〜50、15〜55、15〜60、20〜25、20〜30、20〜35、20〜45、20〜50、20〜55、または20〜60ヌクレオチド長およびその間の任意の長さである。いくつかの態様において、プライマーは、最大で約10、12、15、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80、85、90、95、または100ヌクレオチド長である。
一般に、1対または複数対のプライマーは、指数関数的増幅反応において使用することができる。この際、プライマー対の一方のプライマーはフォワードプライマーであることができ、プライマー対の一方のプライマーはリバースプライマーであることができる。いくつかの態様において、第1のプライマー対は指数関数的増幅反応に使用することができ;第1の対の一方のプライマーは第1のテンプレートポリヌクレオチド分子の配列に相補的なフォワードプライマーであることができ、第1の対の一方のプライマーは、第1のテンプレートポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることができ、第1のテンプレート遺伝子座は第1の配列と第2の配列の間に存在することができる。いくつかの態様では、第2のプライマー対を増幅反応に使用することができる。この際、第2の対の一方のプライマーは第2の標的ポリヌクレオチド分子の第1の配列に相補的なフォワードプライマーであることができ、第2の対の一方のプライマーは第2の標的ポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることができ、第2の標的遺伝子座は第1の配列と第2の配列の間に存在することができる。いくつかの態様において、第2の標的遺伝子座は可変軽鎖抗体配列を含む。いくつかの態様では、第3のプライマー対を増幅反応に使用することができる。この際、第3の対の一方のプライマーは第3のテンプレートポリヌクレオチド分子の第1の配列に相補的なフォワードプライマーであることができ、第3の対の一方のプライマーは第3のテンプレートポリヌクレオチド分子の第2の配列に相補的なリバースプライマーであることができ、第3のテンプレート遺伝子座は第1の配列と第2の配列の間に存在することができる。いくつかの態様において、第1、第2、または第3のテンプレート遺伝子座は、UIDなどのバーコードを含む。
1つまたは複数のプライマーは、複数のテンプレートポリヌクレオチドの少なくとも一部分にアニールすることができる。1つまたは複数のプライマーは、複数のテンプレートポリヌクレオチドの3'端および/または5'端にアニールすることができる。1つまたは複数のプライマーは、複数のテンプレートポリヌクレオチドの内部領域にアニールすることができる。内部領域は、複数のテンプレートポリヌクレオチドの3'端または5'端から、少なくとも約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900または1000ヌクレオチドであることができる。1つまたは複数のプライマーは、固定されたプライマーのパネルを含むことができる。1つまたは複数のプライマーは、少なくとも1つまたは複数のカスタムプライマーを含むことができる。1つまたは複数のプライマーは、少なくとも1つまたは複数の対照プライマーを含むことができる。1つまたは複数のプライマーは、少なくとも1つまたは複数のハウスキーピング遺伝子プライマーを含むことができる。1つまたは複数のプライマーはユニバーサルプライマーを含むことができる。ユニバーサルプライマーはユニバーサルプライマー結合部位にアニールすることができる。いくつかの態様において、1つまたは複数のカスタムプライマーは、UIDにアニールしない。いくつかの態様において、1つまたは複数のカスタムプライマーはSBC、標的特異的領域、それらの相補鎖、またはそれらの任意の組合せにアニールする。1つまたは複数のプライマーは、ユニバーサルプライマーおよびUID含有プライマーを含むことができる。1つまたは複数の標的またはテンプレートポリヌクレオチドを増幅し、またはそのプライマー伸長、逆転写、線形伸長、非指数関数的増幅、指数関数的増幅、PCR、または他の任意の増幅法を行うために、1つまたは複数のプライマーを設計することができる。
標的特異的領域は、少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900または1000個のヌクレオチドまたは塩基対を含むことができる。別の例において、標的特異的領域は、少なくとも約1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、または10000個のヌクレオチドまたは塩基対を含む。いくつかの態様において、標的特異的領域は、約5〜10、10〜15、10〜20、10〜30、15〜30、10〜75、15〜60、15〜40、18〜30、20〜40、21〜50、22〜45、25〜40、7〜9、12〜15、15〜20、15〜25、15〜30、15〜45、15〜50、15〜55、15〜60、20〜25、20〜30、20〜35、20〜45、20〜50、20〜55、20〜60、2〜900、2〜800、2〜700、2〜600、2〜500、2〜400、2〜300、2〜200、2〜100、25〜900、25〜800、25〜700、25〜600、25〜500、25〜400、25〜300、25〜200、25〜100、100〜1000、100〜900、100〜800、100〜700、100〜600、100〜500、100〜400、100〜300、100〜200、200〜1000、200〜900、200〜800、200〜700、200〜600、200〜500、200〜400、200〜300、300〜1000、300〜900、300〜800、300〜700、300〜600、300〜500、300〜400、400〜1000、400〜900、400〜800、400〜700、400〜600、400〜500、500〜1000、500〜900、500〜800、500〜700、500〜600、600〜1000、600〜900、600〜800、600〜700、700〜1000、700〜900、700〜800、800〜1000、800〜900、または900〜1000個のヌクレオチドまたは塩基対を含む。
プライマーは、二次構造および自己ハイブリダイゼーションを回避するために、公知のパラメータに従って設計することができる。いくつかの態様において、異なるプライマー対は、ほぼ同じ温度で、例えば別のプライマー対とは1、2、3、4、5、6、7、8、9または10℃以内の差で、アニールし、融解することができる。いくつかの態様において、複数のプライマー中の1つまたは複数のプライマーは、ほぼ同じ温度で、例えば複数のプライマー中の別のプライマーとは1、2、3、4、5、6、7、8、9または10℃以内の差で、アニールし、融解することができる。いくつかの態様において、複数のプライマー中の1つまたは複数のプライマーは、複数のプライマー中の別のプライマーとは異なる温度で、アニールし、融解することができる。
本明細書に記載する方法の1つまたは複数の工程のための複数のプライマーは、約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000個、多くても約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000個、または少なくとも約1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、15,000、16,000、17,000、18,000、19,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000、50,000,000、100,000,000個の異なるプライマーを含む複数のプライマーを含むことができる。例えば、複数のプライマー中の各プライマーはUIDを含むことができる。例えば、複数のプライマー中の各プライマーは、異なる標的またはテンプレート特異的領域または配列を含むことができる。例えば、複数のプライマー中の各プライマーは、異なるUIDおよび異なる標的またはテンプレート特異的領域または配列を含むことができる。例えば、複数のプライマー中の各プライマーは、異なるUIDおよび同じ標的またはテンプレート特異的領域または配列を含むことができる。
プライマーパネル
いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、60℃〜68℃の融解温度範囲を持つプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、21〜32ヌクレオチドの長さを持つプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、3'端にある最後の5つのヌクレオチド中に4つまたはそれ以上のピリミジンを含有しないプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、30%〜70%のGC含量を含有するアンプリコンが生成するように設計されたプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、225〜300塩基対の長さを持つアンプリコンが生成するように設計されたプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、初回RT/PE工程または線形伸長/増幅工程中の読み間違い数(ミスプライミングが引き起こすもの)が最も高いプライマーを除外した初期パネル由来のプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、二量体に広く認められるプライマーを除外した初期パネル由来のプライマーを含むか、またはそのようなプライマーからなる。いくつかの態様において、本明細書に記載する方法に使用されるプライマーパネルは、ある標的に関して最も高い総リード数の1つまたは複数を生じる原因となるプライマー(過剰増幅因子(over-amplifier))を除外した初期パネル由来のプライマーを含むか、またはそのようなプライマーからなる。記載の方法において使用するためのプライマーパネルの作成には、上記の測定規準の任意の1つまたは任意の組合せを使用することができる。
UID
いくつかの態様において、SBCまたはUIDなどのバーコードは、それぞれ4〜36ヌクレオチド、または6〜30ヌクレオチド、または8〜20ヌクレオチドの範囲内の長さを有することができる。ある特定の局面において、セット内のバーコードの融解温度は互いに10℃以内、互いに5℃以内、または互いに2℃以内である。別の局面において、バーコードは、最小クロスハイブリダイゼーションセット(minimally cross-hybridizing set)のメンバーである。例えば、そのようなセットの各メンバーのヌクレオチド配列は、ストリンジェントなハイブリダイゼーション条件下で他のどのメンバーの相補鎖とも安定な二重結合を形成することができない程度に、そのセットの他のどのメンバーとも十分に相違しうる。いくつかの態様において、最小クロスハイブリダイゼーションセットの各メンバーのヌクレオチド配列は、他のどのメンバーのヌクレオチド配列とも、少なくとも2つのヌクレオチドは異なる。バーコード技術はWinzeler et al.(1999)Science 285:901; Brenner(2000)Genome Biol.1:1 Kumar et al.(2001)Nature Rev. 2:302; Giaever et al.(2004)Proc. Natl. Acad. Sci. USA 101:793; Eason et al.(2004)Proc. Natl. Acad. Sci. USA 101:11046;およびBrenner(2004)Genome Biol. 5:240に記載されている。
本明細書において使用する場合、ユニーク識別タグ(UID)は、複数の分子または分子のライブラリーの単一分子または2つもしくはそれ以上の分子にユニークな情報を含む。バーコードはUIDであることができる。いくつかの態様において、ユニーク情報は、ヌクレオチドのユニーク配列を含む。例えば、UIDの配列は、UIDを含むヌクレオチドのユニーク配列またはランダム配列の実体および順序を決定することによって決定することができる。いくつかの態様では、標的ポリヌクレオチドの配列を同定するためにユニーク情報を使用することはできない。いくつかの態様において、ユニーク情報は、標的ポリヌクレオチドの配列の実体とリンクされた既知の配列ではない。例えば、UIDは1つまたは複数の標的ポリヌクレオチドに付着することはできるが、UIDは、それが付着している1つまたは複数の標的ポリヌクレオチドのうちのどれであるかを決定するために、使用されることはできない。いくつかの態様において、ユニーク情報はヌクレオチドのランダム配列を含む。いくつかの態様において、ユニーク情報は、ポリヌクレオチド上のヌクレオチドの1つまたは複数のユニーク配列を含む。いくつかの態様において、ユニーク情報は縮重ヌクレオチド配列または縮重バーコードを含む。縮重バーコードは、可変ヌクレオチド塩基組成または配列を含むことができる。例えば、縮重バーコードはランダム配列であることができる。いくつかの態様では、UIDの相補配列もUID配列である。
UIDは、任意の長さのヌクレオチドを含むことができる。例えばUIDは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチドを含むことができる。例えばUIDは、最大で約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチドを含むことができる。いくつかの態様において、UIDは特定の長さのヌクレオチドを有する。例えば、UIDは約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。
いくつかの態様において、複数のUID中の各UIDは、少なくとも約2つのヌクレオチドを有する。例えば、複数のUID中の各UIDは、少なくとも約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。いくつかの態様において、複数のUID中の各UIDは、最大で約1000個のヌクレオチドを有する。例えば、複数のUID中の各UIDは、最大で約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチド長であることができる。いくつかの態様において、複数のUID中の各UIDはヌクレオチドの長さが同じである。例えば、複数のUID中の各UIDは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000ヌクレオチド長であることができる。いくつかの態様において、複数のUID中の1つまたは複数のUIDはヌクレオチドの長さが異なる。例えば、複数のUID中の1つまたは複数の第1のUIDは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチド、または少なくともその数のヌクレオチドを有することができ、複数のUID中の1つまたは複数の第2のUIDは、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500、または1000個のヌクレオチドを有することができ1つまたは複数の第1のUIDのヌクレオチド数は1つまたは複数の第2のUIDとは異なる。
UIDの数は、標識されるべき分子の数を上回っていることができる。いくつかの態様において、UIDの数は、標識されるべき分子の数の少なくとも約2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
異なるUIDの数は、標識されるべき異なる分子の数を上回っていることができる。いくつかの態様において、異なるUIDの数は、標識されるべき異なる分子の数の少なくとも約1、1.5、2、2.5、3、3.5、4、4.5、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、または100倍である。
いくつかの態様において、異なるUIDの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、同じ濃度を有する。いくつかの態様において、異なるUIDの少なくとも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、または100%は、異なる濃度を有する。
UIDの集団内のUIDは、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000個、またはそれ以上の異なる配列を有することができる。例えば集団内のUIDは、少なくとも2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000個、またはそれ以上の異なる配列を有することができる。したがって、1つまたは複数のポリヌクレオチド、例えば標的ポリヌクレオチドから、少なくとも10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000個、またはそれ以上の異なる配列を作製するために、複数のUIDを使用することができる。例えば、1つまたは複数のポリヌクレオチド、例えば標的ポリヌクレオチドから、少なくとも2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、9×1012個、またはそれ以上の異なる配列を作製するために、複数のUIDを使用することができる。例えば、少なくとも約10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、9×1012個、またはそれ以上の標的ポリヌクレオチドから、少なくとも約10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1×106、2×106、3×106、4×106、5×106、6×106、7×106、8×106、9×106、1×107、2×107、3×107、4×107、5×107、6×107、7×107、8×107、9×107、1×108、2×108、3×108、4×108、5×108、6×108、7×108、8×108、9×108、1×109、2×109、3×109、4×109、5×109、6×109、7×109、8×109、9×109、1×1010、2×1010、3×1010、4×1010、5×1010、6×1010、7×1010、8×1010、9×1010、1×1011、2×1011、3×1011、4×1011、5×1011、6×1011、7×1011、8×1011、9×1011、1×1012、2×1012、3×1012、4×1012、5×1012、6×1012、7×1012、8×1012、9×1012個、またはそれ以上の異なる配列を作製するために、複数のUIDを使用することができる。
いくつかの態様において、1つまたは複数のUIDは、配列をグループ化またはビン化するために使用される。いくつかの態様において、1つまたは複数のUIDは、配列をグループ化またはビン化するために使用され、各ビン中の配列は同じUIDを含有する。いくつかの態様において、1つまたは複数のUIDは、配列をグループ化またはビン化するために使用され、各ビン中の配列はアンプリコンセットを含む。いくつかの態様において、1つまたは複数のUIDは配列をグループ化またはビン化するために使用され、各ビン中の配列は複数の配列を含み、その複数の配列が作製される元となったポリヌクレオチドは、増幅反応において同じポリヌクレオチドに由来したものである。例えば、1つまたは複数のUIDは、アンプリコンもしくはアンプリコンセットまたはその両方における配列をグループ化またはビン化するために使用することができる。いくつかの態様において、1つまたは複数のUIDは、配列をアラインメントするためには使用されない。
いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするためには使用されない。いくつかの態様において、1つまたは複数のUIDは、配列をアラインメントするためには使用されず、配列をグループ化またはビン化するために使用される。いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするためには使用されず、標的特異的領域が配列をアラインメントするために使用される。いくつかの態様において、1つまたは複数のUIDは配列をグループ化またはビン化するために使用され、標的特異的領域は配列をアラインメントするために使用される。いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするためには使用されず、1つまたは複数のUIDは配列をグループ化またはビン化するために使用され、標的特異的領域は配列をアラインメントするために使用される。
いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするために使用される。いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするために使用され、アラインメントされる配列は同じUIDを含有する。いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするために使用され、アラインメントされる配列は、あるアンプリコンセット由来の2つまたはそれ以上の配列を含む。いくつかの態様において、1つまたは複数のUIDは配列をアラインメントするために使用され、アラインメントされる配列は複数の配列を含み、その複数の配列が作製される元となったポリヌクレオチドは、増幅反応において同じポリヌクレオチドに由来したものである。
酵素
本明細書において開示する方法およびキットは1つまたは複数の酵素を含みうる。酵素の例として、リガーゼ、逆転写酵素、ポリメラーゼ、および制限ヌクレアーゼが挙げられるが、それらに限定されるわけではない。
いくつかの態様において、ポリヌクレオチドへのアダプターの付着は1つまたは複数のリガーゼの使用を含む。リガーゼの例としては、DNAリガーゼI、DNAリガーゼIII、DNAリガーゼIV、およびT4 DNAリガーゼなどのDNAリガーゼ、ならびにT4 RNAリガーゼIおよびT4 RNAリガーゼIIなどのRNAリガーゼが挙げられるが、それらに限定されるわけではない。
本明細書において開示する方法およびキットはさらに、1つまたは複数の逆転写酵素の使用を含みうる。いくつかの態様において、逆転写酵素はHIV-1逆転写酵素、M-MLV逆転写酵素、AMV逆転写酵素、およびテロメラーゼ逆転写酵素である。いくつかの態様において、逆転写酵素はM-MLV逆転写酵素である。
いくつかの態様において、本明細書において開示する方法およびキットは、1つまたは複数のポリメラーゼの使用を含む。ポリメラーゼの例としては、DNAポリメラーゼおよびRNAポリメラーゼが挙げられるが、それらに限定されるわけではない。いくつかの態様において、DNAポリメラーゼはDNAポリメラーゼI、DNAポリメラーゼII、DNAポリメラーゼIIIホロ酵素、およびDNAポリメラーゼIVである。市販のDNAポリメラーゼとしては、Bst 2.0 DNAポリメラーゼ、Bst 2.0 WarmStart(商標)DNAポリメラーゼ、Bst DNAポリメラーゼ、Sulfolobus DNAポリメラーゼIV、Taq DNAポリメラーゼ、9°N(商標)m DNAポリメラーゼ、Deep VentR(商標)(エキソ-)DNAポリメラーゼ、Deep VentR(商標)DNAポリメラーゼ、Hemo KlenTaq(商標)、LongAmp(登録商標)Taq DNAポリメラーゼ、OneTaq(登録商標)DNAポリメラーゼ、Phusion(登録商標)DNAポリメラーゼ、Q5(商標)High-Fidelity DNAポリメラーゼ、Therminator(商標)γ DNAポリメラーゼ、Therminator(商標)DNAポリメラーゼ、Therminator(商標)II DNAポリメラーゼ、Therminator(商標)III DNAポリメラーゼ、VentR(登録商標)DNAポリメラーゼ、VentR(登録商標)(エキソ-)DNAポリメラーゼ、Bsu DNAポリメラーゼ、phi29 DNAポリメラーゼ、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、ターミナルトランスフェラーゼ、Titanium(登録商標)Taqポリメラーゼ、KAPA Taq DNAポリメラーゼおよびKAPA Taq Hot Start DNAポリメラーゼが挙げられるが、それらに限定されるわけではない。
いくつかの態様において、ポリメラーゼは、RNAポリメラーゼI、RNAポリメラーゼII、RNAポリメラーゼIII、大腸菌ポリ(A)ポリメラーゼ、phi6 RNAポリメラーゼ(RdRP)、ポリ(U)ポリメラーゼ、SP6 RNAポリメラーゼ、およびT7 RNAポリメラーゼなどのRNAポリメラーゼである。
追加の試薬
本明細書において開示する方法およびキットは、1つまたは複数の試薬の使用を含みうる。試薬の例としては、PCR試薬、ライゲーション試薬、逆転写試薬、酵素試薬、ハイブリダイゼーション試薬、試料調製試薬、アフィニティ捕捉試薬、ビーズなどの固形支持体、核酸精製および/または単離用の試薬が挙げられるが、それらに限定されるわけではない。
固形支持体には事実上任意の不溶性または固形材料が含まれ、水に不溶性である固形支持体組成物が選択されることが多い。例えば、固形支持体は、以下の物質を含むか、または本質的に以下の物質からなることができる:シリカゲル、ガラス(例えばコントロールドポアガラス(CPG))、ナイロン、Sephadex(登録商標)、Sepharose(登録商標)、セルロース、金属表面(例えば鋼、金、銀、アルミニウム、ケイ素および銅)、磁気材料、プラスチック材料(例えばポリエチレン、ポリプロピレン、ポリアミド、ポリエステル、ポリビニリデンジフルオリド(PVDF))など。態様に従って使用するためのビーズの例は、ビーズが核酸分子と相互作用することを可能にするアフィニティ部分を含みうる。固相(例えばビーズ)は、結合対のメンバー(例えばアビジン、ストレプトアビジンまたはそれらの誘導体)を含むことができる。例えばビーズは、ストレプトアビジン被覆ビーズであってもよく、そのビーズ上に固定化される核酸分子はビオチン部分を含むことができる。いくつかの例において、各ポリヌクレオチド分子は、ポリヌクレオチドをさらに安定化するために、ビオチンなどのアフィニティ部分を2つ含むことができる。ビーズは、核酸の固定化に使用するための追加の特徴、または下流のスクリーニング工程または選択工程において使用することができる追加の特徴を含むことができる。例えばビーズは、結合部分、蛍光標識、または蛍光クエンチャーを含んでもよい。いくつかの例において、ビーズは磁気ビーズであることができる。いくつかの例において、固形支持体はビーズである。ビーズの例としては、ストレプトアビジンビーズ、アガロースビーズ、磁気ビーズ、Dynabeads(登録商標)、MACS(登録商標)マイクロビーズ、抗体コンジュゲートビーズ(例えば抗免疫グロブリンマイクロビーズ)、プロテインAコンジュゲートビーズ、プロテインGコンジュゲートビーズ、プロテインA/Gコンジュゲートビーズ、プロテインLコンジュゲートビーズ、オリゴdTコンジュゲートビーズ、シリカビーズ、シリカ様ビーズ、抗ビオチンマイクロビーズ、抗フルオロクロムマイクロビーズ、およびBcMag(商標)カルボキシ末端磁気ビーズが挙げられるが、それらに限定されるわけではない。ビーズおよび粒子は、膨潤性(例えばワングレジンなどのポリマービーズ)であっても、非膨潤性(例えばCPG)であってもよい。いくつかの態様において、固相は実質的に親水性である。いくつかの態様において、固相(例えばビーズ)は、実質的に疎水性である。いくつかの態様において、固相は、結合対のメンバー(例えばアビジン、ストレプトアビジンまたはそれらの誘導体)を含み、実質的に疎水性または実質的に親水性である。いくつかの態様において、固相は、結合対のメンバー(例えばアビジン、ストレプトアビジンまたはそれらの誘導体)を含み、固形支持体1mgあたり遊離の捕捉作用物質(例えば遊離のビオチン)約1350pmolを上回る結合能を有する。いくつかの態様において、結合対のメンバーを含む固相の結合能は、固形支持体1mgあたり遊離の捕捉作用物質800、900、1000、1100、1200、1250、1300、1350、1400、1450、1500、1600、1800、2000pmolを上回る。本発明に適したビーズの他の例は、金コロイド、またはポリスチレンビーズもしくはシリカビーズなどのビーズである。実質上任意のビーズ半径を使用しうる。ビーズの例には、150ナノメートルから10マイクロメートルまでの範囲の半径を有するビーズを挙げることができる。他のサイズも使用しうる。
本明細書において開示する方法およびキットは、1つまたは複数の緩衝液の使用を含みうる。緩衝液の例としては、洗浄緩衝液、ライゲーション緩衝液、ハイブリダイゼーション緩衝液、増幅緩衝液、および逆転写緩衝液が挙げられるが、それらに限定されるわけではない。いくつかの態様において、ハイブリダイゼーション緩衝液は、TMAC Hyb溶液、SSPEハイブリダイゼーション溶液、およびECONO(商標)ハイブリダイゼーション緩衝液などの市販の緩衝液である。本明細書において開示する緩衝液は、1つまたは複数の洗浄剤を含みうる。
本明細書において開示する方法およびキットは、1つまたは複数の担体の使用を含みうる。担体は、本明細書において開示する1つまたは複数の反応(例えばライゲーション反応、逆転写、増幅、ハイブリダイゼーション)の効率を強化または改良しうる。担体は、分子またはその任意の産物(例えばポリヌクレオチドおよび/またはアンプリコン)の非特異的喪失を減少させまたは防止しうる。例えば担体は、表面への吸収によるポリヌクレオチドの非特異的喪失を減少させうる。担体は表面または基材(例えば容器、エッペンドルフチューブ、ピペットチップ)に対するポリヌクレオチドのアフィニティを減少させうる。あるいは、担体は表面または基材(例えばビーズ、アレイ、ガラス、スライド、またはチップ)に対するポリヌクレオチドのアフィニティを増加させうる。担体は、ポリヌクレオチドを分解から保護しうる。例えば担体は、RNA分子をリボヌクレアーゼから保護しうる。あるいは担体は、DNA分子をDNaseから保護しうる。担体の例としては、DNAおよび/またはRNAなどのポリヌクレオチド、またはポリペプチドが挙げられるが、それらに限定されるわけではない。DNA担体の例として、プラスミド、ベクター、ポリアデニル化DNA、およびDNAオリゴヌクレオチドが挙げられる。RNA担体の例として、ポリアデニル化RNA、ファージRNA、ファージMS2 RNA、大腸菌RNA、酵母RNA、酵母tRNA、哺乳類RNA、哺乳類tRNA、短鎖ポリアデニル化合成リボヌクレオチド、およびRNAオリゴヌクレオチドが挙げられる。RNA担体はポリアデニル化RNAであってよい。あるいは、RNA担体は非ポリアデニル化RNAであってもよい。いくつかの態様において、担体は細菌、酵母、またはウイルスに由来する。例えば担体は、細菌、酵母またはウイルスに由来するポリヌクレオチドまたはポリペプチドであってよい。例えば担体は枯草菌(Bacillus subtilis)由来のタンパク質である。別の例において、担体は大腸菌(Escherichia coli)由来のポリヌクレオチドである。あるいは、担体は、哺乳動物(例えばヒト、マウス、ヤギ、ラット、ウシ、ヒツジ、ブタ、イヌ、またはウサギ)、鳥類、両生類、または爬虫類由来のポリヌクレオチドまたはペプチドである。
本明細書において開示する方法およびキットは、1つまたは複数の対照物質の使用を含みうる。対照物質として、対照ポリヌクレオチド、不活性酵素、および非特異的競合物質を挙げることができる。あるいは、対照物質は、ブライトハイブリダイゼーション(bright hybridization)、ブライトプローブ対照(bright probe control)、核酸テンプレート、スパイクイン(Spike-in)対照、PCR増幅対照を含む。PCR増幅対照は陽性対照であってよい。別の例では、PCR増幅対照が陰性対照である。核酸テンプレート対照は既知濃度を有しうる。対照物質は1つまたは複数の標識を含みうる。
スパイクイン対照は、反応または試料に添加されるテンプレートでありうる。例えばスパイクインテンプレートは増幅反応に添加することができる。スパイクインテンプレートは1回目の増幅サイクル後はいつでも増幅反応に添加することができる。いくつかの態様において、スパイクインテンプレートは、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、または50回のサイクル後に増幅反応に添加される。スパイクインテンプレートは、最終増幅サイクルの前ならいつでも増幅反応に添加することができる。スパイクインテンプレートは1つまたは複数のヌクレオチドまたは核酸塩基対を含みうる。スパイクインテンプレートはDNA、RNA、またはそれらの任意の組合せを含みうる。スパイクインテンプレートは1つまたは複数の標識を含みうる。
コンピュータ実装局面
当業者には理解されるとおり、本明細書に記載する方法および情報は、全部または一部を、公知のコンピュータ可読媒体上のコンピュータ実行可能命令として実装することができる。例えば本明細書に記載する方法はハードウェアに実装することができる。あるいは、本方法を、例えば1つまたは複数のメモリまたは他のコンピュータ可読媒体に格納してソフトウェアに実装し、1つまたは複数のプロセッサで実装することができる。公知のとおり、プロセッサは1つまたは複数のコントローラー、計算ユニットおよび/またはコンピュータシステムの他のユニットと関係づけるか、所望に応じてファームウェアに埋め込むことができる。ソフトウェアに実装する場合は、やはり公知であるとおり、RAM、ROM、フラッシュメモリ、磁気ディスク、レーザーディスク、または他の記憶媒体などといった任意のコンピュータ可読メモリにルーチンを格納することができる。また、このソフトウェアは、任意の送信方法によって、例えば電話線、インターネット、ワイヤレス接続などといった通信チャネルを介して、またはコンピュータ可読ディスク、フラッシュドライブなどの可搬型媒体を介して、コンピューティングデバイスに送信することができる。
より一般的には、当業者には理解されるとおり、上述のさまざまな工程を、さまざまなブロック、オペレーション、ツール、モジュールおよび技法として実装することができ、そしてそれをハードウェア、ファームウェア、ソフトウェア、またはハードウェア、ファームウェア、および/またはソフトウェアの任意の組合せに、実装することができる。ハードウェアに実装する場合、ブロック、オペレーション、技法などの一部または全部を、例えばカスタム集積回路(IC)、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、プログラマブル論理アレイ(PLA)などに実装することができる。
シーケンシングデータからの結果は、コンピュータデータベース、データ記憶ディスクを含むデータ記憶媒体などのデータ記憶ユニットに格納するか、他の好都合なデータ記憶手段によって格納することができる。ある特定の態様において、コンピュータデータベースはオブジェクトデータベース、リレーショナルデータベースまたはポストリレーショナルデータベースである。データは、任意の好都合なデータクエリ方法を使用してデータ記憶ユニットから読み出すことができる。
ソフトウェアに実装される場合、ソフトウェアは、磁気ディスク、光学ディスク、または他の記憶媒体など任意の公知コンピュータ可読媒体に格納するか、コンピュータ、プロセッサ、ハードディスクドライブ、光学ディスクドライブ、テープドライブなどのRAMもしくはROMまたはフラッシュメモリに格納することができる。またソフトウェアは、例えばコンピュータ可読ディスクまたは他の可搬型コンピュータ記憶機構を含む、公知の送信方法を介して、ユーザーまたはコンピューティングシステムに送信することができる。
特許請求する方法の工程は、数多くの他の汎用または専用コンピューティングシステム環境または構成で動作可能である。特許請求の範囲の方法またはシステムと共に使用するのに適しうる周知のコンピューティングシステム、環境、および/または構成の例としては、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、マルチプロセッサシステム、マイクロプロセッサに基づくシステム、セットトップボックス、プログラマブル家電製品、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれかを含む分散コンピューティング環境などが挙げられるが、それらに限定されるわけではない。
特許請求する方法の工程は、コンピュータによって実行される、プログラムモジュールなどのコンピュータ実行可能命令との一般的関連において説明することができる。一般にプログラムモジュールは、特定のタスクを実施するか、または特定の抽象データ型を実装する、ルーチン、プログラム、オブジェクト、コンポーネント、および/またはデータ構造を含む。本方法は、タスクが通信ネットワークによってリンクされた遠隔処理デバイスによって行われる分散コンピューティング環境で実施することもできる。統合コンピューティング環境でも分散コンピューティング環境でも、プログラムモジュールは、メモリ記憶デバイスを含むローカルコンピュータ記憶媒体および遠隔コンピュータ記憶媒体の両方に配置することができる。現在の技術または本願の出願日後に開発される技術のいずれかを使用して数多くの代替態様を実装することができ、それらもまた、本開示を規定する請求項の範囲内に包含されるであろう。
本方法および他の要素は好ましくはソフトウェアに実装されると述べたが、それらはハードウェア、ファームウェアなどに実装することができ、それらは他の任意のプロセッサによって実装することができる。したがって、本明細書に記載する要素は、標準的な多目的CPUまたは特別に設計されたハードウェアもしくはファームウェア、例えば特定用途向け集積回路(ASIC)または所望に応じて他のハードワイヤードデバイスに実装することができる。ソフトウェアに実装される場合、ソフトウェアルーチンは、任意のコンピュータ可読メモリ、例えば磁気ディスク、レーザーディスク、または他の記憶媒体、コンピュータまたはプロセッサのRAMまたはROM、任意のデータベースなどに格納することができる。また、このソフトウェアは、任意の公知のまたは望ましい送信方法によって、例えばコンピュータ可読ディスクまたは他の可搬型コンピュータ記憶機構で、または通信チャネル、例えば電話線、インターネット、またはワイヤレス通信などを介して、ユーザーまたはスクリーニングシステムに送信することができる。本明細書において説明し例示した技法および構造には、本願の要旨および範囲から逸脱することなく、改変または変更を加えることができる。
図58は、本発明の態様例に関連して使用することができるコンピュータシステム100の第1のアーキテクチャ例を図解するブロック図である。図58に示すように、このコンピュータシステム例は、命令を処理するためのプロセッサ102を含むことができる。プロセッサの非限定的な例として、Intel Xeon(商標)プロセッサ、AMD Opteron(商標)プロセッサ、Samsung 32ビットRISC ARM 1176JZ(F)-S v1.0(商標)プロセッサ、ARM Cortex-A8 Samsung S5PC100(商標)プロセッサ、ARM Cortex-A8 Apple A4(商標)プロセッサ、Marvell PXA 930(商標)プロセッサ、または機能的に等価なプロセッサが挙げられる。並列処理には多重実行スレッドを使用することができる。いくつかの態様において、単一のコンピュータシステムにあるか、クラスターにあるか、複数のコンピュータ、携帯電話、および/または携帯情報デバイスを含むネットワークを介したシステムに分散しているかを問わず、複数のプロセッサまたはマルチコアのプロセッサも使用することができる。
図59に図解するように、高速キャッシュ104を、プロセッサ102に接続するか組み込むことで、プロセッサ102が最近使用したまたは頻繁に使用する命令またはデータのための高速メモリを設けることができる。プロセッサ102はプロセッサバス108によってノースブリッジ106に接続される。ノースブリッジ106はメモリバス112によってランダムアクセスメモリ(RAM)110に接続され、プロセッサ102によるRAM110へのアクセスを管理する。ノースブリッジ106はチップセットバス116によってサウスブリッジ114にも接続される。次いでサウスブリッジ114は周辺機器用バス118に接続される。周辺機器用バスは例えばPCI、PCI-X、PCI Express、または他の周辺機器用バスであることができる。ノースブリッジおよびサウスブリッジはプロセッサチップセットと呼ばれることが多く、プロセッサ、RAMおよび周辺機器用バス118上の周辺コンポーネント間のデータ転送を管理する。いくつかの代替アーキテクチャでは、独立したノースブリッジチップを使用するのではなく、ノースブリッジの機能をプロセッサに組み込むことができる。
いくつかの態様において、システム100は、周辺機器用バス118に取り付けられたアクセラレータカード122を含むことができる。アクセラレータは、特定の処理を加速するためのフィールドプログラマブルゲートアレイ(FPGA)または他のハードウェアを含むことができる。例えばアクセラレータは、適応データ再構成に使用するか、拡張セット処理において使用される代数式を評価するために使用することができる。
ソフトウェアおよびデータは、外部記憶装置124に格納し、プロセッサが使用するために、RAM 110および/またはキャッシュ104に読み込むことができる。システム100は、システムリソースを管理するためのオペレーティングシステムを含む。オペレーティングシステムの非限定的な例としては、Linux、Windows(商標)、MACOS(商標)、BlackBerry OS(商標)、iOS(商標)、および他の機能的に等価なオペレーティングシステム、ならびにそのオペレーティングシステムの上で走る、本発明の態様例に従ってデータ記憶を管理し最適化を行うためのアプリケーションソフトウェアが挙げられる。
この例において、システム100は、ネットワークアタッチトストレージ(NAS)などの外部記憶装置および分散並列処理に使用することができる他のコンピュータシステムへのネットワークインターフェイスとなるように、周辺機器用バスに接続されたネットワークインターフェイスカード(NIC)120および121も含んでいる。
図59は、複数のコンピュータシステム202aおよび202b、複数の携帯電話および携帯情報端末202c、ならびにネットワークアタッチトストレージ(NAS)204aおよび204bによるネットワーク200を示す図である。態様例では、システム202a、202b、および202cは、データ記憶を管理し、ネットワークアタッチトストレージ(NAS)204aおよび204bに格納されたデータに関してデータアクセスを最適化する。データには数学的モデルを使用し、コンピュータシステム202aおよび202bならびに携帯電話および携帯情報端末システム202cでの分散並列処理を使用して評価することができる。コンピュータシステム202aおよび202bならびに携帯電話および携帯情報端末システム202cは、ネットワークアタッチトストレージ(NAS)204aおよび204bに格納されたデータの適応データ再構成のための並列処理も提供することができる。図59は一例を図解しているに過ぎず、多種多様な他のコンピュータアーキテクチャおよびシステムを本発明のさまざまな態様と一緒に使用することができる。例えば並列処理を提供するためにブレードサーバを使用することができる。バックプレーンを介してプロセッサブレードを接続して、並列処理を提供することができる。記憶装置もバックプレーンに接続するか、または別個のネットワークインターフェイスを介してネットワークアタッチトストレージ(NAS)として接続することができる。
いくつかの態様例において、プロセッサは、個別のメモリ空間を維持し、ネットワークインターフェイス、バックプレーンまたは他のコネクタを介して、他のプロセッサによる並列処理のためにデータを伝送することができる。別の態様において、プロセッサの一部または全部は、共有仮想アドレスメモリ空間を使用することができる。
図60は、ある態様例による、共有仮想アドレスメモリ空間を使用するマルチプロセッサコンピュータシステム300のブロック図である。このシステムは、共有メモリサブシステム304にアクセスすることができる複数のプロセッサ302a〜fを含む。このシステムは、メモリサブシステム304に複数のプログラマブルハードウェアメモリアルゴリズムプロセッサ(MAP)306a〜fを組み込んでいる。各MAP306a〜fは、メモリ308a〜fおよび1つまたは複数のフィールドプログラマブルゲートアレイ(FPGA)310a〜fを含むことができる。MAPは設定変更可能な機能ユニットを提供し、各プロセッサと緊密に連携して処理を行うために、特定アルゴリズムまたはアルゴリズムの一部をFPGA310a〜fに提供することができる。例えば、態様例では、データモデルに関する代数式を評価するため、および適応データ再構成を行うために、MAPを使用することができる。この例では、各MAPは、これらの目的のために、全てのプロセッサにより、グローバルにアクセス可能である。一構成において、各MAPは、関連メモリ308a〜fにアクセスするためにダイレクトメモリアクセス(DMA)を使用して、各々のマイクロプロセッサ302a〜fが独立して非同期的にタスクを実行することを可能にする。この構成において、MAPは、アルゴリズムのパイプライン化および並列実行のために、別のMAPに結果を直接供給することができる。
上記のコンピュータアーキテクチャおよびシステムは例に過ぎず、汎用プロセッサ、コプロセッサ、FPGAおよび他のプログラマブル論理デバイス、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、ならびに他の処理要素および論理要素の任意の組合せを使用するシステムを含めて、多種多様な他のコンピュータ、携帯電話、および携帯情報端末アーキテクチャおよびシステムを、態様例との関連において使用することができる。いくつかの態様では、データ管理および最適化システムの全部または一部を、ソフトウェアまたはハードウェアに実装することができ、ランダムアクセスメモリ、ハードドライブ、フラッシュメモリ、テープドライブ、ディスクアレイ、ネットワークアタッチトストレージ(NAS)ならびに他のローカルまたは分散データ記憶デバイスおよびシステムなどといった、任意のさまざまなデータ記憶媒体を態様例との関連において使用することができる。
態様例では、上記または他のコンピュータアーキテクチャおよびシステムのいずれかで実行されるソフトウェアモジュールを使用して、データ管理および最適化システムを実装することができる。別の態様では、ファームウェア、プログラマブル論理デバイス、例えば図61で言及したフィールドプログラマブルゲートアレイ(FPGA)、システムオンチップ(SOC)、特定用途向け集積回路(ASIC)、または他の処理要素および論理要素に、システムの機能を部分的にまたは完全に実装することができる。例えば、セットプロセッサおよびオプティマイザは、図63に図解するアクセラレータカード122などのハードウェアアクセラレータカードを用いるハードウェア加速と共に実装することができる。
図には上述したコンポーネントをそれぞれ1つしか示していないが、これらのコンポーネントはいずれもいくつでも設けてよいことは、当業者には理解されるであろう。さらにまた、開示したシステムの1つまたは複数のコンポーネントは、図示した別のコンポーネントと組合せるか、図示した別のコンポーネントに組み込んでもよいことは、当業者にはわかるであろう。図示したコンポーネントの1つまたは複数は、1つまたは複数のコンピューティングシステムでは、ソフトウェアに実装してもよい。例えばそれらは、プロセッサで実行された場合に、ある方法の工程をコンピュータに行わせる、コンピュータ可読命令の1つまたは複数のコンピュータユニットを含みうる、1つまたは複数のアプリケーションを含むことができる。コンピュータ可読命令はメモリまたはディスクなどのコンピュータ可読媒体に格納しうる。そのような媒体は典型的には非一過性の記憶装置を提供する。あるいは、図に示すコンポーネントの1つまたは複数は、ハードウェアコンポーネントまたは例えば専用コンピュータもしくは汎用コンピューなどのハードウェアとソフトウェアの組合せでありうる。コンピュータまたはコンピュータシステムは内部データベースまたは外部データベースも含みうる。コンピュータまたはコンピュータシステムのコンポーネントはローカルバスインターフェイスを介して接続しうる。上述の段階を、異なるソフトウェアモジュールで実現しうることは、当業者には理解されるであろう。開示したコンポーネントは独立したユニットであると上では説明したが、1つまたは複数のユニットによって提供される機能を組合せてもよいことは、当業者にはわかるであろう。当業者には理解されるであろうとおり、ユニットの1つまたは複数は任意であってよく、ある特定の態様では実装から省くことができる。
キット
本開示の方法において有用なキットは、本明細書に記載する方法のいずれかにおいて有用な構成要素、例えば核酸増幅用のプライマー、遺伝子変動を検出するためまたは他のマーカー検出のためのハイブリダイゼーションプローブ、制限酵素、適切な標識で標識されていてもよい核酸プローブ、アレル特異的オリゴヌクレオチド、本明細書に記載する本開示の核酸によってコードされている改変ポリペプチドに結合する抗体、または本明細書に記載する本開示の核酸によってコードされている野生型ポリペプチドに結合する抗体、遺伝子変動またはそのフラグメントを増幅するための手段、本明細書に記載する遺伝子変動を含む核酸の核酸配列を解析するための手段、遺伝子変動によってコードされているポリペプチドのアミノ酸配列または遺伝子変動と関連する核酸を解析するための手段などを含む。本キットは、例えば必要な緩衝液、核酸を増幅するための核酸プライマー、固形支持体、ならびに上述のプライマーおよび必要な酵素(例えばDNAポリメラーゼ)を使用して増幅されたフラグメントのアレル特異的検出のための試薬、例えば本明細書に記載するもののいずれかを含むことができる。加えて、キットは、本開示の方法と組合せて使用されるアッセイ法のための試薬、例えばある疾患またはある状態に関する他のスクリーニングアッセイ法で使用するための試薬を提供することができる。
いくつかの態様において、本開示は、個体のゲノムにおける少なくとも1つの特定遺伝子変動を選択的に検出するのに必要な試薬を含む、遺伝子変動の存在を検出するために対象由来の核酸試料をアッセイするためのキットに関する。いくつかの態様において、本開示は、対象のゲノムにおける遺伝子変動に関連する少なくとも1つの多型の少なくとも特定アレルの存在を検出する目的で、対象由来の核酸試料をアッセイするためのキットに関する。いくつかの態様において、試薬は、少なくとも遺伝子変動を含む個体のゲノムのフラグメントにハイブリダイズする少なくとも1つの連続的オリゴヌクレオチドを含む。いくつかの態様において、試薬は、対象から得られたゲノムセグメントの反対鎖にハイブリダイズする少なくとも1対のオリゴヌクレオチドを含み、各オリゴヌクレオチドプライマー対は、少なくとも1つの遺伝子変動を含む個体のゲノムのフラグメントを選択的に増幅するように設計される。そのようなオリゴヌクレオチドまたは核酸は、本明細書に記載する方法を使用して設計することができる。いくつかの態様において、キットは、1つまたは複数の特異的多型マーカーまたは遺伝子変動を伴うハプロタイプをアレル特異的に検出する能力を有する1つまたは複数の標識された核酸と、その標識を検出するための試薬とを含む。いくつかの態様において、SNPマーカーを検出するためのキットは、例えばKutyavinら(Nucleic Acid Res. 34:e128(2006))が記載しているように、検出すべきSNP多型を含有するテンプレートDNAのセグメントにハイブリダイズする検出オリゴヌクレオチドプローブ、エンハンサーオリゴヌクレオチドプローブ、検出プローブ、プライマーおよび/またはエンドヌクレアーゼを含むことができる。
いくつかの態様において、DNAテンプレートは、本明細書に記載するように特異的遺伝子変動の存在について評価する前に、本開示の任意の手段によって増幅される。これらの方法を行うために当業者に周知の標準的方法を用いることができ、それらは本開示の範囲に包含される。そのような一態様では、試薬キットに、これらの方法を行うための試薬を含めることができる。
本開示のさらなる一つの局面では、治療剤と、本開示の1つまたは複数のバリアントについて本明細書において開示するようにスクリーニングされるヒトにその治療剤を投与するための一組の説明書とを含む医薬パック(キット)が提供される。治療剤は小分子薬、抗体、ペプチド、アンチセンスもしくはRNAi分子、または本明細書に記載する他の治療分子であることができる。いくつかの態様において、本開示の少なくとも1つのバリアントのキャリアであると同定された個体は、処方された用量の治療剤を服用するように指示される。そのような一態様において、本開示の少なくとも1つのバリアントのキャリアであると同定された個体は、処方された用量の治療剤を服用するように指示される。いくつかの態様において、本開示の少なくとも1つのバリアントの非キャリアであると同定された個体は、処方された用量の治療剤を服用するように指示される。
本明細書に記載するヒト染色体の領域とハイブリダイズするプローブを含む製造物も、本明細書において提供され、それらは、本明細書に記載する多型を検出するために使用することができる。例えば、本明細書に記載する多型を検出するためのプローブはいずれも、製造品またはキットを作製するために、包装材料と組合せることができる。キットは、使用説明書、および他の試薬、例えば標識またはプローブに標識を付着させるのに役立つ作用物質などといった、1つまたは複数の他の要素を含むことができる。使用説明書は、本明細書に記載する方法で疾患または状態に対する診断、予後判定、またはセラグノシスを行うためのプローブのスクリーニング応用に関する説明書を含むことができる。他の説明書として、プローブに標識を付着させるための説明書、プローブを使用してインサイチュー解析を行うための説明書、および/または対象から解析すべき核酸試料を得るための説明書を挙げることができる。場合により、キットは、本明細書に記載するヒト染色体の領域にハイブリダイズする標識されたプローブを含むことができる。
キットは、特定のエンドフェノタイプと関連する異常を有しうる同じ染色体もしくは別の染色体またはその一部分にハイブリダイズする1つまたは複数の追加の参照プローブまたは対照プローブも含むことができる。追加プローブを含むキットはさらに標識、例えばプローブ用の同じ標識または異なる標識の1つまたは複数を含むことができる。別の態様において、キットと共に提供される1つまたは複数の追加プローブは、1つまたは複数の標識されたプローブであることができる。キットがさらに1つまたは複数の追加プローブを含む場合、そのキットは、1つまたは複数のそれら追加プローブの使用説明書をさらに提供することができる。自己検査に使用するためのキットも提供することができる。そのような検査キットは、対象が医療提供者の助けを借りずに核酸試料(例えば頬側細胞、血液)を得るために使用することができるデバイスおよび説明書を含むことができる。例えば頬側細胞は、頬側用のスワブもしくはブラシを使用して、または洗口液を使用して得ることができる。
本明細書において提供されるキットは、解析用の核酸試料を例えば検査室に返送するために使用することができる郵送用容器(例えば郵便料金支払い済みの封筒または郵送用パック)も含むことができる。キットは1つまたは複数の核酸試料用容器を含むか、核酸試料を標準的な採血バイアルに入れることができる。キットは、インフォームドコンセント用紙、検査依頼用紙、および本明細書に記載する方法におけるキットの使用方法に関する説明書の1つまたは複数も含むことができる。そのようなキットを使用するための方法も、本明細書に包含される。核酸試料の提供者を同定するために、用紙(例えば検査依頼用紙)および核酸試料を保持する容器の1つまたは複数を、例えばバーコードでコード化することができる。
いくつかの態様において、インビトロスクリーニング検査は、個体から核酸試料を収集するために構成された1つまたは複数のデバイス、ツール、および装置を含むことができる。インビトロスクリーニング検査のいくつかの態様において、核酸試料を収集するためのツールは、核酸試料の収集、貯蔵および輸送が容易になるように設計されたスワブ、メス、シリンジ、スクレーパー、容器、および他のデバイスならびに試薬の1つまたは複数を含むことができる。いくつかの態様において、インビトロスクリーニング検査は、核酸試料を収集、安定化、貯蔵、および処理するための試薬または溶液を含むことができる。
ヌクレオチドの収集、安定化、貯蔵および処理のためのそのような試薬および溶液は当業者に周知であり、本明細書に記載するインビトロスクリーニング検査が使用する具体的方法によって示されうる。いくつかの態様において、本明細書において開示するインビトロスクリーニング検査は、ある特定の遺伝子マーカーについて核酸試料をアッセイすること、およびある特定の遺伝子マーカーを検出し可視化することに必要な、マイクロアレイ装置および試薬、フローセル装置および試薬、マルチプレックスヌクレオチドシーケンサーおよび試薬、ならびに追加のハードウェアおよびソフトウェアを含むことができる。
実施例1: RNA標的シーケンシングプロトコール
cDNA合成
1ngから1000ngまでのRNAを、5pmolの各プライマー(記載の順にそれぞれSEQ ID NO:3〜7)を含有する以下のプライマーミックス5μlと混和した。
Figure 0006494045
前記12μlの反応を95℃で1分加熱した後、65℃で1分加熱し、4℃で保持した。次に、4μlの5×第1の鎖緩衝液(Life Technologies,カリフォルニア州カールズバッド)、1μlの10mM dNTPs、1μlの0.1M DTT、1μl RNアーゼ阻害剤(Enzymatics,マサチューセッツ州ベバリー)および1μlのSuperscript III(Life Technologies,カリフォルニア州カールズバッド)を反応に加えた。この反応を55℃で45分インキュベートした後、85℃でさらに5分インキュベートした。次に、反応を37℃でインキュベートしてから、1μl lのRNアーゼ H(Enzymatics,マサチューセッツ州ベバリー)を加えた。反応をAmpure(Beckman Coulter Genomics、マサチューセッツ州ダンバーズ)で精製した。
アダプターライゲーション
3μlのcDNAを、2μlの10μM P7/C7アダプター、1μl T4 DNAリガーゼ(Enzymatics,マサチューセッツ州)、2μlのラピッド(rapid)リガーゼ緩衝液、および2μlのヌクレアーゼフリーdH2Oと混和した。反応を室温で1時間インキュベートした。次に、反応を65℃で10分インキュベートすることによって熱失活させてから、Ampure XP(Beckman Coulter Genomics,マサチューセッツ州ダンバーズ)で精製した。
Figure 0006494045
プライマー伸長反応
アダプターが連結されたDNA 10μlを、8.4μlのdH2O、0.3μlの10mM dNTPs、5μlのPhusion HF緩衝液、0.3μl PhusionホットスタートIIポリメラーゼ(Thermo Fischer,イリノイ州シカゴ)および体積1μl中の以下のプライマー各0.5pmolに加えた。
Figure 0006494045
反応を98℃で1分インキュベートしてから、98℃、60℃で20秒、72℃で30秒を5サイクル行い、次に4℃で保持した。次に反応をAmpureで精製した。
PCR増幅
5μlの精製プライマー伸長産物を、10μlの5×Phusionホットスタート緩衝液、0.6μlの10mM dNTP、2μlの12.5μM C5 PCRプライマー
Figure 0006494045
、2μlの12.5μM C7 PCRプライマー
Figure 0006494045
、29.8μlのdH2O、および0.6uμlのPhusionホットスタートIIポリメラーゼと混和した。その反応を98℃で1分インキュベートしてから、98℃で10秒、60℃で20秒、および72℃で30秒を25サイクル行った。
プールした反応
PCR産物をアガロースゲル上で分離した。ゲルバンドを切り出し、Qiagen Mineluteゲル精製キットで精製した。精製された試料をAgilent Tapestation解析によって解析し、希釈し、Illumina MiSeqプラットフォームでのシーケンシングに先だって、ライブラリーバンド定量(library band quant)によってプールした。
実施例2: DNA標的シーケンシング調製
ゲノムプライマー伸長
患者血液から抽出した4μgのヒトゲノムDNAを、0.6μlの10mM dNTP、1μlのBST 2.0ポリメラーゼ(New England Biolabs,マサチューセッツ州イプスウィッチ)、5μlの10×等温増幅緩衝液(NEB)、および以下の配列を含む1μlの0.5μM CS-30プライマーと混和した。
Figure 0006494045
Figure 0006494045
Figure 0006494045
アダプターライゲーション
溶出したプライマー伸長反応20μlを、1.5μlの5μM P7/C7アダプター(上述のトップ鎖1本とボトム鎖1本とが正しいバーコード対形成でアニールしている二重鎖)、1μlのT4 DNAリガーゼ、6μlの5×ラピッドリガーゼ緩衝液(New England Biolabs,マサチューセッツ州イプスウィッチ)および1.5μlのヌクレアーゼフリーdH2Oと混和した。反応を室温で1時間インキュベートした。次に、反応を68℃で10分インキュベートすることによって熱失活させた。次に反応をAmpure XP(Beckman)で精製した。
ビーズ捕捉
180μlのmy One C1 SAビーズ(Dynal, Lifetech)を1mlの1×B&Wで洗浄した。ビーズをさらに2回、各200μlの1×B&W洗浄液で洗浄した。Ampure精製アダプターライゲーションの総溶出体積は65μlであった。等体積(65μl)の2×B&Wを加え、さらに100uμlの1×B&Wを加えて、結合反応1回につき230μlの総体積にした。反応を振とうインキュベーター上に20分置いた。試料結合後に、ビーズを200μlのNSXで洗浄し、液体を除去した。
次に、試料を200μlの0.1N NaOHに再懸濁し、室温で20分、回転させた。NaOHを除去し、新たに200μlの0.1N NaOHで2回目の洗浄を行った。NaOH除去後にビーズを600μlのTEで2回洗浄した。次に、ビーズをNSXで2回洗浄した。ビーズを100μlのTex(0.01%Triton Xを含むTE)に入れ、4Cで一晩保存した。プライマー伸長に先だって、ビーズを200μlの1×Phusion HF(0.01 triton X含有)で2回、Triton Xを含有しない1×HFで1回洗浄した。
プライマー伸長反応
ビーズ混合物を、21.1μlのdH2O、0.6μlの10mM dNTP、6μlのPhusion HF緩衝液、0.3μl PhusionホットスタートIIポリメラーゼ(Thermo Fischer,イリノイ州シカゴ)および体積2μl中の以下のプライマー各0.5pmolに再懸濁した。
Figure 0006494045
Figure 0006494045
Figure 0006494045
反応を98℃で1分インキュベートしてから、98℃、60℃で20秒、72℃で30秒を5サイクル行い、次に4℃で保持した。次に反応をAmpureで精製した。
PCR増幅
5μlの精製プライマー伸長産物を、10μlの5×Phusionホットスタート緩衝液(HF)、0.6μlの10mM dNTP、2μlの12.5μM C5 PCRプライマー
Figure 0006494045
、2μlの12.5μM C7 PCRプライマー
Figure 0006494045
、29.8μlのdH2O、および0.6μlのPhusionホットスタートIIポリメラーゼと混和した。
その反応を98℃で1分インキュベートしてから、98℃で10秒、60℃で20秒、および72℃で30秒を25サイクル行った。
ゲルバンドを切り出し、Qiagen Mineluteゲル精製キットにより、製造者の説明書に従って精製した。精製された試料をAgilent Tapestation解析によって解析し、希釈し、Illumina MiSeqでのシーケンシングに先だって、ライブラリーバンド定量分析によってプールした。
実施例3-改良されたプライマーパネルの作製-プライマー二量体形成の解析
記載する標的シーケンシング法において使用するためのプライマーパネルを作製するために、増幅された標的の安定性およびロバストネスを評価した。加えて、配列精度および被覆度の均一性を評価して、プライマーパネルを作製しかつアッセイパフォーマンスを改良した。
これらのパラメータを改良するために、増幅された最終標的の品質、増幅サイクリング要件、増幅産物の清浄度(cleanliness)、増幅産物の収量を含む、いくつかの測定規準を評価した。オンターゲット特異性、被覆度均一性、シーケンシング深度、およびSNPコーリングの精度を改良するために、増幅産物の配列解析も行った。アッセイパフォーマンスを改良するために、プロトコールの変更、産物形成の解析、および配列品質のサイクルを繰り返した。
配列解析を用いて、望ましくない75bp産物は、線形伸長/増幅工程中に使用したプライマーに関係すると決定された。さらに大きな二重線または三重線の125〜200bp産物は、線形伸長/増幅工程中に使用したC7/P7アダプターおよびプライマーに関係すると決定された。さらに大きい150bp超の二量体産物は、最初のRT/PE工程中に使用したプライマーに関係すると決定された。
配列解析で検出された主要二量体産物の長さは143、155、および160であり、これらは二量体産物に対応した。配列解析により、143bp産物は、132回出現するMCOLN1_11_1_f_PE2_5プライマーと660回出現するGAA_14_1_o_PE2_7プライマーとに関連することが明らかになった。配列解析により、155bp産物は、1146回出現するGAA_14_1_o_PE2_7プライマーに関連することが明らかになった。配列解析により、160bp産物は、464回出現するIKBKAP_32_1_f_PE2_6プライマーに関連することが明らかになった。この解析の結果として、これらのプライマーをプライマーパネルから除去した。
これらの解析から、不要な二量体形成は、融解温度が高く(例えば70℃のTM)かつアニーリング温度が低い(例えば60℃)プライマー、プライマー/UID領域と相互作用することによるGC含量が高いプライマー、およびいくつかのDNAポリメラーゼ(例えばPhusion)の3'エキソ活性によって助長されることがわかった。これらの解析および結論の結果として、それぞれの3'端上の最後の5ヌクレオチドに高いGC%を有さないプライマーによるプライマーパネルが作製された。これらの解析および結論の結果として、二量体産物形成は、初期プライマーパネルを使用した場合と比較して著しく低減し、これらの改良により、標的産物をゲル精製する必要がなくなった。
上記の実験からいくつかのプライマー除外基準を作製し、それらを使用してCS-350パネルからサブパネルを作製した。このサブパネルは、これらの除外パラメータの1つまたは組合せを使用して作製された。第1に、初回RT/PE工程中または線形伸長/増幅工程中の読み間違い数(ミスプライミングが引き起こすもの)が最も高いプライマー。第2に、配列解析によって解明される二量体に広く認められるプライマーは、サブパネルから除外した。第3に、ある標的に関して最も高い総リード数の1つまたは複数を生じる原因となるプライマー(過剰増幅因子(over-amplifier))を、サブパネルから除外した。
実施例4-改良されたプライマーパネル-アンプリコンGC含量%およびプライマー融解温度の解析
記載する標的シーケンシング法において使用するためのプライマーパネルを作製するために、増幅された標的の安定性およびロバストネスを、アンプリコンのGC含量%および使用したプライマーの融解温度との比較で評価した。ある特定プライマーについて生成したリード数を、プライマーパフォーマンスの測定規準として使用した。加えて、プライマーパネルを作製し、アッセイパフォーマンスを改良するために、配列精度および被覆度の均一性を評価した。低パフォーマー(poor performer)(リード数が最も少ないもの)の大半は、TM<60℃の線形伸長/増幅プライマーであり、ATリッチアンプリコンに由来した。低パフォーマーの第2のクラスターは、GCパーセンテージが高いアンプリコンおよび高い融解温度を有するプライマーで構成されていた。これらの実験および解析の結果として、アンプリコンおよびプライマーについて、いくつかの基準を作製した。第1に、使用されるプライマーの融解温度範囲は60℃〜68℃にあるべきである。第2に、プライマーは、21〜32ヌクレオチドの長さを有することができる。第3に、プライマーは、3'端にある最後の5つのヌクレオチド内に4つまたはそれ以上のピリミジンを含有すべきでない。第4に、アンプリコンは30%〜70%のGC含量を含有すべきである。最後に、アンプリコンの長さは225〜300塩基対長であるべきである。
実施例5-改良された反応条件
記載する標的シーケンシング法において使用するための反応条件を改良するために、増幅された標的の安定性およびロバストネスを評価した。加えて、配列精度および被覆度の均一性を評価して、反応条件を改良しかつアッセイパフォーマンスを改良した。
これらのパラメータを改良するために、増幅された最終標的の品質、増幅サイクリング要件、増幅産物の清浄度、増幅産物の収量を含む、いくつかの測定規準を評価した。アッセイパフォーマンスを改良するために、プロトコールの変更、産物形成の解析、および配列品質のサイクルを繰り返した。
最初のプライマータイトレーション実験は、既存の増幅ランピングおよびアニーリング条件で標的生産を可能にするには十分でなかった。著しく複雑なプライマープールには、上記のパラメータおよび測定規準の評価に基づいて、よりストリンジェントなランピング条件が必要であると仮定した。
CS-30プライマーパネル用の元のランピング条件を使用した場合、より複雑なプライマーパネルでは、30種の標的は機能しなかった。線形伸長/増幅工程(PE2)でのランピング速度を遅くし、初回RT/PE工程に68℃での保持を加えることによって、ストリンジェンシーを増加させた。低い方のプライマー融解温度に適応するために、最低アニーリング温度保持を55℃まで下げた。プライマープールの総濃度を固定すると、24〜346アンプリコンの範囲のパネルサイズで産物形成の改善が見られた。ストリンジェントなRT/PEおよび線形伸長/増幅ランピング条件と固定された総プライマープール濃度との組合せにより、異なる条件を使用する同じ方法を上回る改良が見られた。
加えて、産物形成を改良するために、RT/PE工程および線形伸長/増幅工程中にさまざまな添加剤を使用する他の実験を行った。いくつかの添加剤条件を試験し、それらが産物形成に及ぼす影響を評価した。データは、最適化された反応条件でのリード被覆度の改良を示した。硫酸アンモニウムおよび追加のMgCl2はリード深度に最も著しい影響を与えた。これらの実験はパネル最適化前の完全なCS-350パネルで行った。これらの実験を行うことで、二量体形成の機序を解明し、関与するプライマーを同定するのに役だった。
実施例5-標的シーケンシングプロトコール
試料中に存在するDNA配列またはRNA配列を特異的にターゲティングし、増幅し、シーケンシングし、かつ/または定量するために、本明細書に記載する方法を使用した。これらの方法により、シーケンシングまたは他の分子解析用の標的とした配列をフォーマットすることになる追加配列の付加が可能になった。同じRNA分子または同じDNA分子に由来するリードをビン化することを可能にするユニーク識別配列(UID)を付加することで、ある特定の配列多型がRNA分子またはDNA分子の集団内に見いだされるものかそれとも増幅アーチファクトに起因したものであるかについての決定を下すことを可能にするために、本方法を使用した。RNAまたはDNAをテンプレート/出発材料として使用した。試料は任意の生物またはウイルスから得ることができる。さまざまなシーケンシングデバイスおよび他の分子解析デバイス用の標的とした分子をフォーマットするために、本方法を使用した。
標的シーケンシングをNGSプラットフォームでシーケンシングする目的で、ライブラリー調製プロトコールを使用した。このアッセイ法では、患者の生物学的試料由来の数多くの特異的な生物学的標的(1種〜何千何万種)を、NGS適合ライブラリーに変換し、シーケンシングした。これにより、患者のゲノムまたはトランスクリプトームにおける標的頻度(遺伝子発現)および変異またはSNPの同定が可能になり、そこから臨床情報が導き出された。患者試料中のウイルス、細菌または真菌のRNAまたはDNAをターゲティングすることによって、さまざまな感染の有無および頻度を同定するためにも、このアッセイ法を使用した。
例えばがん変異プロファイリング、SNPおよび変異解析、キャリア検査、感染診断、および遺伝子発現解析などに必要な標的をシーケンシングすることにより、さまざまな応用を個別にまたは同時に行った。
RNAについては、逆転写酵素を使用して逆転写(RT)を行うことで、標的または関心対象に対するcDNA相補鎖を作製した。DNAについては、DNAポリメラーゼを使用してプライマー伸長(PE)を行うことで、標的または関心対象に対する相補鎖であるDNAを作製した。どちらの場合も、上述のRTまたはPEを行うために使用したオリゴは、関心対象の標的に対する遺伝子特異的プライマー、ユニーク識別(UID)タグ(15個またはそれ以上の縮重塩基で構成された完全にまたは部分的に縮重した長いバーコード;
Figure 0006494045
、およびリン酸化された5'端を持つ配列既知のユニバーサルタグ(P7フォワードプライマー:P7fと命名)で構成された。UIDは、任意のRNA分子またはDNA分子に単分子バーコードを付加するために使用し、配列解析段階では、生物学的試料における絶対出発分子数を同定し、標的のコンセンサス配列をデコンボリュートし、全てのPCRエラーまたはシーケンシングエラーを除去し、それゆえにシーケンシング精度を高めるために使用した。数多くの異なる遺伝子を捕捉するために、オリゴの対応する遺伝子特異的部分が捕捉すべき各標的に対する相補鎖である数多くのそのようなオリゴで構成されるプールを使用した。
フォーマット/アダプターライゲーション-この工程では、増幅/解析に必要な追加配列を、新たに合成された核酸に付加した。この追加配列は、ライゲーション(好ましいアプローチ)によって、一本鎖で、またはブリッジオリゴを使用して、付加することができる。この配列は、後続の工程における増幅によって付加された。この配列は、フォーマットされた配列の大きな集団を増幅するための一般プライミング配列として使用した。この配列は試料同定用のバーコードを含有していた。この配列はビオチンなどの精製タグも含有していた。あるアプローチでは、ライゲーションに使用したアダプターは、P7f'領域に相補的なブリッジオリゴとして機能するアッパー鎖と、RT工程中またはPE工程中に生成する産物に連結されるボトム鎖オリゴとから構成された。その結果生じる産物は、P7領域(シーケンシング用)の残りの部分、ならびに数多くの患者試料を並列処理する場合に必要な試料バーコード(SBC)、および任意でNGSプラットフォームでクラスター化するためのC7領域を付加した。
ビーズ捕捉(任意)-この工程では、部分的にフォーマットされた核酸を、上で付加したアフィニティタグまたは配列によって捕捉した。この捕捉は、標的配列を、関心対象ではないテンプレート/試料配列から分離するために使用した。
プライマー伸長/線形増幅-DNAポリメラーゼを使用すると共に、捕捉すべき標的のそれぞれについての遺伝子特異的領域、シーケンシングプライマータグ(P5)、NGSプラットフォームでクラスター化するためのユニバーサルタグ(C5)で構成されたオリゴのプールを使用して、線形増幅(または線形プライマー伸長(LPE)を行った。オリゴのプールは、数多くの標的のLPEを1回の反応で一度に行うために使用した。この伸長は溶液状態で行うか、またはビーズもしくはアレイに付着したテンプレートで行った。LPEは、一サイクルとして行うか、多サイクル(数百サイクルまで)として行うことで、標準的PCRで生成しうるPCR増幅バイアスを避けた。
PCR富化-関心対象の標的を、以下のオリゴを使用するPCRによって同時に増幅した:LPEオリゴのいずれかの部分、好ましくはC5(または任意でP5C5、またはP5だけ)で構成されるフォワードプライマー、およびユニバーサルアダプターの任意の部分に相補的な、ただし好ましくはC7(または任意でP7-BC-C7またはP7だけ)に相補的なリバースプライマー。
最終ライブラリー-最終ライブラリーは、タグで捕捉された全ての標的のプールから構成された。
下記の特許請求の範囲は、本明細書に記載する方法、組成物、およびキットの範囲を規定し、それら請求項の範囲内にある方法および組成物ならびにその等価物は、特許請求の範囲に包含されるものとする。特許請求の範囲は、任意の要素をいずれも排除するように記載されている場合がある。したがって、本明細書は、特許請求の範囲の要素の叙述との関連において、「もっぱら(solely)」、「のみ(only)」などの排他的用語を使用するための、または「消極的(negative)」限定を使用するための、先行する根拠として役立つように意図されている。

Claims (8)

  1. (a)標的特異的配列を含む第1のプライマーを使用して、試料から標的ポリヌクレオチドの第1の相補配列(CS)を作製する工程;
    (b)第1のプライマー結合配列(PBS)またはその一部分を含むアダプターを、該第1のCSに付着させ、それにより修飾相補配列(MCS)を形成する工程;
    (c)該MCSにハイブリダイズした第2のプライマーを伸長させ、それにより第2のCSを形成する工程であって、該第2のプライマーが、
    (i)標的特異的領域と、
    (ii)第2のPBSと
    を含む、工程;ならびに
    (d)該第1のPBSおよび該第2のPBSにそれぞれハイブリダイズする複数のプライマーを使用して、該第2のCSを増幅する工程
    を含み、
    該第1のプライマーまたは該第2のプライマーがユニーク識別(UID)配列を含む、
    ポリヌクレオチドのライブラリーを作製する方法。
  2. 前記第1のプライマーがユニバーサルライゲーション配列(ULS)を含む、請求項1記載の方法。
  3. 前記第2のプライマーがユニバーサルプライミング配列(UPS)をさらに含む、請求項1または2に記載の方法。
  4. 前記アダプターが試料バーコード(SBC)配列をさらに含む、請求項1〜3のいずれか一項に記載の方法。
  5. 前記付着させることがライゲーションを含む、請求項1〜4のいずれか一項に記載の方法。
  6. 前記MCSがアフィニティ分子または捕捉配列をさらに含む、請求項1〜5のいずれか一項に記載の方法。
  7. 前記UIDが、配列
    Figure 0006494045
    を含み、Nが任意の核酸残基である、請求項1〜6のいずれか一項に記載の方法。
  8. 前記UIDが、配列
    Figure 0006494045
    を含み、Nが任意の核酸残基でありかつWがアデニンまたはチミンである、請求項1〜6のいずれか一項に記載の方法。
JP2016551299A 2014-02-11 2015-02-10 標的シーケンシングおよびuidフィルタリング Active JP6494045B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201461938227P 2014-02-11 2014-02-11
US61/938,227 2014-02-11
US201462031405P 2014-07-31 2014-07-31
US62/031,405 2014-07-31
PCT/EP2015/052723 WO2015121236A1 (en) 2014-02-11 2015-02-10 Targeted sequencing and uid filtering

Publications (2)

Publication Number Publication Date
JP2017511121A JP2017511121A (ja) 2017-04-20
JP6494045B2 true JP6494045B2 (ja) 2019-04-03

Family

ID=52629523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016551299A Active JP6494045B2 (ja) 2014-02-11 2015-02-10 標的シーケンシングおよびuidフィルタリング

Country Status (7)

Country Link
US (2) US10421999B2 (ja)
EP (1) EP3105349B1 (ja)
JP (1) JP6494045B2 (ja)
CN (2) CN106029962A (ja)
CA (1) CA2938910A1 (ja)
ES (1) ES2819277T3 (ja)
WO (1) WO2015121236A1 (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US10017812B2 (en) 2010-05-18 2018-07-10 Natera, Inc. Methods for non-invasive prenatal ploidy calling
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
EP2572003A4 (en) 2010-05-18 2016-01-13 Natera Inc METHOD FOR NONINVASIVE PRANATAL PLOIDIE ASSIGNMENT
CN103608466B (zh) 2010-12-22 2020-09-18 纳特拉公司 非侵入性产前亲子鉴定方法
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
CN106460070B (zh) 2014-04-21 2021-10-08 纳特拉公司 检测染色体片段中的突变和倍性
JP6672310B2 (ja) * 2014-09-15 2020-03-25 アブビトロ, エルエルシー ハイスループットヌクレオチドライブラリーシークエンシング
WO2016181128A1 (en) * 2015-05-11 2016-11-17 Genefirst Ltd Methods, compositions, and kits for preparing sequencing library
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2018053070A1 (en) * 2016-09-14 2018-03-22 Intellia Therapeutics, Inc. Improved methods for analyzing edited dna
US11485996B2 (en) 2016-10-04 2022-11-01 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US11783918B2 (en) 2016-11-30 2023-10-10 Microsoft Technology Licensing, Llc DNA random access storage system via ligation
US10011870B2 (en) * 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10793897B2 (en) 2017-02-08 2020-10-06 Microsoft Technology Licensing, Llc Primer and payload design for retrieval of stored polynucleotides
WO2018156418A1 (en) 2017-02-21 2018-08-30 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
EP3592863A1 (en) * 2017-03-08 2020-01-15 H. Hoffnabb-La Roche Ag Primer extension target enrichment and improvements thereto including simultaneous enrichment of dna and rna
EP3612642A1 (en) * 2017-04-17 2020-02-26 GeneFirst Ltd. Methods, compositions, and kits for preparing nucleic acid libraries
US10176296B2 (en) 2017-05-17 2019-01-08 International Business Machines Corporation Algebraic phasing of polyploids
KR101967879B1 (ko) * 2017-11-30 2019-04-10 사회복지법인 삼성생명공익재단 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법
CA3096508A1 (en) * 2018-04-20 2019-10-24 Longhorn Vaccines And Diagnostics, Llc Rapid methods for the detection of microbial resistance
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US11149322B2 (en) * 2019-06-07 2021-10-19 Chapter Diagnostics, Inc. Methods and compositions for human papillomaviruses and sexually transmitted infections detection, identification and quantification
CN111808854B (zh) * 2020-07-09 2021-10-01 中国农业科学院农业基因组研究所 带有分子条码的平衡接头及快速构建转录组文库的方法
WO2024030342A1 (en) * 2022-07-30 2024-02-08 Chapter Diagnostics, Inc. Methods and compositions for nucleic acid analysis
WO2024046992A1 (en) * 2022-09-02 2024-03-07 F. Hoffmann-La Roche Ag Improvements to next-generation target enrichment performance

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5965443A (en) 1996-09-09 1999-10-12 Wisconsin Alumni Research Foundation System for in vitro transposition
US5925545A (en) 1996-09-09 1999-07-20 Wisconsin Alumni Research Foundation System for in vitro transposition
DK1218542T3 (da) * 1999-09-13 2004-08-02 Nugen Technologies Inc Fremgangsmåder og sammensætninger til lineær isotermisk amplifikation af polynukleotidsekvenser
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
EP1546313B1 (en) * 2002-09-20 2008-04-02 Prokaria ehf. Thermostable rna ligase from thermus phage
WO2004093645A2 (en) 2003-04-17 2004-11-04 Wisconsin Alumni Research Foundation Tn5 transposase mutants and the use thereof
US7608434B2 (en) 2004-08-04 2009-10-27 Wisconsin Alumni Research Foundation Mutated Tn5 transposase proteins and the use thereof
EP1645640B1 (en) 2004-10-05 2013-08-21 Affymetrix, Inc. Method for detecting chromosomal translocations
US20070020640A1 (en) 2005-07-21 2007-01-25 Mccloskey Megan L Molecular encoding of nucleic acid templates for PCR and other forms of sequence analysis
AU2009205523A1 (en) * 2008-01-14 2009-07-23 Applied Biosystems, Llc Compositions, methods, and kits for detecting ribonucleic acid
CA2712426A1 (en) * 2008-02-05 2009-08-13 F. Hoffmann-La Roche Ag Paired end sequencing
WO2009148560A2 (en) * 2008-05-30 2009-12-10 Board Of Regents, The Universtiy Of Texas System Methods and compositions for nucleic acid sequencing
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
CN102203273A (zh) * 2008-09-09 2011-09-28 生命技术公司 生成基因特异性的文库的方法
WO2011056933A1 (en) 2009-11-05 2011-05-12 Becton, Dickinson And Company Sequence-specific methods for homogenous, real-time detection of lamp products
GB201016222D0 (en) 2010-09-27 2010-11-10 Natural Enviromental Res Council Aerosol detection
DK2625320T3 (da) * 2010-10-08 2019-07-01 Harvard College High-throughput enkeltcellestregkodning
GB201018714D0 (en) 2010-11-05 2010-12-22 Oxitec Ltd Strand displacement activity of modified polymerases and uses thereof
EP3037536B1 (en) 2011-01-28 2019-11-27 Illumina, Inc. Oligonucleotide replacement for di-tagged and directional libraries
EP3578697B1 (en) 2012-01-26 2024-03-06 Tecan Genomics, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US11177020B2 (en) * 2012-02-27 2021-11-16 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
EP4026912A1 (en) 2012-05-10 2022-07-13 The General Hospital Corporation Methods for determining a nucleotide sequence
EP2855707B1 (en) * 2012-05-31 2017-07-12 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
WO2014110272A1 (en) 2013-01-09 2014-07-17 The Penn State Research Foundation Low sequence bias single-stranded dna ligation
US10087481B2 (en) 2013-03-19 2018-10-02 New England Biolabs, Inc. Enrichment of target sequences
US9708657B2 (en) * 2013-07-01 2017-07-18 Adaptive Biotechnologies Corp. Method for generating clonotype profiles using sequence tags
CA2929596C (en) 2013-11-13 2022-07-05 Nugen Technologies, Inc. Compositions and methods for identification of a duplicate sequencing read
US10450597B2 (en) 2014-01-27 2019-10-22 The General Hospital Corporation Methods of preparing nucleic acids for sequencing

Also Published As

Publication number Publication date
ES2819277T3 (es) 2021-04-15
CA2938910A1 (en) 2015-08-20
CN110819621B (zh) 2024-03-26
US20190360045A1 (en) 2019-11-28
EP3105349B1 (en) 2020-07-15
WO2015121236A1 (en) 2015-08-20
US10731212B2 (en) 2020-08-04
US20160201124A1 (en) 2016-07-14
CN110819621A (zh) 2020-02-21
EP3105349A1 (en) 2016-12-21
CN106029962A (zh) 2016-10-12
US10421999B2 (en) 2019-09-24
JP2017511121A (ja) 2017-04-20

Similar Documents

Publication Publication Date Title
US10731212B2 (en) Targeted sequencing and UID filtering
JP6966052B2 (ja) 稀な配列変異体を検出するための組成物および方法
KR102640255B1 (ko) 감소된 증폭 편향을 갖는 고속-대량 단일 세포 서열분석
KR102175718B1 (ko) 합성 핵산 스파이크-인
Adey et al. Rapid, low-input, low-bias construction of shotgun fragment libraries by high-density in vitro transposition
US11584968B2 (en) Methods for using mosaicism in nucleic acids sampled distal to their origin
JP2022519159A (ja) 循環細胞の分析方法
JP2022528139A (ja) 核酸を解析するための方法および組成物
CN110878345A (zh) 通过分子计数提高等位基因调用的置信度
JP2020501554A (ja) 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法
JP6924779B2 (ja) トランスポザーゼランダムプライミング法によるdna試料の調製
CN110892097A (zh) 用于制备核酸文库的组合物和方法
WO2019180527A1 (en) Methods of sequencing nucleic acids and error correction of sequence reads
WO2019180528A1 (en) Methods of labelling nucleic acids
CN114450420A (zh) 用于肿瘤学精确测定的组合物和方法
CN110914454B (zh) 应用全基因组捕获转座子间区段序列对受微生物污染的人类dna样本进行基因组序列分析
Adam Genomics in equine veterinary medicine
JP2023531720A (ja) 核酸を解析するための方法および組成物
WO2023229532A2 (en) Method of detecting signatures of genetic instability
WO2020264565A1 (en) Methods for duplex sequencing of cell-free dna and applications thereof
Neiman Methods for deep examination of DNA

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170904

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180302

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180829

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20181128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190228

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190301

R150 Certificate of patent or registration of utility model

Ref document number: 6494045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250