本明細書で開示されるいくつかの実施形態の実施は、特段の定めのない限り、当業者の考え得る範囲内にある、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、および組み換えDNAの従来技術を利用する。例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012); the series Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds.); the series Methods In Enzymology (Academic Press, Inc.), PCR 2: A Practical Approach (M.J. MacPherson, B.D. Hames and G.R. Taylor eds. (1995)), Harlow and Lane, eds. (1988) Antibodies, A Laboratory Manual, and Culture of Animal Cells: A Manual of Basic Technique and Specialized Applications, 6th Edition (R.I. Freshney, ed. (2010))を参照のこと。
用語「約(about)」または「およそ(approximately)」は、当業者によって決定されるような特定の値の許容可能な誤差範囲内であることを意味し、これは、その値がどのように測定または決定されるか、つまり、測定システムの制限に部分的に依存している。例えば、「約」とは、当該技術分野での実践につき1または1を超える標準偏差を意味し得る。代替的に、「約」とは所定の値の最大で20%、最大で10%、最大で5%、または最大で1%の範囲内を意味し得る。代替的に、とりわけ生体系または生物学的プロセスに関して、この用語は1桁以内、好ましくはある値の5倍、より好ましくは2倍以内を意味することがある。特定の値が本出願と請求項に記載されている場合、特段の定めのない限り、特定の値の許容可能な誤差範囲内を意味する「約」との用語が仮定されなければならない。
用語「ポリヌクレオチド」、「ヌクレオチド」、「ヌクレオチド配列」、「核酸」、および「オリゴヌクレオチド」は、交換可能に使用される。これらは、あらゆる長さのヌクレオチドの高分子形態、デオキシリボヌクレオチドまたはリボヌクレオチドのいずれか、あるいはそれらのアナログを指す。ポリヌクレオチドは任意の三次元構造を有し得、任意の未知または既知の機能を行い得る。下記はポリヌクレオチドの限定しない実施例である:遺伝子または遺伝子断片のコード領域またはノンコーディング領域、連鎖解析から定義された遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、転移RNA(tRNA)、リボソームRNA(rRNA)、低分子干渉RNA(siRNA)、ショートヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、あらゆる配列の単離されたDNA、あらゆる配列の単離されたRNA、核酸プローブ、およびプライマー。ポリヌクレオチドは、メチル化されたヌクレオチドおよびヌクレオチドアナログなどの1つ以上の修飾されたヌクレオチドを含むこともある。存在するとき、ヌクレオチド構造に対する修飾は、ポリマーのアセンブリーの前または後で与えられ得る。ヌクレオチドの配列は、非ヌクレオチド構成要素によって阻止され得る。ポリヌクレオチドは、標識化構成要素との抱合によってなど、重合の後にさらに修飾され得る。
概して、用語「標的ポリヌクレオチド」とは、その存在、量、および/またはヌクレオチド配列、あるいはこれらの1つ以上の変化が決定されるのが望ましい標的配列を有する核酸分子の開始集団中の核酸分子またはポリヌクレオチドを指す。概して、用語「標的配列」とは、核酸の一本鎖上の核酸配列を指す。標的配列は、遺伝子、制御配列、ゲノムDNA、cDNA、mRNA、miRNA、rRNA、またはそれ以外のものを含むRNAの一部であってもよい。標的配列は、サンプルからの標的配列、または、増幅反応の産物などの第2の標的であってもよい。
「ハイブリダイゼーション」は、1つ以上のポリヌクレオチドが反応して、ヌクレオチド残基の塩基間の水素結合によって安定する複合体を形成する反応を指す。水素結合は、ワトソン−クリック型塩基対、Hoogstein結合、あるいは塩基の相補性に従って他の配列に特異的な方法で生じ得る。複合体は、二重構造を形成する2つの鎖、複数鎖の複合体を形成する3つ以上の鎖、1つの自己ハイブリダイズ鎖、またはこれらの任意の組み合わせを含み得る。ハイブリダイゼーション反応は、PCRの開始、またはエンドヌクレアーゼによるポリヌクレオチドの酵素的切断などの大規模なプロセスにおける工程を構成し得る。第1の配列に相補的な第2の配列は第1の配列の「補体」と呼ばれる。ポリヌクレオチドに適用されるように用語「ハイブリダイズ可能な(hybridized)」とは、ハイブリダイゼーション反応におけるヌクレオチド残基物の塩基間の水素結合によって安定化する複合体を形成するポリヌクレオチドの能力を指す。
「相補性」とは、従来のワトソン−クリックまたは他の非伝統的なタイプのいずれかによって別の核酸配列との水素結合を形成するための核酸の能力を指す。パーセント相補性とは、第2の核酸配列(例えば、10のうちの5、6、7、8、9、10がそれぞれ50%、60%、70%、80%、90%、また100%相補的である)と水素結合(例えば、ワトソン−クリック型塩基対)を形成することができる核酸分子中の残基の割合を示す。「完全に相補的な」とは、核酸配列の隣接する残基のすべてが、第2の核酸配列中の同数の隣接する残基と水素接合することを意味する。本明細書で使用されるように「実質的に相補的」とは、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、またはそれ以上のヌクレオチドの領域にわたって少なくとも60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%である相補性の程度を指すか、あるいはストリンジェントな条件下でハイブリダイズする2つの核酸を指す。パーセント相補性を評価する目的などのための配列同一性は、限定されないが、Needleman−Wunschアルゴリズム(例えば、www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.htmlで入手可能なEMBOSS Needleアライナー、随意にデフォルト設定で)、BLASTアルゴリズム(例えば、blast.ncbi.nlm.nih.gov/Blast.cgiで入手可能なBLASTアラインメントツール、随意にデフォルト設定で)、あるいはSmith−Watermanアルゴリズム(例えば、www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.htmlで入手可能なEMBOSS Waterアライナー、随意にデフォルト設定で)を含む任意の適切なアラインメントアルゴリズムによって測定されてもよい。最適なアラインメントは、デフォルトパラメータを含む選択されたアルゴリズムの任意の適切なパラメータも使用して評価されてもよい。
概して、ハイブリダイゼーションのための「ストリンジェント条件」とは、標的配列に対して相補性を有する核酸が標的配列に優勢的にハイブリダイズし、非標的配列に実質的にハイブリダイズしない条件を指す。ストリンジェント条件は通常配列依存性であり、多くの因子に依存して変わる。概して、配列が長ければ長いほど、配列がその標的配列に特異的にハイブリダイズする温度はますます高くなる。ストリンジェント条件の非限定的な例は、Tijssen (1993), Laboratory Technniques In Biochemistry And Molecular Biology−Hybridization With Nucleic Acid Probes Part I, Second Chapter “Overview of principles of hybridization and the strategy of nucleic acid probe assay”, Elsevier,N.Y.に詳しく記載されている。
一態様では、本開示は、各々が5’末端と3’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供する。場合によっては、上記方法は:(a)複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、複数のポリヌクレオチドの所定の環状ポリヌクレオチドが上記環状化に起因する接合配列を有する、工程と、(b)複数の増幅されたポリヌクレオチドを生成するために(a)の環状化されたポリヌクレオチドを増幅する工程と、(c)切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが5’末端および/または3’末端に1つ以上の切断点を含む、工程と、(d)複数の配列決定リードを生成するために切断されたポリヌクレオチドおよび/または増幅産物を配列決定する工程と、(e)配列決定リードで検出された配列の差異が第1の切断されたポリヌクレオチドと第2の切断されたポリヌクレオチドに対応する配列決定リードで生じるときに、配列決定リードで検出された配列の差異を配列変異体としてコールする工程とを含む。
場合によっては、上記方法は、(a)複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、ポリヌクレオチドの各々が5’末端と3’末端との間に接合部を有する、工程と、(b)増幅されたポリヌクレオチドを生成するために(a)の環状ポリヌクレオチドを増幅する工程と、(c)切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが5’末端および/または3’末端に1つ以上の切断点を含む、工程と、(d)複数の配列決定リードを生成するために切断されたポリヌクレオチドを配列決定する工程と、(e)配列決定リードと参照配列との間の配列決定差を同定する工程と、(f)配列の差異が少なくとも2つの異なる切断されたポリヌクレオチドで生じるとき、配列の差異を配列変異体としてコールする工程とを含む。
概して、環状ポリヌクレオチドを形成するために(直接的に、または、1つ以上の中間アダプターオリゴヌクレオチドを用いて)ポリヌクレオチドの末端を互いに接合することにより、接合配列を有する接合部が生成される。ポリヌクレオチドの5’末端および3’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター(例えば5’末端接合部または3’末端接合部の1つ)との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの5’末端と3’末端との間の接合部を指すことがある。ポリヌクレオチドの5’末端と3’末端が介在性のアダプター(例えば、一本鎖DNAの5’末端と3’末端)なしで接合される場合、用語「接合部」とはこれらの2つの末端が接合される点を指す。接合部は接合部を含むヌクレオチドの配列(「接合配列」とも呼ばれる)によって同定されることがある。
いくつかの実施形態において、サンプルは、天然の分解プロセス(細胞溶解、細胞死、および、例えば、無細胞のポリヌクレオチド、例えば、無細胞DNAおよび無細胞のRNAなどのDNAやRNAなどのポリヌクレオチドが細胞からその周辺環境(そこでさらに分解されることもある)に放出される他のプロセス)、サンプル処理(固定、染色、および/または保管手順)の副産物である断片化、ならびに、DNAを制限なく特定の標的配列に切断する方法による断片化(例えば、超音波処理などによる機械的な断片化;DNase I、フラグメンターゼ(fragmentase)などの非配列特異的なヌクレアーゼ処置)によって形成された末端の混合物を有するポリヌクレオチドを含む。サンプルが末端の混合物を有するポリヌクレオチドを含む場合、同じ5’末端または3’を有する2つのポリヌクレオチドの可能性は低く、2つのポリヌクレオチドが同じ5’末端と3’末端の両方を独立して有している可能性はもっと低い。これに応じて、いくつかの実施形態では、接合部は異なるポリヌクレオチドを識別するために使用されてもよく、この場合、2つのポリヌクレオチドは同じ標的配列を有する部分を含むことさえある。ポリヌクレオチド末端が介在性のアダプターなしで接合される場合、接合配列は参照配列へのアラインメントによって同定されることがある。例えば、2つの成分配列の順序が参照配列と逆であるように見える場合、その逆転が生じているように見える点はその点での接合部を示唆するものであり得る。ポリヌクレオチド末端が1つ以上のアダプター配列によって接合される場合、接合部は既知のアダプター配列への近接によって、あるいは、配列決定リードが環状化したポリヌクレオチドの5’末端と3’末端の両方の配列を得るのに十分な長さである場合には上のようなアラインメントによって同定されてもよい。いくつかの実施形態において、特定の接合部の形成は、それがサンプルの環状化したポリヌクレオチドの中で特有なものとなるような十分に稀な事象である。
いくつかの実施形態において、(a)において個々のポリヌクレオチドを環状化する工程は、複数のポリヌクレオチドをライゲーション反応へ晒すことによって達成される。ライゲーション反応はリガーゼ酵素を含んでもよい。いくつかの実施形態において、リガーゼ酵素は(b)における増幅の前に分解される。(b)における増幅の前のリガーゼの分解は、増幅可能なポリヌクレオチドの回収率を増大させることができる。いくつかの実施形態において、複数の環状化したポリヌクレオチドは(b)の前には精製または単離されない。いくつかの実施形態において、非環状化線状ポリヌクレオチドは増幅前に分解される。
場合によっては、(a)における環状化する工程は、複数のポリヌクレオチド中のポリヌクレオチドの5’末端、3’末端、あるいは5’末端と3’末端の両方へアダプターポリヌクレオチドを接合する工程を含む。ポリヌクレオチドの5’末端および3’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター(例えば5’末端接合部または3’末端接合部の1つ)との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの5’末端と3’末端との間の接合部を指すことがある。
環状化したポリヌクレオチドは、例えば、リガーゼ酵素の分解後に増幅されることで、増幅されたポリヌクレオチドをもたらすことができる。(b)における環状ポリヌクレオチドを増幅する工程は、鎖置換活性を有するポリメラーゼによって達成可能である。場合によっては、ポリメラーゼはPhi29 DNAポリメラーゼである。場合によっては、増幅はローリングサークル増幅(RCA)を含む。RCA由来の増幅されたポリヌクレオチドは、線状コンカテマー、あるいは鋳型ポリヌクレオチドからの標的配列(例えばサブユニット配列)の2つ以上のコピーを含むポリヌクレオチドを含むことができる。いくつかの実施形態において、増幅する工程は、環状ポリヌクレオチドを、ランダムプライマーを含む増幅反応混合物にさらす工程を含む。場合によっては、増幅する工程は、環状ポリヌクレオチドを1つ以上のプライマーを含む増幅反応混合物にさらす工程を含み、1つ以上のプライマーの各々は配列相補性によって異なる標的配列に特異的にハイブリダイズする。
増幅されたポリヌクレオチドは、場合によっては、切断されることで、未切断のポリヌクレオチドに対する長さが短い切断されたポリヌクレオチドを生成する。同じ線状コンカテマーから始まる2つ以上の切断されたポリヌクレオチドは、同じ接合配列を有することもあるが、異なる5’末端および/または3’末端を有することができる(例えば、末端を切断する)。
増幅されたポリヌクレオチドは、限定されないが、物理的な断片化、酵素法、および化学的な断片化などの任意の様々な方法を用いて切断可能である。増幅されたポリヌクレオチドの断片化に使用することができる物理的な断片化方法の非限定的な例は、音響切断(acoustic shearing)、超音波処理、および流体力学的切断(hydrodynamic shearing)を含む。場合によっては、音響切断と超音波処理が好ましいこともある。増幅されたポリヌクレオチドの断片化に使用することができる酵素の断片化方法の非限定的な例は、DNase I、および非特異的ヌクレアーゼやトランスポゼースを含む他の制限エンドヌクレアーゼなどの酵素の使用を含む。増幅されたポリヌクレオチドの断片化に使用することができる化学的な断片化方法の非限定的な例は、熱と二価金属のカチオンの使用を含む。
未切断のポリヌクレオチドと比較して長さが短い切断されたポリヌクレオチド(断片化されたポリヌクレオチドとも呼ばれる)は、配列リードとも呼ばれる配列決定リードを生成するために使用される配列決定機器の能力を一致させることが望ましいこともある。例えば、増幅されたポリヌクレオチドは、下流配列決定プラットフォームによって決定された最適な長さに、断片化、例えば切断されることもある。本明細書にさらに記載される様々な配列決定機器は、異なる長さの核酸を収容することができる。場合によっては、増幅されたポリヌクレオチドは、例えば、フローセル取り付けあるいは配列決定プライマー結合において、下流の配列決定プラットフォームで役立つアダプターを取り付けるプロセスで切断される。場合によっては、切断されたポリヌクレオチドは、配列決定の前に切断されたポリヌクレオチドの増幅産物を生成するために増幅に晒される。追加の増幅は、例えば、下流分析、例えば、配列決定分析のための十分な量のポリヌクレオチドを生成することが望ましいこともあり得る。結果として生じる増幅産物は、個々の切断されたポリヌクレオチドの複数のコピーを含むことができる。
配列決定中に、同じ増幅されたポリヌクレオチドから始まる切断されたポリヌクレオチドあるいはその増幅産物は配列決定可能である。配列決定に起因する配列決定リードは、リードファミリーへとグループ化可能である。リードファミリーは任意の適切な数の配列リードを含むことができる。場合によっては、リードファミリーは、少なくとも5、10、15、20、25、50、75、あるいは100の配列リードを含む。場合によっては、最小数の配列リードが存在していなければ、配列リードのグループはリードファミリーとして同定されないこともある。例えば、リードファミリーは少なくとも2、3、4、5、7、8、9、あるいは10の配列リードを含むことができる。場合によっては、リードファミリーは少なくとも25のリード配列を含む。場合によっては、配列リードは、共有される接合配列、および5’末端と3’末端の共有される配列に基づいてリードファミリーとして分類されてもよい。いくつかの実施形態において、リードファミリーの配列リードは同じ接合配列を有する。いくつかの実施形態において、リードファミリーの配列リードは、5’末端と3’末端で同じ配列を有し、例えば、配列は、5’末端と3’末端のそれぞれで少なくとも5つの塩基、6つの塩基、7つの塩基、8つの塩基、9つの塩基、あるいは10の塩基で同一となることもある。場合によっては、5’末端と3’末端の配列は、増幅および/または配列決定誤差に起因する誤差によりリードファミリーのすべての配列リードで同一ではない。例えば、アラインメントによって比較すると、リードファミリーの配列決定リードはオーバーラップを示すことがある。場合によっては、最適にアラインしたとき、リードファミリーの配列決定リードは少なくとも75%の同一性を示す。用語「パーセント(%)同一性」とは、必要に応じて、最大のパーセント同一性を達成するために、配列をアラインしてギャップを導入した後に2つの配列、例えば、候補配列と参照配列との間で共有される同一の残基の割合を指す(つまり、ギャップは、最適なアラインメントのための候補と参照配列の両方に導入可能であり、場合によっては、比較目的で非相同配列を無視することができる)。パーセント同一性を決定する目的のためのアラインメントは、例えば、BLAST、ALIGN、またはMegalign(DNASTAR)ソフトウェアなどの、公に利用可能なコンピュータソフトウェアを使用して、様々な方法で達成することができる。2つの配列のパーセント同一性は、BLASTを使用して試験配列を比較配列にアラインし、比較配列の同じ位置のアミノ酸あるいはヌクレオチドと同一であるアラインされた試験配列のアミノ酸あるいはヌクレオチドの数を決定し、比較配列中のアミノ酸あるいはヌクレオチドの数で同一のアミノ酸あるいはヌクレオチドの数を割ることによって計算することができる。最適にアラインするとき、ファミリーの2つの配列決定リードは任意の適切な長さの塩基で少なくとも75%の同一性(例えば、少なくとも80%、85%、90%、あるいは95%の同一性)を示すことができる。リードファミリー中の配列決定リード第1の対は、中の配列決定リードの第2の対とは異なる%同一性を示す場合がある。場合によっては、%同一性が、少なくとも50の塩基(例えば、少なくとも60の塩基、70の塩基、80の塩基、90の塩基、100の塩基、110の塩基、120の塩基、130の塩基、140の塩基、あるいは150の塩基)の長さにわたるアラインメントのために決定される。場合によっては、アラインメントは、約25−250の塩基、約50−200の塩基、約75−175の塩基、あるいは約100−150の塩基の長さにわたる。場合によっては、アラインメントは、試験配列あるいは比較配列の全長上にわたる。いくつかの実施形態において、リードファミリーの2つの配列決定リードは、最適にアラインするとき、少なくとも50の塩基(例えば、少なくとも60の塩基、70の塩基、80の塩基、90の塩基、100の塩基、110の塩基、120の塩基、130の塩基、140の塩基、あるいは150の塩基)の長さにわたって少なくとも75%の同一性(例えば、少なくとも80%、85%、90%、あるいは95%の同一性)を示す。
環状ポリヌクレオチド鋳型の線状コンカテマーを含む増幅されたポリヌクレオチドは、環状ポリヌクレオチド鋳型配列の多重反復あるいはコピーを含むことができる。増幅されたポリヌクレオチドから生成された切断されたポリヌクレオチドは、環状ポリヌクレオチド鋳型配列の様々なコピーを有することができる。切断されたポリヌクレオチドは、反復配列の1つ未満のコピー、反復配列の少なくとも1つのコピー、反復配列の少なくとも2つのコピー、あるいは反復配列の少なくとも3つのコピーを有することができる。切断されたポリヌクレオチド中の反復の数は、反復配列の長さに依存することがあり得る。例えば、およそ同じサイズの切断された断片について、比較的短い長さの反復を有するコンカテマーは、長い長さの反復を有するコンカテマーと比較して、反復配列のより多くのコピーを有する切断された断片を生成することができる。
切断されたポリヌクレオチドまたはその増幅産物の配列決定リードは、場合によっては、反復配列の少なくとも1つのコピーを含むことができる。場合によっては、配列決定リードは、反復配列の少なくとも2つのコピー(例えば、少なくとも3つのコピー、4つのコピー、あるいは5つのコピー)を含む。リードファミリーの配列リードからの反復配列のコピーの平均数は、核酸サンプルのポリヌクレオチドの長さに依存することがあり得る。
配列決定リードは、環状ポリヌクレオチド鋳型の配列に相当するコンカテマー中の反復されたセグメントの長さおよび/または配列を最初に同定することによりリードファミリーへ分類される。場合によっては、反復されたセグメントの長さおよび/または配列の同定は、他のリードへのリードのアラインメント、あるいは参照配列へのアラインメントを含む。次に、接合配列は、例えば、参照配列へのアラインメントによって同定することができる。ポリヌクレオチドの5’末端と3’末端の配列、および接合部からのそれらの相対的な距離(例えば、塩基中の)を決定することができる。5’末端と3’末端で同じ接合配列と共有される配列とを有するリードは、同じ切断されたポリヌクレオチドから始まる増幅産物の配列決定リードを表すリードファミリーへ分類可能である。
リードファミリーで観察される配列の差異は、場合によっては、その配列の差異がそれぞれの5’末端と3’末端で同じ接合配列であるが異なる配列を有する(例えば、少なくとも2つの切断されたポリヌクレオチド)第2のリードファミリーで生じることを確認することによって、増幅および/または配列決定誤差の結果とは反対に、真の配列の差異とコールすることができる。同じ接合配列であるが異なる5’末端および/または3’末端を有する2つのリードファミリーは、同じ線状コンカテマーの2つの切断されたポリヌクレオチドに対応することができる。同じ増幅されたポリヌクレオチドの2つの切断されたポリヌクレオチドに対応する2つのリードファミリーにおける配列の差異の観察は、その配列の差異が他の環状ポリヌクレオチド上で本当に存在し、かつ、切断されたポリヌクレオチドの1つにおける増幅および/または配列決定誤差の結果ではないことを確認するための一つの方法である。
場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの大部分で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの少なくとも50%(例えば、配列決定リードの少なくとも60%、70%、80%、90%、あるいは95%)で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの100%で生じる場合に、配列の差異とみなされる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第1の切断されたポリヌクレオチドからの配列決定リードの大部分と、第2の切断されたポリヌクレオチドからの配列決定リードの大部分で生じるときに、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が第1の切断されたポリヌクレオチドからの配列決定リードの少なくとも50%(例えば、配列決定リードの少なくとも60%、70%、80%、90%、あるいは95%)と、第2の切断されたポリヌクレオチドからの配列決定リードの少なくとも50%(例えば、少なくとも60%、70%、80%、90%、あるいは95%)で生じる場合に、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第1の切断されたポリヌクレオチドからの配列決定リードの100%と、第2の切断されたポリヌクレオチドからの配列決定リードの100%で生じるときに、配列変異体と呼ばれる。
サンプル中の配列決定リードから同定された配列の差異の存在を確認するために、同じ接合配列であるが異なる切断末端を有する2つの切断されたポリヌクレオチドである2つの異なる切断されたポリヌクレオチドを使用することによって、配列変異体の検出を改善することができる。真の配列変異体は、同じ増幅されたポリヌクレオチドから始まる少なくとも2つの切断されたポリヌクレオチドで見つかると予想されるが、誤差は2つ未満の切断されたポリヌクレオチドで見つかることが予想される。場合によっては、変異体検出の誤差率は減少する。いくつかの実施形態において、変異体検出の誤差率は、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、あるいは50%減少する。場合によっては、変異体検出の感度および/または特異性は増加する。いくつかの実施形態において、変異体検出の感度は、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、あるいは50%増加する。いくつかの実施形態において、変異体検出の特異性は、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、あるいは50%増加する。場合によっては、無病誤診率が減少する。
場合によっては、さらに(i)配列の差異が異なる接合部を有する少なくとも2つの環状ポリヌクレオチドで生じ、(ii)配列の差異が二本鎖入力分子の両方の鎖の上で同定され、および/または(iii)配列の差異がローリングサークル増幅(RCA)を含む増幅によって形成されたコンカテマーのコンセンサス配列で生じるときに、配列の差異を配列変異体としてコールする工程が生じる。場合によっては、参照配列は配列決定リードである。場合によっては、参照配列は、互いに配列決定リードをアラインすることにより形成されたコンセンサス配列である。
場合によっては、切断されたポリヌクレオチドは富化のない配列決定にさらされる。しかしながら、必要に応じて、増幅されたポリヌクレオチドおよび/または切断されたポリヌクレオチド中の1つ以上の標的ポリヌクレオチドを富化する工程は、配列決定の前に富化工程で実施可能である。例示的な富化工程は、標的配列に相補的な配列とともに核酸を使用することを含み得る。
配列変異体は、本明細書にさらに記載されるように、参照配列に対する任意の変動であり得る。本明細書に記載される方法を用いて検出可能な配列変異体の非限定的な例としては、一塩基多型(SNP)、欠失/挿入多型(DIP)、コピー数多型(CNV)、短いタンデム反復(STR)、単純反復配列(SSR)、可変数のタンデム反復(VNTR)、増幅断片長多型(AFLP)、レトロトランスポゾンベースの挿入多型、配列特異的な増幅多型、および配列変異体として検出可能なエピジェネティックマークの差(例えば、メチル化差)が挙げられる。場合によっては、配列変異体は一塩基多型などの多型である。場合によっては、配列変異体は原因遺伝子変異体である。場合によっては、配列変異体は癌のタイプまたはステージに関連付けられる。
核酸サンプルは被験体からのサンプルであり得る。場合によっては、サンプルはヒト被験体からのものである。場合によっては、サンプルは、ヒト被験体などの被験体の尿、便、血液、唾液、組織、あるいは体液を含む。場合によっては、サンプルは腫瘍細胞を含む。場合によっては、サンプルは、ホルマリン固定パラフィン包埋サンプルを含む。場合によっては、サンプルの複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。無細胞のポリヌクレオチドは無細胞DNAを含むことがあり、場合によっては、循環腫瘍DNAおよび/または循環腫瘍RNAを含むことがある。無細胞のポリヌクレオチドは無細胞のRNAを含むことがある。いくつかの実施形態において、上記方法はさらに、配列変異コールに基づいて、被験体を診断し、および、随意に処置する工程を含む。場合によっては、サンプル中の微生物汚染物質は配列変異コールに基づいて同定される。そのような場合、サンプルは被験体からのものであり得るが、土サンプルまたは食物サンプルなどの非被験体サンプルからのものであってもよい。
複数のポリヌクレオチドは一本鎖であり得る。場合によっては、ポリヌクレオチドは二本鎖形態であり、例えば、変性によって処置されることで、環状化を進める前に一本鎖をもたらす。場合によっては、二本鎖ポリヌクレオチドが環状化されることで二本鎖の環が得られ、二本鎖の環は例えば、変性によって処置されることで一本鎖の環が得られる。
別の態様では、本開示は、各々が5’末端と3’末端を有する複数のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する方法を提供する。いくつかの実施形態では、方法は:(a)複数の環状ポリヌクレオチドを形成するために上記複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、所定の環状ポリヌクレオチドが上記環状化に起因する接合配列を有する、工程と、(b)複数の増幅されたポリヌクレオチドを生成するために(a)の環状ポリヌクレオチドを増幅する工程であって、複数のポリヌクレオチドの第1の増幅されたポリヌクレオチドと複数のポリヌクレオチドの第2の増幅されたポリヌクレオチドが、接合配列を含むが、それぞれの5’末端および/または3’末端で異なる配列を含む、工程と、(c)第1の増幅されたポリヌクレオチドと第2の増幅されたポリヌクレオチドに対応する複数の配列決定リードを生成するために複数の増幅されたポリヌクレオチドおよび/またはその増幅産物を配列決定する工程と、(d)配列の差異が第1の増幅されたポリヌクレオチドと第2の増幅されたポリヌクレオチドの両方に対応する配列決定リードで生じるときに、配列決定リードで検出された配列の差異を配列変異体としてコールする工程とを含む。いくつかの実施形態において、(a)における個々のポリヌクレオチドを環状化する工程は、リガーゼ酵素によって達成される。いくつかの実施形態において、リガーゼ酵素は(b)における増幅の前に分解される。(b)における増幅の前のリガーゼの分解は、増幅可能なポリヌクレオチドの回収率を増大させることができる。いくつかの実施形態において、複数の環状化したポリヌクレオチドは(b)の前には精製または単離されない。
場合によっては、(a)における環状化する工程は、複数のポリヌクレオチド中のポリヌクレオチドの5’末端、3’末端、あるいは5’末端と3’末端の両方へアダプターポリヌクレオチドを接合する工程を含む。ポリヌクレオチドの5’末端および3’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター(例えば5’末端接合部または3’末端接合部の1つ)との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの5’末端と3’末端との間の接合部を指すことがある。
環状化の後で、環状ポリヌクレオチドが増幅される。(b)における環状ポリヌクレオチドを増幅する工程は、鎖置換活性を有するポリメラーゼによって達成可能である。場合によっては、ポリメラーゼはPhi29 DNAポリメラーゼである。場合によっては、(b)における環状ポリヌクレオチドを増幅する工程は、ローリングサークル増幅(RCA)を含む。ローリングサークル増幅は、鋳型環状ポリヌクレオチド配列の線状コンカテマーを含む増幅ポリヌクレオチドにもたらすことができる。場合によっては、(b)における増幅する工程は、ランダムプライマーを用いて、環状ポリヌクレオチドを、増幅反応混合物にさらす工程を含む。ランダムプライマーは、(b)の増幅の間に環状ポリヌクレオチドに非特異的に(例えばランダムに)ハイブリダイズすることができる。環状ポリヌクレオチドに非特異的にハイブリダイズすることができるランダムプライマーは、共通の環状ポリヌクレオチド、複数の環状ポリヌクレオチド、あるいはその両方にハイブリダイズすることができる。場合によっては、2つ以上のランダムプライマーは、同じ環状ポリヌクレオチド(例えば、同じ環状ポリヌクレオチドの異なる領域)にハイブリダイズし、同じ標的配列(あるいはサブユニット配列)の反復を有する増幅されたポリヌクレオチドをもたらすことができる。同じ鋳型の増幅されたポリヌクレオチド(例えば、環状ポリヌクレオチド)は同じ接合配列を有することができる。いくつかの実施形態において、個々のランダムプライマーは、互いに異なるそれぞれの5’末端および/または3’末端で配列を含み、結果として生じた増幅されたポリヌクレオチドは、互いに異なるそれぞれの5’末端および/または3’末端で配列を含むことができる。同じ鋳型の増幅されたポリヌクレオチドは、場合によっては、プライマーが最初に結合された場所、および、ヌクレオチド取り込みが終了した場所に依存して、異なる5’末端および/または3’末端を有する。場合によっては、(b)における増幅する工程は、環状ポリヌクレオチドを、標的特異的なプライマーを含む増幅反応混合物にさらす工程を含む。標的特異的なプライマーは、特定の遺伝子配列を標的とするプライマーを指すこともあれば、場合によっては、アダプターポリヌクレオチド配列を標的とするプライマーを指すこともあり得る。標的特異的なプライマーの使用に起因する増幅されたポリヌクレオチドは、共通の第1の末端(例えばプライマー)を共有することができ、ヌクレオチド取り込みが終了した場所次第では第2の末端を共有しないこともある。増幅する工程は、変性、プライマー結合、およびプライマー伸長の複数のサイクルを含むことができる。場合によっては、増幅されたポリヌクレオチドの増幅産物を生成するために、増幅されたポリヌクレオチドが、さらなる増幅にさらされる場合がある。追加の増幅は、例えば、下流分析、例えば、配列決定分析のための十分な量のポリヌクレオチドを生成することが望ましいこともあり得る。結果として生じる増幅産物は、個々の増幅されたポリヌクレオチドの複数のコピーを含むことができる。
増幅されたポリヌクレオチドおよび/または増幅産物はその後、配列決定されることで、配列決定リードが得られる。場合によっては、増幅されたポリヌクレオチドおよび/または増幅産物は、富化のない配列決定にさらされる。しかしながら、必要に応じて、増幅されたポリヌクレオチドおよび/または増幅産物中の1つ以上の標的ポリヌクレオチドを富化する工程は、配列決定の前に富化工程で実施可能である。
配列決定リードはリードファミリーへ分類可能である。リードファミリーは任意の適切な数の配列リードを含むことができる。場合によっては、リードファミリーは、少なくとも5、10、15、20、25、50、75、あるいは100の配列リードを含む。場合によっては、最小数の配列リードが存在していなければ、配列リードのグループはリードファミリーとして同定されないこともある。例えば、リードファミリーは少なくとも2、3、4、5、6、7、8、9、あるいは10の配列リードを含む。場合によっては、リードファミリーは少なくとも25のリード配列を含む。いくつかの実施形態において、リードファミリーの配列リードは同じ接合配列を有する。いくつかの実施形態において、リードファミリーの配列リードは、5’末端と3’末端で同じ配列を有し、例えば、配列は、5’末端と3’末端のそれぞれで少なくとも5つの塩基、6つの塩基、7つの塩基、8つの塩基、9つの塩基、あるいは10の塩基で同一となることもある。場合によっては、5’末端と3’末端の配列は、増幅および/または配列決定に起因する誤差によりリードファミリーのすべての配列リードで同一ではない。例えば、アラインメントによって比較すると、リードファミリーの配列決定リードはオーバーラップを示すことがある。場合によっては、最適にアラインしたとき、リードファミリーの配列決定リードは少なくとも75%の同一性を示す。最適にアラインするとき、ファミリーの2つの配列決定リードは任意の適切な長さの塩基で少なくとも75%の同一性(例えば、少なくとも80%、85%、90%、あるいは95%の同一性)を示すことができる。リードファミリー中の配列決定リード第1の対は、リードファミリー中の配列決定リードの第2の対とは異なる%同一性を示す場合がある。場合によっては、%同一性が、少なくとも50の塩基(例えば、少なくとも60の塩基、70の塩基、80の塩基、90の塩基、100の塩基、110の塩基、120の塩基、130の塩基、140の塩基、あるいは150の塩基)の長さにわたるアラインメントのために決定される。場合によっては、アラインメントは、約25−250の塩基、約50−200の塩基、約75−175の塩基、あるいは約100−150の塩基の長さにわたる。場合によっては、アラインメントは、試験配列あるいは比較配列の全長上にわたる。いくつかの実施形態において、リードファミリーの2つの配列決定リードは、最適にアラインするとき、少なくとも50の塩基(例えば、少なくとも60の塩基、70の塩基、80の塩基、90の塩基、100の塩基、110の塩基、120の塩基、130の塩基、140の塩基、あるいは150の塩基)の長さにわたって少なくとも75%の同一性(例えば、少なくとも80%、85%、90%、あるいは95%の同一性)を示す。
共有される環状ポリヌクレオチド鋳型の線状コンカテマーを含む増幅されたポリヌクレオチドは、同じ環状ポリヌクレオチド配列であるが複数の個々の分子上の複数の線状コンカテマーを生成することができる。増幅されたポリヌクレオチドまたはその増幅産物の配列決定リードは、場合によっては、反復配列の少なくとも1つのコピーを含むことができる。場合によっては、配列決定リードは、反復配列の少なくとも2つのコピー(例えば、少なくとも3つのコピー、4つのコピー、あるいは5つのコピー)を含む。リードファミリーの配列リードからの反復配列のコピーの平均数は、核酸サンプルのポリヌクレオチドの長さに依存することがあり得る。例えば、比較的長いポリヌクレオチドを含むサンプルは、コンカテマーが同様の長さの場合に、比較的短いポリヌクレオチドを含むサンプルと比較して、反復の少ないコンカテマーをもたらすこともある。
配列決定リードは、環状ポリヌクレオチド鋳型の配列に相当するコンカテマー中の反復されたセグメントの長さおよび/または配列を最初に同定することによりリードファミリーへ分類される。場合によっては、反復されたセグメントの長さおよび/または配列の同定は、他のリードへのリードのアラインメント、あるいは参照配列へのアラインメントを含む。次に、接合配列は、例えば、参照配列へのアラインメントによって同定することができる。ポリヌクレオチドの5’末端と3’末端の配列、および接合部からのそれらの相対的な距離(例えば、塩基中の)を決定することができる。5’末端と3’末端で同じ接合配列と共有される配列とを有するリードは、同じ増幅されたポリヌクレオチドまたは環状ポリヌクレオチドの同じ分子コピーから始まる増幅産物の配列決定リードを表すリードファミリーへ分類可能である。
リードファミリーで観察される配列の差異は、場合によっては、その配列の差異がそれぞれの5’末端と3’末端で同じ接合配列であるが異なる配列を有する第2のリードファミリーで生じることを確認することによって、増幅および/または配列決定誤差の結果とは反対に、真の配列の差異とコールすることができる。同じ接合配列であるが異なる5’末端および/または3’末端を有する2つのリードファミリーは、同じ環状ポリヌクレオチドの2つの増幅されたポリヌクレオチドに対応することができる。同じ環状ポリヌクレオチドに対応する2つのリードファミリーにおける配列の差異の観察は、その配列の差異が環状ポリヌクレオチド上に本当に存在し、かつ、増幅されたポリヌクレオチドの1つにおける増幅および/または配列決定誤差の結果ではないことを確認するための一つの方法であり得る。
場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの大部分で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの少なくとも50%(例えば、配列決定リードの少なくとも60%、70%、80%、90%、あるいは95%)で生じる場合に、配列の差異とみなされる。場合によっては、リードファミリーの配列リードで観察された配列の差異は、その配列の差異がリードファミリーの配列決定リードの100%で生じる場合に、配列の差異とみなされる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第1の増幅されたポリヌクレオチドからの配列決定リードの大部分と、第2の増幅されたポリヌクレオチドからの配列決定リードの大部分で生じるときに、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が第1の増幅されたポリヌクレオチドからの配列決定リードの少なくとも50%(例えば、配列決定リードの少なくとも60%、70%、80%、90%、あるいは95%)と、第2の増幅されたポリヌクレオチドからの配列決定リードの少なくとも50%(例えば、配列決定リードの少なくとも60%、70%、80%、90%、または95%)で生じる場合に、配列変異体と呼ばれる。場合によっては、配列決定リードで検出された配列の差異は、その配列の差異が、第1の増幅されたポリヌクレオチドからの配列決定リードの100%と、第2の増幅されたポリヌクレオチドからの配列決定リードの100%で生じるときに、配列変異体と呼ばれる。
本明細書に記載された方法を実行する際に、複数のポリヌクレオチドを含むサンプル中の変異体検出は改善可能である。場合によっては、変異体検出の誤差率は減少する。いくつかの実施形態において、変異体検出の誤差率は、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、あるいは50%減少する。場合によっては、変異体検出の感度および/または特異性は増加する。いくつかの実施形態において、変異体検出の感度は、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、あるいは50%増加する。いくつかの実施形態において、変異体検出の特異性は、少なくとも5%、10%、15%、20%、25%、30%、35%、40%、45%、あるいは50%増加する。場合によっては、無病誤診率が減少する。
配列変異体は、本明細書にさらに記載されるように、参照配列に対する任意の変動であり得る。本明細書に記載される方法を用いて検出可能な配列変異体の非限定的な例としては、一塩基多型(SNP)、欠失/挿入多型(DIP)、コピー数多型(CNV)、短いタンデム反復(STR)、単純反復配列(SSR)、可変数のタンデム反復(VNTR)、増幅断片長多型(AFLP)、レトロトランスポゾンベースの挿入多型、配列特異的な増幅多型、および配列変異体として検出可能なエピジェネティックマークの差(例えば、メチル化差)が挙げられる。場合によっては、配列変異体は一塩基多型などの多型である。
核酸サンプルは被験体からのサンプルであり得る。場合によっては、サンプルはヒト被験体からのものである。場合によっては、サンプルは、ヒト被験体などの被験体の尿、便、血液、唾液、組織、あるいは体液を含む。場合によっては、サンプルは腫瘍細胞を含む。場合によっては、サンプルは、ホルマリン固定パラフィン包埋サンプルを含む。場合によっては、サンプルの複数のポリヌクレオチドは無細胞のポリヌクレオチドを含む。無細胞のポリヌクレオチドは無細胞DNAを含むことがあり、場合によっては、循環腫瘍DNAを含むことがある。無細胞のポリヌクレオチドは無細胞RNAを含むことがあり、場合によっては、循環腫瘍RNAを含むことがある。
前に記載されたように、複数のポリヌクレオチドが一本鎖であり得る。場合によっては、ポリヌクレオチドは二本鎖形態であり、例えば、変性によって処置されることで、環状化を進める前に一本鎖をもたらす。場合によっては、二本鎖ポリヌクレオチドが環状化されることで二本鎖の環が得られ、二本鎖の環は例えば、変性によって処置されることで一本鎖の環が得られる。
他の態様では、本開示は、複数のポリヌクレオチドを含む核酸サンプルなどにおいてローリングサークル増幅を実施する方法を提供する。いくつかの実施形態において、複数のポリヌクレオチドの各々のポリヌクレオチドは5’末端と3’末端を有し、該方法は:(a)リガーゼ酵素を使用して複数の環状ポリヌクレオチドを形成するために、複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、各々のポリヌクレオチドが5’末端と3’末端との間に接合部を有する、工程と、(b)リガーゼ酵素を分解する工程と、および、(c)リガーゼ酵素を分解した後に(a)の環状ポリヌクレオチドを増幅する工程を含み、ポリヌクレオチドが工程(a)と(c)との間では精製または単離されない。いくつかの実施形態において、方法は、(d)複数の配列決定リードを生成するために、増幅されたポリヌクレオチドを配列決定する工程と、(e)配列決定リードと参照配列との間の配列の差異を同定する工程と、(f)異なる接合部を有する少なくとも2つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程の、追加の工程を含む。いくつかの実施形態では、方法は:配列決定リードと参照配列との間の配列の差異を同定する工程と、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程を含み、式中、(a)配列決定リードは、少なくとも2つの環状ポリヌクレオチドの増幅産物に対応し、(b)少なくとも2つの環状ポリヌクレオチドの各々は、それぞれのポリヌクレオチドの5’末端と3’末端をライゲートすることにより形成された異なる接合部を含む。
他の態様では、本開示は、複数のポリヌクレオチドを含む核酸サンプルなどにおいてローリングサークル増幅を実施する方法を提供する。いくつかの実施形態において、複数のポリヌクレオチドの各々のポリヌクレオチドは5’末端と3’末端を有し、該方法は:(a)複数の環状ポリヌクレオチドを形成するためにリガーゼ酵素を用いて複数のポリヌクレオチドの個々のポリヌクレオチドを環状化する工程であって、各々のポリヌクレオチドが5’末端と3’末端との間に接合部を有する、工程と、(b)リガーゼ酵素を分解する工程と、(c)増幅されたポリヌクレオチドを生成するために、リガーゼ酵素を分解した後に(a)の環状ポリヌクレオチドを増幅する工程であって、ポリヌクレオチドが工程(a)と(c)との間では精製または単離されない、工程と、(d)切断されたポリヌクレオチドを生成するために増幅されたポリヌクレオチドを切断する工程であって、各々の切断されたポリヌクレオチドが5’末端および/または3’末端に1つ以上の切断点を含む、工程を含む。いくつかの実施形態において、方法は、(e)複数の配列決定リードを生成するために、切断されたポリヌクレオチドを配列決定する工程と、(f)配列決定リードと参照配列との間の配列の差異を同定する工程と、(g)配列の差異が少なくとも2つの異なる切断されたポリヌクレオチドで生じるとき、配列の差異を配列変異体としてコールする工程とを含む。(c)における増幅の前のリガーゼの分解は、増幅可能なポリヌクレオチドの回収率を増大させることができる。
いくつかの実施形態では、方法は、配列決定リードと参照配列との間の配列の差異を同定する工程と、異なる接合部を有する少なくとも2つの環状ポリヌクレオチドで生じる配列の差異を配列変異体としてコールする工程を含み、式中、(a)配列決定リードは、少なくとも2つの環状ポリヌクレオチドの増幅産物に対応し、(b)少なくとも2つの環状ポリヌクレオチドの各々は、それぞれのポリヌクレオチドの5’末端と3’末端をライゲートすることにより形成された異なる接合部を含む。いくつかの実施形態では、方法は:(i)配列の差異が異なる接合部を有する少なくとも2つの環状ポリヌクレオチドで生じる場合に、配列の差異を配列変異体としてコールする工程と、(ii)配列の差異が二本鎖入力分子の両方の鎖の上で同定され、および/または(iii)配列の差異がローリングサークル増幅を含む増幅によって形成されたコンカテマーのコンセンサス配列で生じるときをさらに含む。
概して、用語「配列変異体」は、1つ以上の参照配列に対する配列の任意の変動を指す。典型的には、配列変異体は、その参照配列が知られている既知の個体の所定の集団の参照配列よりも低い頻度で生じる。例えば、特定の細菌属は、16S rRNA遺伝子のコンセンサス参照配列を有していることもあるが、その属内の個々の種は、細菌の集団中のその種を同定するのに役立つ遺伝子(あるいはその一部)内の1つ以上の配列変異体を有することもある。さらなる例として、同じ種(あるいは同じ個体の複数の配列決定リード)の複数の個体の配列は、最適にアラインされると、コンセンサス配列を生成することもあり、そのコンセンサスに対する配列変異体は危険な汚染を示す集団中の突然変異体を同定するために使用されてもよい。概して、「コンセンサス配列」は、一連の関連する核酸が様々な配列アラインメントアルゴリズムのいずれかに係る最適な配列アラインメントなどの徹底した数学的分析および/または配列分析にさらされた場合に、配列中の各位置の塩基の最も共通する選択を反映するヌクレオチド配列を指す。様々なアラインメントアルゴリズムは利用可能であり、その一部が本明細書に記載されている。いくつかの実施形態において、参照配列は、一人の個体のゲノム配列などの単一の既知の参照配列である。いくつかの実施形態において、参照配列は、参照集団として役立つ複数の個体のゲノム配列などの複数の既知の配列、あるいは同じ個体からのポリヌクレオチドの複数の配列決定リードをアラインすることにより形成されたコンセンサス配列である。いくつかの実施形態において、参照配列は、配列変異体が同じサンプル中の対応する配列に対しる変動を表わすように、分析中のサンプルからの配列を最適にアラインすることにより形成されたコンセンサス配列である。いくつかの実施形態において、配列変異体は、集団(「稀な」配列変異体とも呼ばれる)において低頻度で生じる。例えば、配列変異体は、約5%、4% 3% 2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%、あるいはそれ以下の頻度で生じることもある。いくつかの実施形態において、配列変異体は、約0.1%以下の頻度で生じる。
配列変異体は参照配列に対する任意の変動であり得る。配列変異は、単一のヌクレオチドあるいは複数のヌクレオチド(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上のヌクレオチド)の変化、挿入、あるいは欠失からなることもある。配列変異体が2つ以上のヌクレオチド差を含む場合、異なるヌクレオチドは互いに隣接していることもあれば、不連続なこともある。配列変異体の種類の非限定的な例としては、一塩基多型(SNP)、欠失/挿入多型(DIP)、コピー数多型(CNV)、短いタンデム反復(STR)、単純反復配列(SSR)、可変数のタンデム反復(VNTR)、増幅断片長多型(AFLP)、レトロトランスポゾンベースの挿入多型、配列特異的な増幅多型、および配列変異体として検出可能なエピジェネティックマークの差(例えば、メチル化差)が挙げられる。
本明細書に記載される方法にさらされてもよい核酸サンプルは任意の適切なソースに由来し得る。いくつかの実施形態では、使用されるサンプルは環境試料である。環境試料は、任意の環境ソース、例えば、自然発生雰囲気または人工雰囲気、水道、土、または任意の他の所望のサンプルからのものであり得る。いくつかの実施形態において、環境試料は、例えば、大気の病原体回収システム、表面下の堆積物、地下水、地中深くの古水、草原の植物根土壌界面、沿岸水、および下水処理場から得られてもよい。
サンプルからのポリヌクレオチドは、限定されないが、DNA、RNA、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、メッセンジャーRNA(mRNA)、これらのいずれかの断片、あるいはこれらの任意の2つ以上の組み合わせを含む様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態において、サンプルはDNAを含む。いくつかの実施形態において、サンプルはゲノムDNAを含む。いくつかの実施形態において、サンプルは、ミトコンドリアDNA、葉緑体DNA、プラスミドDNA、バクテリア人工染色体、酵母人工染色体、オリゴヌクレオチドタグ、またはそれらの組み合わせを含む。いくつかの実施形態において、サンプルは、限定されないが、ポリメラーゼ連鎖反応(PCR)、逆転写、およびこれらの組み合わせを含む、プライマーとDNAポリメラーゼとの適切な組み合わせを使用したプライマー伸張反応などによる増幅によって生成されたDNAを含む。プライマー伸張反応のための鋳型がRNAである場合、逆転写の産物は相補的DNA(cDNA)と呼ばれる。プライマー伸張反応に有用なプライマーは、1つ以上の標的に特異的な配列、ランダムシーケンス、部分的ランダムシーケンス、およびそれらの組み合わせを含み得る。一般に、サンプルのポリヌクレオチドは、サンプル中にポリヌクレオチドを含み、これは標的ポリヌクレオチドを含むこともあれば、含まない場合もある。ポリヌクレオチドは一本鎖、二本鎖で、またはこれらの組み合わせであり得る。いくつかの実施形態において、本開示の方法にさらされたポリヌクレオチドは一本鎖ポリヌクレオチドであり、これは二本鎖ポリヌクレオチドの存在下にあることもあれば、ないこともある。いくつかの実施形態において、ポリヌクレオチドは一本鎖DNAである。一本鎖DNA(ssDNA)は、一本鎖形態で単離されるssDNAであってもよく、または、二本鎖形態で単離され、その後、本開示の方法の1つ以上の工程の目的のために一本鎖にされるDNAであってもよい。
いくつかの実施形態において、ポリヌクレオチドは、抽出工程を伴わない、および/または精製工程を伴わない、その後の工程(例えば、環状化と増幅)にさらされる。例えば、流体サンプルは、精製された流体サンプルと細胞サンプルを生成する抽出工程なく細胞を撤去するために処置され、その後、精製された流体サンプルからDNAが単離されてもよい。沈澱または非特異的な結合などや、その後の結合したポリヌクレオチドを放出するための基質の洗浄などのポリヌクレオチドの単離のための様々な手順が利用可能である。ポリヌクレオチドが細胞抽出工程なくサンプルから単離される場合、ポリヌクレオチドは大部分が細胞外ポリヌクレオチドであるか、または死細胞あるいは損傷を受けた細胞に相当し得る無細胞DNAと無細胞RNAなどの「無細胞」ポリヌクレオチドである。そのような細胞の同一性は、腫瘍細胞(例えば、癌検出中)、胎児細胞(例えば、出生前診断中)、移植組織からの細胞(例えば、移植失敗の早期発見中)、あるいは微生物群のメンバーなどの、それらが由来する細胞または細胞の集団を特徴づけるために使用されてもよい。
サンプルがサンプル中の細胞などのポリヌクレオチドを抽出するために処置される場合、様々な抽出法が利用可能である。例えば、核酸は、フェノール、フェノール/クロロホルム/イソアミルアルコール、あるいはTRIzolおよびTriReagentを含む同様の製剤での有機抽出により精製され得る。抽出技術の他の限定されない例は、以下を含む:(1)自動核酸抽出器、例えばApplied Biosystems(Foster City, Calif.)から入手可能なModel 341 DNA Extractorの使用を伴うまたは伴わない、例えばフェノール/クロロホルムの有機試薬(Ausubel et al., 1993)を使用する、エタノール沈殿が後続する有機抽出;(2)固定相吸着法(米国特許第5,234,809号;Walsh et al., 1991);および(3)典型的に「塩析」方法と称される沈澱法などの、塩で誘導された核酸沈澱法(Miller et al., (1988))。核酸の単離および/または精製の別の例は磁性粒子の使用を含み、核酸は特異的または非特異的に磁性粒子に結合し、その後磁石を使用してビーズを単離し、洗浄し、そしてビーズから核酸を溶出することができる(例えば米国特許第5,705,628号を参照)。いくつかの実施形態において、上記の単離方法は、サンプルから不要なタンパク質を取り除くのに役立つ酵素消化工程、例えばプロテイナーゼKまたは他のプロテアーゼによる消化より始められてもよい。例えば、米国特許第7,001,724号を参照。望ましい場合、RNase阻害剤を、溶解緩衝液に追加することができる。特定の細胞またはサンプル型について、前記プロトコルにタンパク質変性/消化の工程を加えることが望ましい場合もある。精製方法は、DNA、RNA、またはその両方を単離することを目的とし得る。抽出手順の間またはその後にDNAとRNAの両方が一緒に単離されると、更なる工程を利用して、一方または両方を他とは別々に精製することができる。例えば、サイズ、配列、または他の物理的若しくは化学的特性による精製により、抽出した核酸の細画分を生成することもできる。最初の核酸単離工程に加えて、過剰または不要な試薬、反応物、あるいは産物を除去するなどのために、開示された方法における任意の工程の後に核酸の精製を実施することができる。サンプル中の核酸の量および/または純度を決定する様々な方法は、ラベル(例えば、SYBR green、SYBR blue、DAPI、ヨウ化プロピジウム、Hoechst染色、SYBR gold、エチジウムブロマイドなどの蛍光染料および挿入剤)の吸光度(例えば、260nm、280nmでの光の吸光度とこれらの比率)および検出によるなどして利用可能である。
望ましい場合、サンプルからのポリヌクレオチドはさらなる処理の前に断片化されてもよい。断片化は、化学的、酵素的、および機械的な断片化を含む、様々な方法のいずれかにより達成されてもよい。いくつかの実施形態において、断片は、10−800、10−500、50−500、90−200、あるいは50−150のヌクレオチドなどの長さが約10〜約1,000のヌクレオチドの平均長または中央長を有する。いくつかの実施形態において、断片は、約100、200、300、500、600、800、1000、あるいは1500以下のヌクレオチドの平均長または中央長を有する。いくつかの実施形態において、断片は約90−200のヌクレオチドに及び、および/または、約150のヌクレオチドの平均長を有する。いくつかの実施形態において、断片化は、サンプルのポリヌクレオチドの音響超音波処理への暴露を含んで機械的に遂行される。いくつかの実施形態において、断片化は、ニ本鎖核酸切断を生成するために、1以上の酵素に適切な条件下で1以上の酵素でサンプルポリヌクレオチドを処理する工程を含む。ポリヌクレオチド断片の生成に有用な酵素の例は、配列に特異的な及び配列に非特異的なヌクレアーゼを含んでいる。ヌクレアーゼの非限定的な例は、DNase I、フラグメンターゼ、制限エンドヌクレアーゼ、それらの変異体、及びそれらの組み合わせを含む。例えば、DNase Iでの消化は、Mg++が無い状態及びMn++がある状態で、DNA中のランダムなニ本鎖切断を誘導することができる。いくつかの実施形態において、断片化は、1以上の制限エンドヌクレアーゼでサンプルポリヌクレオチドを処理する工程を含む。断片化は、5’オーバーハング、3’オーバーハング、平滑末端、またはそれらの組み合わせを有する断片を生成することができる。いくつかの実施形態において、断片化が1以上の制限エンドヌクレアーゼの使用を含む場合などには、サンプルポリヌクレオチドの切断は、予測可能な配列を有するオーバーハングを残す。断片化ポリヌクレオチドは、アガロースゲルからのカラム精製または単離などの標準的な方法を介して断片のサイズを選択する工程にさらされることもある。
いくつかの実施形態に従って、サンプルからの複数のポリヌクレオチド中のポリヌクレオチドが環状化される。環状化は、ポリヌクレオチドの5’末端を、同じポリヌクレオチドの3’末端に、別のポリヌクレオチドの3’末端に、あるいは、異なるソース(例えば、オリゴヌクレオチドアダプターなどの人工ポリヌクレオチド)のポリヌクレオチドの3’末端に接合することを含み得る。いくつかの実施形態において、ポリヌクレオチドの5’末端は同じポリヌクレオチドの3’末端に接合される(「自己接合(self−joining)」とも呼ばれる)。いくつかの実施形態では、環状化反応の条件は、特定の平均長の環状化したポリヌクレオチドの集団を生成するために、特定の長さの範囲内のポリヌクレオチドの自己接合を支持するように選択される。例えば、環状化反応条件は、長さが約5000、2500、1000、750、500、400、300、200、150、100、50、またはそれ以下のヌクレオチドよりも短いポリヌクレオチドの自己接合を支持するように選択されてもよい。いくつかの実施形態において、50−5000のヌクレオチド、100−2500のヌクレオチド、あるいは150−500のヌクレオチドの長さを有する断片は、環状化したポリヌクレオチドの平均長がそれぞれの範囲に含まれるように、好まれる。いくつかの実施形態において、環状化した断片の80%以上は、長さが50−200のヌクレオチドなどの長さが50−500のヌクレオチドである。最適化され得る反応条件としては、接合反応に割り当てられる時間の長さ、様々な試薬の濃度、および接合されるポリヌクレオチドの濃度が挙げられる。いくつかの実施形態において、環状化反応は、環状化の前にサンプル中に存在する断片長さの分布を維持する。例えば、環状化の前のサンプル中の断片長さ、および環状化したポリヌクレオチドの平均値、中央値、モード、および標準偏差の1つ以上は、互いの75%、80%、85%、90%、あるいは95%またはそれ以上の範囲内である。
場合によっては、自己接合環状化産物を優先的に形成するよりもむしろ、1つ以上のアダプターオリゴヌクレオチドが使用され、サンプル中のポリヌクレオチドの5’末端と3’末端が環状ポリヌクレオチドを形成するために1つ以上の介在性のアダプターオリゴヌクレオチドによって接合されるようになる。例えば、ポリヌクレオチドの5’末端は、アダプターの3’末端に接合可能であり、同じアダプターの5’末端は同じポリヌクレオチドの3’末端に接合可能である。アダプターオリゴヌクレオチドは、サンプルポリヌクレオチドに接合可能な配列(その少なくとも一部は既知である)を有する任意のオリゴヌクレオチドを含む。アダプターオリゴヌクレオチドは、DNA、RNA、ヌクレオチドアナログ、非標準のヌクレオチド、標識されたヌクレオチド、修飾されたヌクレオチド、またはこれらの組み合わせを含み得る。アダプターオリゴヌクレオチドは、一本鎖、二本鎖、または部分的に二重であり得る。一般に、部分的に二重のアダプターは、1つ以上の一本鎖領域及び1つ以上の二本鎖領域を含む。二本鎖アダプターは、互いにハイブリダイズされた2つの別個のオリゴヌクレオチド(「オリゴヌクレオチドデュプレックス」とも称される)を含み、ハイブリダイゼーションは、1つ以上の平滑末端、1つ以上の3’オーバーハング、1つ以上の5’オーバーハング、ミスマッチおよび/または非対合のヌクレオチドに由来する1つ以上のバルジ、またはこれらの任意の組み合わせを含み得る。アダプターの2つのハイブリダイズされた領域がハイブリダイズされていない領域によって互いに分離されと、「バブル」構造が結果として生じる。異なる配列のアダプターなどの様々な種類のアダプターが組み合わせて使用可能である。異なるアダプターは、連続反応で、あるいは同時に、サンプルポリヌクレオチドに接合することができる。いくつかの実施形態において、同一のアダプターが標的ポリヌクレオチドの両末端に追加される。例えば、第1及び第2のアダプターを同じ反応に加えることができる。アダプターは、サンプルポリヌクレオチドと接合する前に、操作可能である。例えば、末端リン酸塩が追加または除去され得る。
アダプターオリゴヌクレオチドが使用される場合、アダプターオリゴヌクレオチドは様々な配列因子の1つ以上を含み、限定されないが、配列またはその補体をアニールする1つ以上の増幅プライマー、配列またはその補体をアニールする1つ以上の配列決定プライマー、1つ以上のバーコード配列、多数の異なるアダプターまたは異なるアダプターのサブセット中で共有される1つ以上の共通配列、1つ以上の制限酵素認識部位、1つ以上の標的ポリヌクレオチドオーバーハングに相補的な1つ以上のオーバーハング、1つ以上のプローブ結合部位(例えば、Illumina,Inc.により開発されたフローセルなどの大規模並列配列決定のためのフローセルなどの配列決定プラットフォームへ接合するためのもの)、1つ以上のランダムまたはほぼランダムな配列(例えば、1つ以上の位置で2つ以上の異なるヌクレオチドのセットから無作為に選択された1つ以上のヌクレオチドであり、異なるヌクレオチドの各々はランダム配列を含むアダプターのプールの中で表される1つ以上の位置で選択される)、及びこれらの組み合わせが挙げられる。場合によっては、アダプターは、例えば、アダプターに相補的な配列を含むオリゴヌクレオチドでコーティングされるビーズ(とりわけ、取り扱いやすいため、磁気ビーズ)を使用することによりアダプターを含むこうした環を精製するために使用されてもよく、アダプターは、ハイブリダイゼーションにより適切なアダプターで閉じた環を「捕捉し」、アダプターやライゲートされていない成分を含まない環を洗い流し、その後、ビーズから捕捉した環を放出することができる。加えて、場合によっては、ハイブリダイズされたキャプチャプローブと標的の環の複合体は、直接ローリングサークル増幅(RCA)などによってコンカテマーを生成するために直接使用可能である。いくつかの実施形態において、環のアダプターも配列決定プライマーとして使用することができる。2つ以上の配列因子は、互いに隣接しておらず(例えば、1つ以上のヌクレオチドにより分離される)、互いに隣接し、部分的に重複し、または完全に重複し得る。例えば、配列をアニールする増幅プライマーは、配列をアニールする配列決定プライマーとしても役立つことができる。配列因子を、3’末端またはその付近に、5’末端またはその付近に、あるいはアダプターオリゴヌクレオチドの内部に位置付けることができる。配列要素は、長さが約3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50または以上のヌクレオチド以下など、任意の適切な長さであってもよい。アダプターオリゴヌクレオチドは、それらが構成される1つ以上の配列因子を収容するのに少なくとも十分な、任意の適切な長さを有し得る。いくつかの実施形態において、アダプターは、長さが約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、200またはそれ以上のヌクレオチドである。いくつかの実施形態において、アダプターオリゴヌクレオチドは、長さが約15〜35のヌクレオチドなど、長さが約12〜40のヌクレオチドの範囲である。
いくつかの実施形態において、1つのサンプルからの断片化されたポリヌクレオチドに接合されたアダプターオリゴヌクレオチドは、すべてのアダプターオリゴヌクレオチドに共通の1つ以上の配列と、その特定のサンプルのポリヌクレオチドに接合されたアダプターに特有のバーコードとを含み、バーコード配列は、1つのサンプルあるいはアダプター接合反応から始まるポリヌクレオチドを、別のサンプルあるいはアダプター接合反応から始まるポリヌクレオチドと区別するために、使用可能となる。いくつかの実施形態において、アダプターオリゴヌクレオチドは、1つ以上の標的ポリヌクレオチドオーバーハングに相補的な5’オーバーハング、3’オーバーハング、またはその両方を含む。相補的なオーバーハングは、長さが1以上のヌクレオチドであり、限定されないが、長さが1、2、3、4、5、6、7、8、9、10、11、12、13、14、15以上のヌクレオチドが挙げられる。相補的なオーバーハングは固定配列を含み得る。アダプターオリゴヌクレオチドの相補的なオーバーハングは、1つ以上のヌクレオチドのランダム配列を含んでもよく、1つ以上のヌクレオチドが1つ以上の位置で2つ以上の異なるヌクレオチドのセットから無作為に選択されるようになり、異なるヌクレオチドの各々は、ランダム配列を含む相補的なオーバーハングを備えたアダプターのプールの中で表される1つ以上の位置で選択される。いくつかの実施形態において、アダプターのオーバーハングは、制限エンドヌクレアーゼ消化によって生成された標的ポリヌクレオチドのオーバーハングに相補的である。いくつかの実施形態において、アダプターのオーバーハングはアデニンまたはチミンからなる。
ポリヌクレオチドを環状化する様々な方法が利用可能である。図28のA−Eはポリヌクレオチドを環状化するための方法の非限定的な例を例示する。いくつかの実施形態において、環状化は、リガーゼ(例えば、RNAまたはDNAリガーゼ)の使用などの酵素反応を含む。限定されないが、Circligase(商標)(Epicentre; Madison, WI)、RNAリガーゼ、T4 RNAリガーゼ1(ssRNAリガーゼ、これはDNAとRNAの両方に作用する)を含む様々なリガーゼが利用可能である。加えて、dsDNA鋳型が存在しない場合、T4DNAリガーゼはさらにssDNAをライゲートすることができるが、これは通常はゆっくりとした反応である。リガーゼの他の非限定的な例としては、Taq DNAリガーゼ、Thermus filiformis(サーマス・フィリフォルミス)DNAリガーゼ、エシェリキア・コリDNAリガーゼ、Tth DNAリガーゼ、サーマス・スコトダクタス(Thermus scotoductus)DNAリガーゼ(IおよびII)、熱安定リガーゼ、Ampligase熱安定DNAリガーゼ、VanC型リガーゼ、9°N DNAリガーゼ、Tsp DNAリガーゼ、及びバイオプロスペクティングにより発見された新しいリガーゼを含む、NAD−依存性リガーゼ;T4 RNAリガーゼ、T4 DNAリガーゼ、T3 DNAリガーゼ、T7 DNAリガーゼ、Pfu DNAリガーゼ、DNAリガーゼ1、DNAリガーゼIII、DNAリガーゼIV、及びバイオプロスペクティングにより発見された新しいリガーゼを含む、ATP依存性リガーゼ;並びに、それらの野生型、突然変異体アイソフォーム、及び遺伝的に設計された変異体が挙げられる。自己接合が望ましい場合、ポリヌクレオチドと酵素の濃度は、分子間構造よりもむしろ、分子内の環の形成を促進するために調節可能である。反応温度と時間は同様に調節することができる。いくつかの実施形態において、分子内の環を促進するために60°Cが使用される。いくつかの実施形態において、反応時間は12−16時間である。反応条件は選択された酵素のメーカーによって指定されたものであってもよい。いくつかの実施形態において、エキソヌクレアーゼ工程は、環状化反応の後に任意のライゲートされていない核酸を消化するために含まれることがある。すなわち、閉じた環は遊離5’末端または3’末端を含まず、したがって、5’または3’エキソヌクレアーゼの導入は、閉じた環を消化しないが、ライゲートされていない成分を消化する。これは多重な系で特定の用途を見出されることもある。
概して、環状ポリヌクレオチドを形成するために(直接的に、または、1つ以上の中間アダプターオリゴヌクレオチドを用いて)ポリヌクレオチドの末端を互いに接合することにより、接合配列を有する接合部が生成される。ポリヌクレオチドの5’末端および3’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター(例えば5’末端接合部または3’末端接合部の1つ)との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの5’末端と3’末端との間の接合部を指すことがある。ポリヌクレオチドの5’末端と3’末端が介在性のアダプター(例えば、一本鎖DNAの5’末端と3’末端)なしで接合される場合、用語「接合部」とはこれらの2つの末端が接合される点を指す。接合部は接合部を含むヌクレオチドの配列(「接合配列」とも呼ばれる)によって同定されることがある。いくつかの実施形態において、サンプルは、天然の分解プロセス(細胞溶解、細胞死、および、DNAが細胞からその周辺環境(そこで、無細胞のポリヌクレオチド、無細胞DNA、および無細胞のRNAなどでさらに分解されることもある)に放出される他のプロセス)、サンプル処理(固定、染色、および/または保管手順)の副産物である断片化、ならびに、DNAを制限なく特定の標的配列に切断する方法による断片化(例えば、超音波処理などによる機械的な断片化;DNase I、フラグメンターゼ(fragmentase)などの非配列特異的なヌクレアーゼ処置)によって形成された末端の混合物を有するポリヌクレオチドを含む。サンプルが末端の混合物を有するポリヌクレオチドを含む場合、2つのポリヌクレオチドが同じ5’末端または3’を有する可能性は低く、2つのポリヌクレオチドが同じ5’末端と3’末端の両方を独立して有している可能性は著しく低い。これに応じて、いくつかの実施形態では、接合部は異なるポリヌクレオチドを識別するために使用されてもよく、この場合、2つのポリヌクレオチドは同じ標的配列を有する部分を含むことさえある。ポリヌクレオチド末端が介在性のアダプターなしで接合される場合、接合配列は参照配列へのアラインメントによって同定されることがある。例えば、2つの成分配列の順序が参照配列と逆であるように見える場合、その逆転が生じているように見える点はその点での接合部を示唆するものであり得る。ポリヌクレオチド末端が1つ以上のアダプター配列によって接合される場合、接合部は既知のアダプター配列への近接によって、あるいは、配列決定リードが環状化したポリヌクレオチドの5’末端と3’末端の両方の配列を得るのに十分な長さである場合には上のようなアラインメントによって同定されてもよい。いくつかの実施形態において、特定の接合部の形成は、それがサンプルの環状化したポリヌクレオチドの中で特有なものとなるような十分に稀な事象である。
図4のA−Cはポリヌクレオチドを環状化する方法の3つの非限定的な例を例示する。上(図4のA)では、ポリヌクレオチドはアダプターがない状態で環状化され、中央のスキーム(図4のB)はアダプターの使用を描き、下のスキーム(図4のC)は2つのアダプターを利用する。2つのアダプターが使用される場合、1つはポリヌクレオチドの5’末端に接合され、もう一方のアダプターは同じポリヌクレオチドの3’末端に接合可能である。いくつかの実施形態において、アダプターライゲーションは、ライゲーションを促進する2つのアダプターに相補的な「副木(splint)」核酸と共に、2つの異なるアダプターの使用を含むことがある。分岐した、あるいは、「Y」のアダプターも使用されることがある。2つのアダプターが使用される場合、両末端に同じアダプターを有するポリヌクレオチドは、自己アニーリングにより後の工程で除去されることがある。図1−3は、アダプターのない状態(図1)で、およびアダプターのある状態(図2および3)で、ポリヌクレオチドが環状化される、本開示の方法の実施形態を描く。アダプターを有する(図2および3)環状化したポリヌクレオチドは、標的特異的なプライマー(図2)、あるいはアダプター配列にハイブリダイズするプライマー(図3)を使用して、ローリングサークル増幅(RCA)によって増幅可能である。
図6のA−Bは、一本鎖DNAなどのポリヌクレオチドを環状化するさらなる非限定的な例となる方法を例証する。アダプターはポリヌクレオチドの5’または3’の末端のいずれかに非対称的に追加可能である。図6のAで示されるように、一本鎖DNA(ssDNA)は3’末端に遊離ヒドロキシル基を有することができ、アダプターは、リガーゼの存在下で、好ましい反応がアダプターの5’末端にssDNAの3’末端を接合するように、閉塞した3’末端を有することができる。この実施形態では、環を形成する分子内ライゲーションの前に、単一のssDNA断片および単一のアダプターの分子間ライゲーションを駆り立てるために、ポリエチレングリコール(PEG)などの薬剤を使用することが有用なこともある。末端の逆の順序でも行うことができる(閉塞した3’、遊離5’など)。いったん線形ライゲーションが遂行されると、ライゲートされた部分は、キナーゼあるいは他の適切な酵素の使用あるいは化学的作用を介するなどして、閉塞部分を取り除くために酵素で処置可能である。いったん閉塞部分が取り除かれると、CircLigaseなどの環状化酵素の追加により、分子内反応は環状化したポリヌクレオチドを形成することができる。図6のBで示されるように、5’末端または3’末端が閉塞された1つの鎖を有する二本鎖アダプターを使用することにより、二本鎖構造を形成することができ、これは、ライゲーション時にニックを有する二本鎖断片を生成する。その後、2つの鎖を分離させることができ、閉塞部分を取り除き、一本鎖断片を環状化することで環状化したポリヌクレオチドが形成される。場合によっては、図8で示されるように、二本鎖DNA(dsDNA)が環状化されることで、環状化した二本鎖環がもたらされる。二本鎖環は、両方の鎖のプライマー結合と増幅を可能にするために、変性され得る。
いくつかの実施形態において、分子内の環状化の速度を増強するために、分子クランプを用いてポリヌクレオチド(例えば、一本鎖DNA)の2つの末端を1つにする。1つのこうしたプロセスの例図が図5で提供される。これはアダプターを用いても用いなくても行うことができる。分子クランプの使用は、平均ポリヌクレオチド断片が、長さが約100のヌクレオチドよりも大きいときに特に役立つことがある。いくつかの実施形態において、分子クランププローブは3つのドメイン:第1のドメイン、介在性ドメイン、および第2のドメインを含む。第1と第2のドメインは、配列相補性によって標的ポリヌクレオチド中の対応する配列にハイブリダイズする。分子クランププローブの介在性ドメインは、標的配列とは有意にハイブリダイズしないことがある。標的ポリヌクレオチドを用いるクランプのハイブリダイゼーションは、標的配列の2つの末端を接近させることができ、これにより、環状化酵素の存在下において標的配列の分子内環状化が促される。いくつかの実施形態において、分子クランプが増幅プライマーとして同様に役立つことができるとき、これはさらに有用である。
環状化の後、ライゲーション酵素はタンパク質分解工程を使用して、反応産物から取り除かれる。いくつかの実施形態において、タンパク質分解は、環状化反応で使用されるリガーゼを除去または分解するための処置を含む。いくつかの実施形態において、リガーゼを分解する処置は、プロテイナーゼKなどのプロテアーゼを用いる処置を含む。プロテイナーゼKによる処置は、メーカーのプロトコル、または、標準的なプロトコル(例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012)で提供される)に従ってもよい。いくつかの実施形態において、タンパク質分解は、低いpHあるいは酸性溶液または緩衝液を用いる処置を含む。いくつかの実施形態において、タンパク質分解は、例えば、55°Cよりも高く、60°Cよりも高く、65°Cよりも高く、70°Cよりも高く、あるいはそれ以上に反応を加熱するなど、反応を加熱することを含む。いくつかの実施形態において、線状ポリヌクレオチドは環状化の後に分解される。いくつかの実施形態において、線状ポリヌクレオチドはエキソヌクレアーゼを使用して分解される。いくつかの実施形態では、エキソヌクレアーゼはラムダエクソヌクレアーゼを含む。いくつかの実施形態では、エキソヌクレアーゼはRecJfヌクレアーゼを含む。いくつかの実施形態において、エキソヌクレアーゼは、ExoI、ExoIII、ExoV、ExoVII、およびExoTの少なくとも1つから選択される。
環状化は、環状化したポリヌクレオチドの配列決定を直接伴うこともある。代替的に、配列決定は、1つ以上の増幅反応に先行することがある。概して、「増幅」とは、1つ以上のコピーが標的ポリヌクレオチドまたはその一部で作られるプロセスを指す。ポリヌクレオチド(例えば、DNAおよび/またはRNA)を増幅する様々な方法が利用可能である。増幅は線状であるか、指数関数的であるか、または多相の増幅プロセスにおいて直線位相と指数関数位相の両方を含むこともある。増幅方法は、熱変性工程などの温度の変動を含むこともあれば、あるいは熱変性を必要としない等温過程であることもある。ポリメラーゼ連鎖反応(PCR)は、変性の複数のサイクル、反対の鎖へのプライマー対のアニーリング、および標的配列のコピー数を指数関数的に増大させるプライマー伸長を使用する。アニールされた核酸鎖の変性は、加熱、局所的な金属イオン濃度の増加(例えば、米国特許第6,277,605号)、超音波放射(例えば、WO/2000/049176)、電圧の印加(例えば、米国特許第5,527,670号、米国特許第6,033,850号、米国特許第5,939,291号、および米国特許第6,333,157号)、ならびに、磁気反応性材料に結合されたプライマーと組み合わせた電磁場の適用(例えば、米国特許第5,545,540号)によって達成されてもよい。RT−PCRと呼ばれるバリエーションでは、逆転写酵素(RT)はRNAから相補的DNA(cDNA)を作るために使用され、その後、DNA(例えば、米国特許第5,322,770号と米国特許第5,310,652号)の複数のコピーを生成するためにcDNAはPCRによって増幅される。等温の増幅方法の1つの例は一般にSDAと呼ばれる鎖置換増幅であり、これは、標的配列の反対側の鎖に対してプライマー配列をアニールするサイクル、二重のヘミホスホロチオエート化した(hemiphosphorothioated)プライマー伸長産物を生成するためのdNTPの存在下におけるプライマー伸長、ヘミ修飾された(hemimodified)制限エンドヌクレアーゼ認識部位のエンドヌクレアーゼ媒介性のニッキング、および、産物の幾何学的な増幅をもたらす、プライマーのアニーリング、ニッキング、ならびに、鎖置換の次のラウンドのために、既存の鎖を置き換えて鎖を生成するべくニックの3’末端からのポリメラーゼ媒介性のプライマー伸長(例えば、米国特許第5,270,184号と米国特許第5,455,166号)を用いる。好熱性SDA(tSDA)は、本質的に同じ方法でより高温度で好熱性のエンドヌクレアーゼとポリメラーゼを使用する(欧州特許第0,684 315)。他の増幅方法は、ローリングサークル増幅(RCA)(例えば、Lizardi, “Rolling Circle Replication Reporter Systems,”米国特許第5,854,033号);ヘリカーゼ依存性増幅(HDA)(例えば、Kong et al.,“Helicase Dependent Amplification Nucleic Acids,” 米国特許出願公開2004−0058378 A1);および、ループ媒介性の等温増幅(LAMP)(例えば、Notomi et al., “Process for Synthesizing Nucleic Acid,”米国特許第6,410,278号)を含む。場合によっては、等温増幅は、オリゴヌクレオチドプライマーに組み入れられることもあるような、プロモーター配列からのRNAポリメラーゼによる転写を利用する。転写に基づく増幅方法は、NASBAと呼ばれる核酸配列ベースの増幅(例えば、米国特許第5,130,238号);Qβレプリカーゼと一般に呼ばれる、プローブ分子自体を増幅するためのRNA複製酵素の使用に依存する方法(例えば、Lizardi,P.et al.(1988)BioTechnol.6, 1197−1202);自家持続配列複製法(例えば、Guatelli, J. et al. (1990) Proc. Natl. Acad. Sci. USA 87, 1874−1878; Landgren (1993) Trends in Genetics 9, 199−202; および、HELEN H. LEE et al., NUCLEIC ACID AMPLIFICATION TECHNOLOGIES (1997));ならびに、追加の転写鋳型を生成するための方法(例えば、米国特許第5,480,784号と米国特許第5,399,491号)を含む。等温の核酸増幅のさらなる方法は、追加のプライマー(例えば、米国特許第6,251,639号、米国特許第6,946,251号、および米国特許第7,824,890号)の結合部位を露出させるために非標準のヌクレオチド(例えば、DNAグリコシラーゼまたはRNaseH)で核酸を切断する酵素と組み合わせて、非標準のヌクレオチド(例えば、ウラシルあるいはRNAヌクレオチド)を含有するプライマーの使用を含む。等温の増幅プロセスは線状であってもよく、あるいは指数関数的であってもよい。
いくつかの実施形態では、増幅はローリングサークル増幅(RCA)を含む。典型的なRCA反応混合物は、1つ以上のプライマー、ポリメラーゼ、およびdNTPを含み、コンカテマーを生成する。典型的には、RCA反応でのポリメラーゼは鎖置換活性を有するポリメラーゼである。様々なこうしたポリメラーゼが利用可能であり、その非限定的な例としては、エキソヌクレアーゼ minus DNAポリメラーゼI large(Klenow)断片、Phi29 DNAポリメラーゼ、Taq DNAポリメラーゼなどが挙げられる。概して、コンカテマーは、鋳型ポリヌクレオチドからの標的配列の2つ以上のコピー(例えば、標的配列の約2、3、4、5、6、7、8、9、10、あるいはそれ以上のコピー;いくつかの実施形態では、約2つ以上のコピー)を含むポリヌクレオチド増幅産物である。増幅プライマーは、約または少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、またはそれ以上のヌクレオチドなど、任意の適切な長さであってもよく、その一部または全ては、プライマーがハイブリダイズする対応する標的配列に相補的であってもよい(例えば、約または少なくとも約5、10、15、20、25、30、35、40、45、50、またはそれ以上のヌクレオチド)。図7のA−Cは、適切なプライマーの3つの非限定的な例を描く。図7のAは、アダプターおよび標的特異的なプライマーのない使用を示しており、これは、特定の標的配列内の配列変異体の存在または不在の検出に使用することができる。いくつかの実施形態において、複数の標的のための複数の標的特異的なプライマーが同じ反応で使用される。例えば、約または少なくとも約10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000、またはそれ以上の異なる標的配列のための標的特異的なプライマーは、対応する数の標的配列(存在する場合)を並行して増幅するために、単一の増幅反応で使用されてもよい。複数の標的配列は、同じ遺伝子、異なる遺伝子、あるいは非遺伝子の配列の様々な部分に相当することがある。複数のプライマーが単一の遺伝子中の複数の標的配列を標的とする場合、プライマーは、すべてあるいは標的遺伝子のすべてまたは指定された部分をカバーするために遺伝子配列に沿って一定間隔で配置されてもよい(例えば、約または少なくとも約50のヌクレオチド、50−150のヌクレオチドごと、あるいは50−100のヌクレオチドごとに配される)。図7のCは、アダプター配列にハイブリダイズするプライマーの使用(場合によっては、アダプターオリゴヌクレオチド自体であってもよい)を例証する。
図7のBは、ランダムプライマーによる増幅の例を例証する。概して、ランダムプライマーは1つ以上のランダムな、またはほぼランダムな配列(例えば、1つ以上の位置で2つ以上の様々なヌクレオチドのセットからランダムに選択された1つ以上のヌクレオチドであって、1つ以上の位置で選択された様々なヌクレオチドの各々はランダムな配列を含むアダプターのプールで表される)を含む。このように、ポリヌクレオチド(例えば、すべて、あるいは実質的にすべての環状化したポリヌクレオチド)は、配列に非特異的な方法で増幅可能である。こうした手順は「全ゲノム増幅」(WGA)と呼ばれることがある;しかしながら、典型的なWGAプロトコル(環状化工程を含む)は、本開示によって企図されたポリヌクレオチド断片などの短いポリヌクレオチドを効率的に増幅しない。WGA手順のさらなる例証的な議論については、例えば、Li et al (2006) J Mol. Diagn. 8(1):22−30を参照。
環状化したポリヌクレオチドが配列決定の前に増幅される場合、増幅された産物は富化なく直接配列決定にさらされることもあれば、あるいはその後、1つ以上の富化工程にさらされることもある。富化は、増幅産物の保持あるいは1つ以上の試薬の除去などの1つ以上の反応成分を精製することを含んでもよい。例えば、増幅産物は、基質に結合した複数のプローブへのハイブリダイゼーションによって精製されてもよく、その後、洗浄工程などによって捕捉されたポリヌクレオチドの放出を伴うこともある。代替的に、増幅産物は、結合対のメンバーを用いて標識され、その後、基質に結合された結合対の別のメンバーへの結合と、増幅産物を放出するための洗浄とを伴うこともあり得る。可能性のある基質としては、限定されないが、改良ガラスまたは機能化ガラス、プラスチック(アクリル樹脂、スチレンおよび他の材料のポリスチレンおよびコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、Teflon(商標)などを含む)、多糖類、ナイロンまたはニトロセルロース、セラミックス、樹脂剤、シリコンおよび変性シリコンを含む、シリカあるいはシリカベースの材料、炭素、金属、無機ガラス、プラスチック、光ファイバー束、および様々な他のポリマーなどが挙げられる。いくつかの実施形態において、基質は、ビーズあるいは他の小さな離散した粒子の形態であり、これは、磁場の適用を介して単離を促すための磁気ビーズまたは常磁性ビーズであってもよい。概して、「結合対」とは、第1と第2の部分の1つを指し、第1と第2の部分は互いに対して特異的な結合親和性を有する。適切な結合対としては、限定されないが、抗原/抗体(例えば、ジゴキシゲニン/抗ジゴキシゲニン、ジニトロフェニル(DNP)/抗DNP、ダンシル−X−抗ダンシル、フルオレセイン/抗フルオレセイン、ルシファーイエロー/抗ルシファーイエロー、およびローダミン抗ローダミン);ビオチン/アビジン(あるいはビオチン/ストレプトアビジン);カルモジュリン結合タンパク質(CBP)/カルモジュリン;ホルモン/ホルモン受容体;レクチン/炭水化物;ペプチド/細胞膜受容体;プロテインA/抗体;ハプテン/抗ハプテン;酵素/補助因子;ならびに、酵素/基板が挙げられる。
いくつかの実施形態において、環状化したポリヌクレオチドの増幅後の富化は、1つ以上の追加の増幅反応を含む。いくつかの実施形態において、富化は増幅反応混合物中に配列Aと配列B(5’から3’の方向に配向した)を含む標的配列を増幅することを含み、増幅反応混合物は、(a)増幅されたポリヌクレオチドと、(b)配列A’を含む第1のプライマーであって、第1のプライマーが配列Aと配列A’との間の配列相補性によって標的配列の配列Aに特異的にハイブリダイズする、第1のプライマーと;(c)配列Bを含む第2のプライマーであって、第2のプライマーが配列Bと配列B’との間の配列相補性によって標的配列の補体を含む相補的なポリヌクレオチド中に存在する配列B’に特異的にハイブリダイズする、第2のプライマーと、(d)増幅されたポリヌクレオチドを生成するために第1のプライマーと第2のプライマーを伸長するポリメラーゼを含み、標的配列の配列Aの5’末端と配列Bの3’末端との間の距離が75nt以下である。図10は、単一の反復(環状でない限り典型的には増幅されない)および標的配列の複数のコピーを含むコンカテマーの文脈で標的配列に対して第1と第2のプライマーの例となる配置を例証する。標的配列の単量体に対してプライマーの配向を考慮すると、この配置は、「背中合わせ」(B2B)プライマーあるいは「逆方向の」プライマーと呼ばれてもよい。B2Bプライマーを用いる増幅は、環状のおよび/または鎖状体(concatemeric)の増幅産物の富化を促す。さらに、比較的な小さなフットプリント(1対のプライマーが及ぶ全距離)と組み合わせたこの配向は、標的配列のまわりの多種多様な断片化事象の増幅を可能にする。なぜなら、接合部は典型的な増幅反応(互いに面して、標的配列に及ぶ)で見られるプライマーの配置よりも、プライマー間で生じる可能性が低いからである。背中合わせのプライマーのさらなる実施形態および利点は図13のA−Cで例証される。
いくつかの実施形態において、配列Aの5’末端と配列Bの3’末端との間の距離は、約約200、150、100、75、50、40、30、25、20、15、あるいはそれより少ないヌクレオチド以下である。いくつかの実施形態において、配列Aは配列Bの補体である。いくつかの実施形態において、複数の様々な標的配列に方向付けられた複数の対のB2Bプライマーは、複数の様々な標的配列(例えば、約または少なくとも約10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000、あるいはそれ以上の様々な標的配列)を平行して増幅するために、同じ反応中で使用される。プライマーは本明細書に別記されるような、任意の適切な長さであり得る。増幅は、本明細書に記載された増幅反応などの適切な条件下の任意の適切な増幅反応も含むことがある。いくつかの実施形態において、増幅はポリメラーゼ連鎖反応である。
いくつかの実施形態において、B2Bプライマーは少なくとも2つの配列要素、配列相補性によって標的配列にハイブリダイズする第1の要素、および、(例えば、第1の要素が接合する場所に対して3’のすぐそばで、尾部と標的配列の一部との間の配列相補性の不足により)第1の要素がハイブリダイズする第1のハイブリダイゼーション温度での第1の増幅段階中に標的配列にハイブリダイズしない5’尾部を含む。例えば、第1のプライマーは、配列A’に対して配列C5’を含み、第2のプライマーは配列Bに対して配列D5’を含み、配列Cと配列Dのいずれも、第1のハイブリダイゼーション温度で第1の増幅段階中に複数のコンカテマーにハイブリダイズしない。いくつかの実施形態において、そのような尾部付加されたプライマーが使用され、増幅は第1の段階と第2段階を含むことがあり、第1段階は、第1の温度でのハイブリダイゼーション工程を含み、この工程の間、第1と第2のプライマーはコンカテマー(あるいは環状化したポリヌクレオチド)とプライマー伸長にハイブリダイズし、および、第2段階は、第1の温度よりも高い第2の温度でのハイブリダイゼーション工程を含み、この工程の間、第1と第2のプライマーは、伸長された第1と第2のプライマーまたはその補体とプライマー伸長を含む増幅産物にハイブリダイズする。高い温度は、プライマー中の第1の要素のみとコンカテマー内の内部標的配列との間のハイブリダイゼーションによって形成された短い断片よりも、プライマー伸長産物中のプライマーの第1の要素と尾部要素との間のハイブリダイゼーションを好む。これに応じて、二段階増幅を用いて、短い増幅産物が他の方法で好まれることもある程度を減少させることもあり、これによって、標的配列の2つ以上のコピーを有する増幅産物の比較的より高い割合を維持する。例えば、第2の温度およびプライマー伸長のハイブリダイゼーションの5つのサイクル(例えば、少なくとも5、6、7、8、9、10、15、20、あるいはそれ以上のサイクル)の後に、反応混合物中の増幅されたポリヌクレオチドの少なくとも5%(例えば、少なくとも5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、あるいはそれ以上)は、標的配列の2つ以上のコピーを含む。この二段階の尾部付加されたB2Bプライマー増幅プロセスに係る実施形態の実例が、図11のA−Dで例証される。
いくつかの実施形態において、富化は、コンカテマーからのアンプリコンの長さを増大させるために歪めた条件下での増幅を含む。例えば、すべてのプライミング部位がプライマーをハイブリダイズするとは限らないように、プライマー濃度を低下させて、それにより、PCR産物をより長くすることができる。同様に、サイクル中のプライマーハイブリダイゼーション時間を減少させることにより、少数のプライマーがハイブリダイズすることを可能にし、それにより、平均PCRアンプリコンサイズを増大させる。さらに、サイクルの温度および/または伸長時間を増大させることにより、同様にPCRアンプリコンの平均長が増大することがある。こうした技術の任意の組み合わせも使用することができる。
いくつかの実施形態において、特にB2Bプライマーを用いる増幅が実施された場合、増幅産物は、コンカテマーを含む混合物である単量体の数を減らすおよび/または除去するべく、サイズに基づいて結果として生じるアンプリコンを濾過するために処置される。これは、限定されないが、ゲルからの断片切除、およびゲルろ過(例えば、長さが約300、400、500、またはそれ以上のヌクレオチドよりも大きな断片について富化するための)を含む様々な利用可能な技術や、同様に、結合緩衝液濃度の微調整によるサイズ選別のためのSPRIビーズ(Agencourt AMPure XP)を用いて、行うことができる。例えば、DNA断片と混合する間の0.6x結合緩衝液の使用は、約500の塩基対(bp)よりも大きなDNA断片を優先的に接合するために使用されてもよい。
いくつかの実施形態において、増幅が一本鎖コンカテマーをもたらす場合、一本鎖は、配列決定反応のために生成される配列決定ライブラリの形成の前に、またはその形成の一部として、二本鎖構築物に変換される。一本鎖核酸から二本鎖構築物を生成する様々な適切な方法が利用可能である。同様に、多くの他の方法を使用することができるが、多くの可能性のある方法が図9のA−Dで描かれている。図9のAで示されるように、例えば、ランダムプライマー、ポリメラーゼ、dNTP、およびリガーゼの使用は二重鎖をもたらす。図9のBは、コンカテマーが、反応中でプライマーとして使用することができるアダプター配列を含むときの第2の鎖合成を描いている。図9のCは、ループアダプターの1つの末端がコンカテマーの末端へ追加される場合の、「ループ」の使用を描いており、ループアダプターは自己ハイブリダイズする核酸の小さな部分を有する。この場合、ループアダプターのライゲーションは、自己ハイブリダイズされ、かつ、ポリメラーゼプライマー鋳型として役立つ、ループをもたらす。図9のDは、標的配列が既知であり、複数の鎖が形成される場合、とりわけ、強力な鎖置換機能を用いるポリメラーゼが使用されるときの、一般に最も使用されているもののハイパーブランチプライマーの使用を示している。
いくつかの実施形態に従って、環状化したポリヌクレオチド(あるいは随意に富化されているかもしれないその増幅産物)は、配列決定リードを生成するために配列決定反応にさらされる。そのような方法によって生成された配列決定リードは、本明細書で開示される他の方法と合わせて使用されてもよい。様々な配列決定方法、とりわけ、ハイスループットシーケンシング方法が利用可能である。例としては、限定されないが、Illumina(HiSeq(登録商標)とMiSeq(登録商標)などの配列決定システム)、Life Technologies(Ion Torrent(登録商標)、SOLiD(登録商標)など)、Rocheの454 Life Sciences systems、Pacific Biosciences systemsなどによって製造された配列決定システムが挙げられる。いくつかの実施形態において、配列決定は、長さが約50、75、100、125、150、175、200、250、300、またはそれ以上のヌクレオチドのリードを生成するためにHiSeq(登録商標)とMiSeq(登録商標)のシステムの使用を含む。いくつかの実施形態において、配列決定は合成プロセスによる配列決定を含み、個々のヌクレオチドは、成長しているプライマー伸長産物に追加されるにつれ、反復して同定される。パイロシークエンシングは、シーケンシング反応の副産物(すなわち、ピロリン酸塩)の存在について結果として生じる合成混合物をアッセイすることにより、ヌクレオチドの取り込みを同定する合成プロセスによる配列の例である。とりわけ、プライマー/鋳型/ポリメラーゼ複合体は単一のタイプのヌクレオチドに接触させる。そのヌクレオチドが取り込稀ない場合、重合反応は三リン酸鎖のαとβのリン酸塩間のヌクレオシド三リン酸を切断して、ピロリン酸塩を放出する。放出されたピロリン酸塩の存在は、AMPでピロリン酸塩をATPへ変換し、その後、測定可能な光信号を生成するためにルシフェラーゼ酵素を使用してATPを測定する、化学発光酵素レポーターシステムを使用して、同定される。光が検出される場合には塩基が取り込まれ、光が検出されない場合には塩基は取り込稀ない。適切な洗浄工程の後、様々な塩基を複合体に周期的に接触させることで、鋳型配列中の連続した塩基を連続して同定する。例えば、米国特許第6,210,891号を参照。
関連する配列決定プロセスでは、プライマー/鋳型/ポリメラーゼ複合体は基質で固定され、複合体は標識されたヌクレオチドに接触する。複合体の固定はプライマー配列、鋳型配列および/またはポリメラーゼ酵素によってなされることもあり、共有結合または非共有結合であってもよい。例えば、複合体の固定は、ポリメラーゼまたはプライマーと基質表面との間の結合を介することがある。代替的な配置では、ヌクレオチドは除去可能なターミネーター群とともに、または伴わずに提供される。取り込みの際、ラベルは複合体に接合するため、検出可能である。ヌクレオチドを有するターミネーターの場合、個々に同定可能なラベルを有する4つの異なるヌクレオチドはすべて複合体と接する。標識されたヌクレオチドの取り込みはターミネーターの存在によって伸長を阻止し、複合体に標識を加えて、取り込まれたヌクレオチドの同定を可能にする。その後、標識とターミネーターは取り込まれたヌクレオチドから除去され、適切な洗浄ステップの後、プロセスは反復される。非末端ヌクレオチドの場合には、単一のタイプの標識されたヌクレオチドが複合体に加えられることで、パイロシークエンシングでのように、それが取り込まれるかどうかを判定する。ヌクレオチドでの標識グループの除去と適切な洗浄工程の後、様々な異なるヌクレオチドは同じプロセス中で反応混合物によって循環される。例えば、すべての目的のために全体が引用により本明細書に組み込まれる米国特許第6,833,246号を参照。例えば、Illumina Genome Analyzer SystemはWO98/44151に記載される技術に基づいており、DNA分子はアンカープローブ結合部位(他の方法ではフローセル結合部位と呼ばれる)によって配列決定プラットフォーム(フローセル)に結合され、スライドガラス上においてインサイツで増幅される。DNA分子が増幅される固体表面は典型的には複数の第1と第2の結合されたオリゴヌクレオチドを含み、第1の結合されたオリゴヌクレオチドは標的ポリヌクレオチドの1つの末端の近くまたはその末端にある配列に相補的であり、第2の結合されたオリゴヌクレオチドは標的ポリヌクレオチドのもう一方の末端の近くまたはその末端にある配列に相補的である。この配置はUS20140121116に記載されるように、架橋の増幅を可能にする。その後、DNA分子は配列決定プライマーにアニールされ、可逆的なターミネーターアプローチを使用して、塩基ごとに平行に配列決定される。配列決定プライマーのハイブリダイゼーションの前に、架橋を固定する結合されたオリゴヌクレオチドの1つにおいて切断部位の二本鎖架橋ポリヌクレオチドの1つの鎖の切断が先行することがあり、したがって、、1つの鎖を、変性により除去されることがある固体の基質には結合させず、もう一本の鎖を結合させて配列決定プライマーへのハイブリダイゼーションに利用可能なようにする。典型的には、Illumina Genome Analyzer Systemは、8つのチャネルのフローセルを利用し、長さが18〜36の塩基の配列決定リードを生成し、実行するたびに>1.3Gbpの高品質データを生成する(www.illumina.comを参照)。
合成プロセスによるまたさらなる配列において、異なるように標識されたヌクレオチドの取り込みは、鋳型に依存した合成が行なわれるとリアルタイムで観察される。特に、蛍光標識されたヌクレオチドが取り込まれると、個々の固定されたプライマー/鋳型/ポリメラーゼ複合体が観察され、各々の追加された塩基のリアルタイムの同定が追加時に可能となる。このプロセスでは、標識グループは取り込みの間に切断されるヌクレオチドの一部に結合される。例えば、取り込みの間に除去されたリン酸塩鎖の一部、つまり、ヌクレオシドポリリン酸塩上のβ、γ、あるいは他の末端のリン酸基に、標識グループを接合することによって、標識は新生鎖には取り込まれず、その代わりに天然のDNAが生成される。個々の分子についての観察は、典型的には非常に小さな照明量内での複合体の光閉じ込めを含む。光学的に複合体を閉じ込めることにより、当業者は、ランダムに拡散するヌクレオチドが非常に短い時間だけ存在する監視領域を作り、一方で、取り込まれたヌクレオチドは取り込まれるにつれてより長い間観察量内で保持される。これは取り込み事象に関連した特徴的なシグナルをもたらし、これも追加される塩基の特性であるシグナルプロフィールを特徴とする。関連する態様では、蛍光共鳴エネルギー移動(FRET)色素対などの相互作用する標識成分は、ポリメラーゼあるいは複合体の他の部分、および取り込みヌクレオチドに提供され、取り込み事象が相互作用するほど標識成分を近接させるようになり、特徴的なシグナルが生じ、これも再度取り込まれる塩基の特徴である(例えば、米国特許番号6,917,726、7,033,764、7,052,847、7,056,676、7,170,050、7,361,466、および7,416,844;ならびに米国特許第20070134128を参照)。
いくつかの実施形態において、サンプル中の核酸はライゲーションによって配列決定可能である。例えば、ポロニー方法およびSOLiD技術(Applied Biosystems、今ではInvitrogen)で使用されるように、この方法は、標的配列を同定するために典型的にはDNAリガーゼ酵素を使用する。概して、固定長のあらゆる起こりうるオリゴヌクレオチドのプールは配列決定された位置に従って標識される。オリゴヌクレオチドはアニールされてライゲートされる;配列を一致させるためのDNAリガーゼによる優先的なライゲーションは、その位置で相補的配列に対応するシグナルをもたらす。
いくつかの実施形態において、配列決定ライブラリは配列決定分析の前に増幅されたDNAコンカテマーから構築される。増幅されたDNAコンカテマーは、図12のAで例証されるように、同時に断片化され、配列決定アダプターでタグ付け可能である。場合によっては、増幅されたDNAコンカテマーは、例えば、超音波処理によって断片化され、アダプターは、図12のBで例証されるように断片の両末端へ追加される。
いくつかの実施形態にしたがって、配列決定リードと参照配列との間の配列の差異は、少なくとも2つの様々なポリヌクレオチド(例えば、異なる接合部を有するため識別可能な2つの異なる環状ポリヌクレオチドで生じる場合に、純粋な配列変異体(例えば、増幅または配列決定の前のサンプル中で存在し、これらのプロセスのいずれかの結果ではない)とコールされる。増幅または配列決定の誤差の結果である配列変異体が同じ標的配列を含む2つの異なるポリヌクレオチド上では正確に(例えば、位置とタイプ)複製されない可能性他あるため、このバリデーションパラメータを追加することで、誤った配列変異体のバックグラウンドを大幅に減少させ、サンプル中の実際の配列変異を検出する感度と精度を同時に増大させる。いくつかの実施形態では、約5%、4% 3% 2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%、あるいはそれ以下の頻度を有する配列変異体は、正確なコールを可能にするほどバックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体は、約0.1%以下の頻度で生じる。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率(例えば、約0.05、0.01、0.001、0.0001以下のp値)を統計的に有意なほど上回る場合に、バックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率よりも約または少なくとも約2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、100倍、またはそれ以上である場合に、バックグラウンドよりも十分に高い(例えば、少なくとも5倍高い)。いくつかの実施形態において、所定の位置で配列を正確に決定する際のバックグラウンド誤差率は、約1%、0.5% 0.1%、0.05%、0.01%、0.005%、0.001%、0.0005%以下である。いくつかの実施形態では、誤差率は0.001%よりも低い。
いくつかの実施形態において、純粋な配列変異体を同定する(「コールする(calling)または(making a call)」とも呼ばれる)ことは、2つの間の差を同定するために、および、接合部を同定するために参照配列に1つ以上の配列決定リードを最適にアラインすることを含む。概して、アラインメントは、1つの配列を別の配列に沿って置き、各配列に沿ってギャップを反復して導入し、2つの配列がどれくらいよく一致しているかスコア化し、参照配列に沿って様々な位置について好ましくは反復することを含む。最良のスコアの一致がアラインメントであると思われ、配列間の関係の程度に関する推論を表している。いくつかの実施形態において、配列決定リードが比較される参照配列は、被験体と同じ種のメンバーのゲノムなどの参照ゲノムである。参照ゲノムは完全なこともあれば不完全なこともある。いくつかの実施形態において、参照ゲノムは、参照ゲノムから、あるいは分析中の配列決定リードから生成されたコンセンサスからなど、標的ポリヌクレオチドを含む領域のみからなる。いくつかの実施形態において、参照配列は、1つ以上の細菌、古細菌、ウイルス、原生生物、菌類あるいはその他の生物からの配列など、1つ以上の生物のポリヌクレオチドの配列を含み、または該配列からなる。いくつかの実施形態において、参照配列は、分析中の1つ以上の標的配列に対応する領域(例えば1つ以上の遺伝子あるいはその一部)などの参照ゲノムの一部のみからなる。例えば、(汚染検出の場合などでは)病原体の検出のために、参照ゲノムは、特定の株または血清型のなどの特定で役立つ、病原体(例えば、HIV、HPV、あるいは有害な菌株、例えば、大腸菌)の全ゲノムあるいはその一部である。いくつかの実施形態において、複数の様々な生物あるいは菌株についてスクリーニングするなどのために、配列決定リードは複数の様々な参照配列にアラインされる。
典型的なアラインメントでは、参照配列中の一致しない塩基の側の配列決定リード中の塩基は、置換突然変異がその時点で生じたことを示す。同様に、1つの配列が別の配列の塩基のそばにギャップが含む場合、挿入または欠失の突然変異(「インデル」)が生じたと推論される。1つの配列がもう1つの配列にアラインされていることを明示することが望ましい場合、アラインメントはしばしば対でのアラインメントと呼ばれる。多くの配列アラインメントは通常、例えば、一連の対でのアラインメントによるものを含む、2つ以上の配列のアラインメントを指す。いくつかの実施形態において、アラインメントのスコア化は、置換とインデルの可能性について設定された値を含む。個々の塩基がアラインされる場合、マッチまたはミスマッチは置換確率によるアラインメントスコアに寄与し、これは、例えば、マッチで1、ミスマッチで0.33となり得る。インデルはギャップペナルティによってアラインメントスコアから差し引かれ、これは例えば−1であり得る。ギャップペナルティおよび置換確率は、配列がどのように変化するかに関する経験的知識または演繹的な仮定に基づくことがある。その値は結果として生じるアラインメントに影響を与える。アラインメントを実施するためのアルゴリズムの例としては、限定されないが、Smith−Waterman (SW) アルゴリズム、Needleman−Wunsch (NW)アルゴリズム、Burrows−Wheeler Transform (BWT)に基づくアルゴリズム、および、Novoalign (Novocraft Technologies; www.novocraft.comで入手可能), ELAND (Illumina, San Diego, Calif.), SOAP (soap.genomics.org.cnで入手可能)、ならびに、Maq (maq.sourceforge.netで入手可能)などのハッシュ関数アライナーが挙げられる。BWTアプローチを実行する1つの例示的なアラインメントプログラムは、Geeknet(Fairfax、Va。)によって維持されるSourceForgeウェブサイトから利用可能なBurrows−Wheeler Aligner (BWA)である。BWTは典型的には1つのヌクレオチド当たりの2ビットのメモリを占め、典型的なデスクトップまたはラップトップコンピュータを用いて4G塩基対ほどの長さのヌクレオチド配列にインデックスを付けることを可能にする。前処理は、BWT(つまり、参照にインデックスを付ける)の構築と、予備の支持データ構造を含む。BWAは両方ともBWTに基づく2つの異なるアルゴリズムを含む。BWAによるアラインメントは、アルゴリズム bwa−shortを用いて処理され、低い誤差率(<3%)で最大約200までの短いクエリのために設計可能である(Li H. and Durbin R. Bioinformatics, 25:1754−60 (2009))。第2のアルゴリズム BWA−SWは、より誤差が多く長いリード向けに設計されている(Li H. and Durbin R. (2010).Fast and accurate long−read alignment with Burrows−Wheeler Transform. Bioinformatics, Epub.)。bwa−swアライナーはしばしば「bwa−long」、「bwa long アルゴリズム」、あるいは類似したように呼ばれる。Smith−Watermanアルゴリズムのあるバージョンを実行するアラインメントプログラムがMUMmerであり、Geeknet(Fairfax、Va.)によって維持されるSourceForgeウェブサイトから入手可能である。MUMmerは、完全な形態であろうとドラフト形態であろうと、全ゲノムを迅速にアラインするためのシステムである(Kurtz, S., et al., Genome Biology, 5:R12 (2004); Delcher, A. L., et al., Nucl. Acids Res., 27:11 (1999))。例えば、MUMmer 3.0は、2.4GHzのリナックス(登録商標)のデスクトップコンピュータ上で、78MBのメモリを使用して、13.7秒で1対の5−メガベースのゲノム間でのすべての20以上の塩基対またはそれ以上の正確なマッチを見つけることができる。MUMmerはさらに不完全なゲノムをアラインすることができる;これは、ショットガン配列決定プロジェクトからの数百または数千のコンティグを取り扱うことができ、システムに含まれるNUCmerプログラムを使用して、コンティグまたはゲノムの別のセットにそれらをアラインする。アラインメントプログラムの他の非限定的な例は以下を含む:Kent Informatics (Santa Cruz, Calif.)からのBLAT (Kent, W. J., Genome Research 4: 656−664 (2002));Beijing Genomics Institute (Beijing, Conn.) or BGI Americas Corporation (Cambridge, Mass.)からのSOAP2;Bowtie (Langmead, et al., Genome Biology, 10:R25 (2009));Efficient Large−Scale Alignment of Nucleotide Databases (ELAND) or the ELANDv2 component of the Consensus Assessment of Sequence and Variation (CASAVA) software (Illumina, San Diego, Calif.);Real Time Genomics, Inc. (San Francisco, Calif.)からのRTG Investigator;Novocraft (Selangor, Malaysia)からのNovoalign;Exonerate, European Bioinformatics Institute (Hinxton, UK) (Slater, G., and Birney, E., BMC Bioinformatics 6:31(2005)), Clustal Omega, from University College Dublin (Dublin, Ireland) (Sievers F., et al., Mol Syst Biol 7, article 539 (2011));ClustalW or ClustalX from University College Dublin (Dublin, Ireland) (Larkin M. A., et al., Bioinformatics, 23, 2947−2948 (2007));and FASTA, European Bioinformatics Institute (Hinxton, UK) (Pearson W. R., et al., PNAS 85(8):2444−8 (1988);Lipman, D. J., Science 227(4693):1435−41 (1985)).
いくつかの実施形態に係るプロセスの実例が図36A−Hで提供され、とりわけ、3’尾部付加(tailing)反応を使用する実施形態に対して提供される。図36Aは、サンプルの無細胞の二本鎖ポリヌクレオチド1、2、3…K(101)を示し、これらの各々は「G」あるいは稀な変異体「A」によって占められ得る単一のヌクレオチドからなる遺伝子座(100)を含む。こうしたポリヌクレオチドを含むサンプルは、血液または血漿のサンプルなどの患者組織サンプルであってもよい。典型的には、(例えば、ヒトゲノムデータベース中の)参照配列は、ポリヌクレオチド配列と比較するのに利用可能である。各々のポリヌクレオチドは各末端に2つの相補鎖の配列に対応する4つの配列領域を有する。したがって、例えば、図36Aの標的ポリヌクレオチド1は鎖の各末端に配列領域n1(110)およびn2(112)を有し、相補鎖(120)の末端に相補的配列領域n1’(116)とn2’(108)を有する。様々なポリヌクレオチド鎖の配列領域は鎖の小さな部分として例証されているが、配列領域は鎖の末端から遺伝子座(100)への全セグメントを含み得る。
いくつかの実施形態において、1つ以上のA’で3’末端を伸長する尾部付加反応(125)を実行するために、核酸単量体および/または他の反応成分に沿って3’尾部付加活性がサンプルの標的ポリヌクレオチドに追加される。この実施形態では、あらかじめ定められたヌクレオチドの伸長は、「A…A」として示され、1つ以上のヌクレオチドが追加されるか、あるいは、各鎖へ追加される正確な数が決定されないことがある(以下に注記されるように、エキソ−ポリメラーゼが使用されなければ)ことを示唆している。「A…A」による追加されたヌクレオチドの表現は、追加されたヌクレオチドの種類をAだけに制限しようとするものではない。尾部付加反応で使用されたヌクレオチド前駆体の種類が既知であり、アッセイ設計選択として選択されるという意味で、追加されたヌクレオチドはあらかじめ決められる。例えば、特定の実施形態のあらかじめ定められたヌクレオチドの種類の選別における因子は、選択されたヌクレオチドの種類の点から見て環状化工程の効率であることがある。いくつかの実施形態において、ヌクレオチド前駆体は、別々に、4つのヌクレオチドのいずれかのヌクレオシド三リン酸であってもよく、その結果、ホモポリマー尾部が生成されるか、あるいは混合物であり、その結果、bi−ヌクレオチド尾部あるいはトリ−ヌクレオチド尾部が生成される。場合によっては、ウラシル、および/またはヌクレオチドアナログは、4つの天然のDNA塩基に加えて、あるいはその代わりに使用されてもよい。CircLigase(商標)酵素が用いられているいくつかの実施形態において、あらかじめ定められたヌクレオチドはA’および/またはT’であってもよい。いくつかの実施形態において、エキソ−ポリメラーゼは尾部付加反応で使用され、単一のデオキシアデニル酸だけが3’末端へ追加される。
尾部付加後、および反応混合物からの反応産物の随意の分離後、個々の鎖は、図36Bで示されるように、環(132)を生成するために環状化反応を使用して環状化され、各々は「nj−A…A−nj+1」(133)の形態の配列要素を含む。環状化の後、および反応混合物からの環(132)の随意の分離後、プライマー(134)は環(132)の1つ以上のプライマー結合部位にアニールされ、その後、それらは伸長されることで、図36Eで例証されるように、それぞれのnj−A…A−nj+1配列要素のコピーを各々が含むコンカテマーが生成される。配列決定の後、(136)と(138)などの相補鎖は、配列要素成分njとnj+1を、そのそれぞれの補体nj’とnj+1’に一致させることによって同定されることがある。環(132)上のプライマー結合部位の選別は、設計選択の問題であり、あるいは、代替的に、ランダムな配列プライマーが使用されてもよい。いくつかの実施形態において、単一のプライマー結合部位は遺伝子座(100)に隣接して選択される;他の実施形態では、複数のプライマー結合部位は、たとえ境界がプライマー結合部位の1つで偶然生じたとしても確実に増幅をもたらすように、別々のプライマーに各々が選択される。いくつかの実施形態において、別々のプライマー結合部位を有する2つのプライマーがコンカテマーを生成するために使用される。
相補鎖を含む対のコンカテマーの同定後、コンカテマー配列はアラインされてもよく、2つの鎖の位置の一致する位置にある塩基コールが比較されることがある。コンカテマー対のいくつかの位置では、図36Fで(140)によって例証されるように、ある対の1つメンバーの所定の位置においてコールされた塩基は、その対の別のメンバー上でコールされた塩基と相補的ではないことがあり、このことは、例えば、増幅誤差、配列決定誤差などによって不正確なコールが行われたことを示す。この場合、所定の位置での不確定性は、コンカテマー対内の他のコピーの対応する位置での塩基コールを調べることにより解決することもある。例えば、所定の位置での塩基コールは、1対のコンカテマー中の個々のコピーについて行われた塩基コールと一致し、またはほぼ一致するように得られることがある。こうした決定を下す他の方法は当業者に利用可能であり、これは、相補鎖間の配列情報が相補的でないときに、塩基コールを解決しようとする努力を補うためのこれらの方法の代わりに、または上記方法に加えて、用いられてもよい。場合によっては、(例えば、3’および5’の末端の配列によって同定されるように)同じ二本鎖分子から始まる相補鎖中の特定の位置の塩基が相補的でない場合、塩基コールはサンプル配列が比較される参照配列を支持して解決され、その違いがそのような参照配列に対して真の配列変異体として同定されないようになる。
他の状況では、図36Gで(145)によって例証されるように、同じ誤差がコンカテマー内の標的ポリヌクレオチドの各コピーで現れてもよい。こうしたデータは、標的ポリヌクレオチドが増幅または配列決定の前に破損されたことを示唆することになる。
さらに別の状況では、単一のコンカテマーだけが同定されることがある;すなわち、あらかじめ定められたヌクレオチドのセグメントの長さ、隣接する3’と5’末端の配列など境界情報に基づいてマッチが発見されないコンカテマー。このような状況が図37AとBで例証される。ここで、標的ポリヌクレオチド(201)は、一本鎖ポリヌクレオチド1と二本差ポリヌクレオチド2を含み、各々は遺伝子座(200)を包含する。あらかじめ定められたヌクレオチド(例えば、アデニレート)は、3’尾部付加ポリヌクレオチド(220)を形成するために尾部付加反応(225)中の両方のポリヌクレオチド1および2に結合されてもよい。上に記載されたように、その後、ポリヌクレオチド(220)は環状化され、RCAによって増幅され、および配列決定されることで、図37Bで示されるコンカテマー配列(230)が得られることもある。観察された変異体がDNA損傷において共通する(例えば、C対TまたはG対T)場合、対のないコンカテマーからのそうした情報は、それが真の突然変異対単なるDNA損傷かどうか決定する際に依然として役に立つ。
いくつかの実施形態において、図36CおよびDで例証されるように、各々が分子タグ、例えば、MT1(150)、MT2などを含むプライマーは、各々が特有のタグを有するコンカテマーを生成するためにあらかじめ定められたプライマー結合部位でそれぞれの一本鎖の環にアニールされることがある。特有の分子タグの存在は、同じ境界あるいはnj−A…A−nj+1配列要素を偶然有する一本鎖の環の産物を識別する。こうしたタグも、例えば、参照により本明細書に組み込まれるBrenner et al、米国特許7,537,897号などに記載される方法に従って、遺伝子座でコピー数の変動を決定するべく分子を数えるために使用されてもよい。いくつかの実施形態において、分子タグを有するコンカテマーが標的ポリヌクレオチドの2つの鎖の1つだけを表すように、標的ポリヌクレオチドの1つの鎖のみに結合部位を有する分子タグを備えたプライマーが選択されてもよい。他の実施形態では、標的ポリヌクレオチドの相補鎖の環は各々、分子タグを有するプライマーを使用して増幅されてもよい(図36Cで示されるように)。
いくつかの実施形態において、標的ポリヌクレオチドの相補鎖を同定するための上記の工程は、遺伝子座で稀な変異体を検出する方法に取り込まれてもよい。いくつかの実施形態では、上記方法は以下の工程を含む:(a)ポリヌクレオチドの3’末端を1つ以上のあらかじめ定められたヌクレオチドだけ伸長する工程と、(b)一本鎖ポリヌクレオチド環を形成するためにポリヌクレオチドの個々の鎖を環状化する工程であって、1つ以上のあらかじめ定められたヌクレオチドが、それぞれの一本鎖ポリヌクレオチド環の3’配列と5’配列との間の境界を定義する、工程と、(c)コンカテマーを形成するために、ローリングサークル複製(RCR)によって一本鎖ポリヌクレオチド環を増幅する工程と、(d)コンカテマーを配列決定する工程と、(e)1つ以上のあらかじめ定められたヌクレオチドに隣接する3’配列と5’配列を同定することによって、ポリヌクレオチドの相補鎖を含むコンカテマーの対を同定する工程と、(f)同じポリヌクレオチドの相補鎖を含む対のコンカテマーの配列から遺伝子座の配列を決定する工程。他の実施形態では、RCRによって一本鎖の環を増幅する工程は、一本鎖の環に対して5’−非相補的な尾部を有するプライマーをアニールする工程であって、そのようなプライマーが5’−非相補的な尾部中に特有の分子タグを含む、工程と、RCRプロトコルにしたがって上記プライマーを伸長する工程とを含む。結果として生じる産物は特有の分子タグを含むコンカテマーであり、これは、遺伝子座のコピー数測定をもたらすために同じ遺伝子座からの環に結合した他の分子タグと共に数えられてもよい。
いくつかの実施形態において、伸長する工程は、尾部付加反応中のポリヌクレオチドの3’末端を、1つ以上のあらかじめ定められたヌクレオチドだけ尾部付加することにより実行されてもよい。いくつかの実施形態において、こうした尾部付加は、TdT活性、エキソ−ポリメラーゼ活性などの非鋳型(untemplated)3’ヌクレオチド追加活性によって実行されてもよい。
上に記載された工程を使用して、コンカテマー配列はポリヌクレオチド配列から同定可能である。大規模並列配列決定(「次世代シーケンシング」あるいはNGSとも呼ばれる)では、コンカテマーを含むリードを同定および使用して、誤差修正を実施し、かつ配列変異体を見つけることができる。元々の入力分子の接合部(DNA/RNA配列の始まりと終わり)は、参照配列にコンカテマーをアラインすることによりコンカテマーから再構築可能である。そして、その接合部を用いて、元々の入力分子を同定し、かつより正確な計測のために配列決定の重複を取り除くことができる。コンカテマーを含み得る各リードの鎖同一性は、リードを参照配列へアラインし、図36Aに記載されるように、配列要素成分njとnj+1をチェックすることにより計算可能である。相補鎖として標識された両方のコンカテマーで見られる変異体は、高い統計信頼度を備えており、これを用いてさらなる誤差修正を実施することができる。鎖同一性を使用する変異体確認は、(限定されないが)以下の工程によって行われてもよい:a)相補鎖同一性を有するリードで見られる変異体は、より信頼度が高いと考えられる;b)変異体を運ぶリードはその接合部の同定によって分類可能であり、相補鎖同一性が同じ接合部の同定を有するリードのグループ内のリードで見られる場合、変異体はより信頼度が高い;c)変異体を運ぶリードは、その分子バーコード、またはその分子バーコードと接合部の同定の組み合わせによって分類可能である。相補性鎖の同一性が同じ分子バーコードおよび/または接合部の同定を有するリードのグループ内のリードで見られる場合、変異体はより信頼度が高い。
分子バーコードおよび接合部の同定を使用する誤差修正は、独立的に使用可能であるか、あるいは前の工程で記載されるようなコンカテマー配列決定との誤差修正と組み合わせることができる。a)様々な分子バーコード(あるいは接合部同定)を有するリードは、様々な入力分子に由来するリードを表す様々なリードファミリーへ分類可能である;b)コンセンサス配列はリードのファミリーから構築可能である;c)コンセンサスは変異コールに使用可能である;d)分子バーコードおよび接合部同定を組み合わせてリード用の合成IDを形成することができ、これは元々の入力分子を同定するのを助ける。いくつかの実施形態において、様々なリードファミリーで見られる塩基コール(例えば、参照配列に対する配列の差異)には、より高い信頼度が与えられる。場合によっては、配列の差異は、上に記載されたような塩基コールの信頼度を高める1つ以上のフィルタを通ると、(サンプル処理あるいは分析の誤差に対立するものとして)元々のソースのポリヌクレオチドを表す真の配列変異体として同定される。いくつかの実施形態において、配列の差異は、もし、(a)配列の差異が二本鎖入力分子の両方の鎖上で同定され、(b)配列の差異が由来するコンカテマーのためのコンセンサス配列で生じ(例えば、コンカテマー内の反復の50%、80%、あるいは90%以上は配列の差異を含む)、および/または、(c)配列の差異が2つの異なる分子で生じる(例えば、異なる3’と5’のエンドポイントによって、および/または外因性のタグ配列によって同定されるように)ときに、真の配列変異体としてのみ同定される。
鎖同一性の決定:1)元々の入力分子の接合部は、参照配列へ配列をアラインすることによりコンカテマー配列を含み得るリードから再構築可能である;2)アラインメントを使用して接合部をリードに位置付けることができる;3)鎖同一性を表わす配列要素成分njとnj+1は、図36Aに記載されるように、リード中の接合部位置に基づいて配列から抽出可能である;および、コンカテマーの場合には、配列は、コンカテマー配列中の接合部間で見られることがある;4)工程3で同定されたリード内の鎖同一性配列と組み合わされて、リードがアラインされる参照配列の鎖(正または負)を用いて、配列ライブラリへ取り込まれ配列決定された元々の鎖をもとの鎖を同定し、かつ、配列変異体が由来する元の鎖を同定することができる。例えば、元々の入力DNA断片の鎖の末端へ鎖同一性配列「AA」が追加されると仮定する;配列決定後、DNA断片のリードは参照配列の「+」鎖へアラインされ、リード中の鎖同一性配列は「AA」であり、我々は元々の入力鎖が「+」であることを知っている;鎖同一性配列が「TT」である場合、リードは元々の入力鎖に対して逆相補性であり、および元々の入力鎖は「−」鎖である。鎖同一性決定により、配列変異体を、その逆相補性対応物と区別し、例えば、C>T置換を、G>A置換と区別することが可能となる。対立遺伝子の変化の正確な同定を用いて、変異コールにおける対立遺伝子に特有の誤差低減を実行することができる。例えば、ある対立遺伝子が変化するにつれてDNA損傷がしばしば生じ、対立遺伝子に特有の誤差低減はこうした損傷を抑えるために実行可能である;そのような誤差低減は、例えば、1)配列決定データ(ベースライン)の様々な対立遺伝子変化の分布の計算と、その後の、2)観察された対立遺伝子の変化がベースライン分布とは異なるか否かを決定するためのz−検定あるいは他の統計的検定によって、行うことができる。
いくつかの実施形態において、本開示は、測定された配列、または、1つ以上のヌクレオチドの頻度を、測定された配列と同じ配列、または1つ以上のヌクレオチドを結果として生じるヌクレオチド損傷のベースライン頻度と比較することにより、遺伝子座での特定の鎖上で遺伝子変異体を同定する方法を提供する。いくつかの実施形態では、上記方法は以下の工程を含み得る:(a)ポリヌクレオチドの3’末端を1つ以上のあらかじめ定められたヌクレオチドだけ伸長する工程と、(b)伸長したポリヌクレオチドの個々の鎖を増幅する工程と、(c)伸長したポリヌクレオチドの増幅された個々の鎖を配列決定する工程と、(d)1つ以上のあらかじめ定められたヌクレオチドに隣接する3’配列および/または5’配列の同一性によってポリヌクレオチドの相補鎖を同定し、および、遺伝子座で各鎖のヌクレオチドを同定する工程と、(e)遺伝子変異体を同定するために同定されたコンカテマーからの遺伝子座の1つ以上のヌクレオチドの各々の頻度を決定する工程。いくつかの実施形態において、この方法は、以下の工程によって、遺伝子変異体を、ヌクレオチド損傷と区別するために使用されてもよい:少なくとも1つのヌクレオチドを表示する鎖の上記頻度が、あらかじめ定められた因子によって、同じヌクレオチドを生じさせるヌクレオチド損傷を有する鎖のベースライン頻度を超える場合は常に、1つ以上のあらかじめ定められたヌクレオチドによって上記遺伝子変異体として同定された上記鎖の上での上記遺伝子座で上記1つ以上のヌクレオチドの少なくとも1つをコールする工程。
上に言及されるように、いくつかの実施形態では、増幅する工程は、(i)一本鎖ポリヌクレオチド環を形成するためにポリヌクレオチドの個々の鎖を環状化する工程であって、1つ以上のあらかじめ定められたヌクレオチドが、それぞれの一本鎖ポリヌクレオチド環のポリヌクレオチドの3’配列と5’配列との間の境界を定義する、工程と、(ii)一本鎖ポリヌクレオチド環のコンカテマーを形成するために、ローリングサークル複製によって一本鎖ポリヌクレオチド環を増幅する工程によって実行される。
ヌクレオチド損傷を有する鎖のベースライン頻度は、上記方法によって試験されている同じ個体からのサンプルの以前の測定に基づくこともあれば、ベースライン頻度は、試験されている個体以外の個体の集団の以前の測定に基づくこともある。ベースライン頻度はさらに、本開示の方法による分析のためにサンプルを調製する際に使用される工程またはプロトコルの種類に依存し、および/または特有であってもよい。測定された頻度をベースライン頻度と比較することによって、統計的尺度は、測定または決定された配列が純粋な遺伝子変異体であり、損傷でも処理による誤差でもないという可能性(あるいは信頼度)で得られることがある。
典型的には、配列決定データは大規模並列配列決定反応から獲得される。他のフォーマットが使用されることもあるが、次世代ハイスループットシーケンシングシステムの多くはFASTQファイルとしてデータをエクスポートする。いくつかの実施形態において、配列は典型的には配列アラインメントによって、反復単位長さ(例えば、単量体長さ)、環状化によって形成された接合部、および参照配列に対する任意の真の変化を同定するように分析される。反復単位長さの同定は、反復単位の領域を計算すること、参照遺伝子座(例えば、1つ以上の配列が増幅、富化、および/または配列決定とりわけ対象としているとき)、個々の反復された領域の境界、および/または、各々の配列決定実行内での反復の数を発見することを含む。配列分析は、二重鎖の両方の鎖に関する配列データを分析することを含む。上で明記されるように、いくつかの実施形態では、サンプル(例えば、異なる接合部を有する環状化したポリヌクレオチド)からの異なるポリヌクレオチドのリードの配列のように見える同一の変異体は、確認された変異体であるとみなされる。いくつかの実施形態において、配列変異体は、同じポリヌクレオチドの1つを超える反復単位で生じた場合に、確認された、または、真の変異体であるとみなされることもある。なぜなら、同じ配列変異は同じコンカテマー内の反復された標的配列の同じ位置で同様に生じる可能性が低いからである。配列の品質スコアは、変異体や確認された変異体を同定する際に考慮されることも有り、例えば、閾値よりも低い品質スコアの配列と塩基は除外されることもある。他の生物情報科学的方法を用いて、変異コールの感度と特異性を増大させることができる。
いくつかの実施形態において、統計的分析は変異体(突然変異)の決定に適用されてもよく、完全なDNAサンプル中の変異体の比率を定量化することもある。特定の塩基の完全な測定は配列決定データを使用して計算可能である。例えば、以前の工程で計算されたアラインメント結果から、「有効なリード」の数、すなわち、各遺伝子座の確認されたリードの数を計算することができる。変異体の対立遺伝子頻度は、遺伝子座のための有効なリード数によって正規化可能である。すべての遺伝子座で観察された変異体の平均的な割合である全体的なノイズレベルを計算することができる。他の因子と組み合わせた変異体の頻度および全体的なノイズレベルは、変異コールの信頼区間を決定するために使用することができる。ポアソン分布などの統計モデルは変異コールの信頼区間を評価するために使用することができる。変異体の対立遺伝子頻度も、完全なサンプル中の変異体の相対的な量のインジケータとして使用することができる。
いくつかの実施形態において、微生物汚染物質はコール工程に基づいて同定される。例えば、特定の配列変異体は、潜在的に感染性の微生物によって汚染を示すことがある。配列変異体は微生物を同定する目的で高度に保存されたポリヌクレオチド内で同定されることがある。微生物の系統発生的な特徴づけと同定に役立つ例示的な高度に保存されたポリヌクレオチドは、16S rRNA遺伝子、23S rRNA遺伝子、5S rRNA遺伝子、5.8S rRNA遺伝子、12S rRNA遺伝子、18S rRNA遺伝子、28S rRNA遺伝子、gyrB遺伝子、rpoB遺伝子、fusA遺伝子、recA遺伝子、coxl遺伝子、およびnifD遺伝子で見られるヌクレオチド配列を含む。真核生物では、rRNA遺伝子は、核、ミトコンドリア、あるいはその両方であり得る。いくつかの実施形態において、16S−23S rRNA遺伝子内部転写スペーサー(ITS)中の配列変異体は、他のrRNA遺伝子を用いて、または、用いずに、密接に関連する分類群の分化と同定に使用可能である。16S rRNAの構造的な制約により、非構造的なセグメントは高い変動率を有することがあるが、遺伝子全体にわたる特定の範囲には高度に保存されたポリヌクレオチド配列がある。配列変異体の同定を用いて、亜属、属、亜科、科、亜目、目、亜綱、綱、亜門、門、亜界、あるいは界を表す操作的分類単位(OTU)を同定し、随意に集団中のそれらの頻度を決定することができる。特定の配列変異体の検出は、汚染を示す微生物の存在および随意に量(相対的または絶対的)の検出に使用することができる。例となる用途は、糞便または他の汚染向けの水質試験、動物またはヒトの病原体のための試験、水質汚染の源を正確に示すこと、再生水または回収水の試験、海洋放水上昇流を含む下水放水流の試験、病原体に関する水産養殖施設の監視、海岸、遊泳領域、または他の水に関連するレクリエーション施設の監視、および藻類ブルームの予測を含む。食物監視の用途は、食品加工工場の生産ラインの周期的な試験、屠畜場の調査、レストラン、病院、学校、刑務所のキッチンと食品貯蔵領域の検査、および、大腸菌株O157:H7あるいはO111:B4、リステリア菌、腸炎菌(Salmonella enterica subsp. enterica serovar Enteritidis)などのそれ以外の食品媒介病原体の機関を含む。甲殻類および水を生成する甲殻類は、麻ひ性貝中毒、神経毒性貝中毒、下痢性貝中毒、および健忘性貝中毒に関与する藻類について調査され得る。さらに、輸入食料品は、食糧の安全性を確実に保障するために放出前の関税で選別可能である。植物病原体の監視用途は、園芸および育児室の監視(例えば、Phytophthora ramorumの監視、サドンオークデス(Sudden Oak Death)に関与する微生物、作物病原体の監視と疾病管理、および森林の病原体監視と疾病管理を含む。微生物汚染が安全性に対する大きな懸念である場合、医薬品、医療機器、および他の消耗品または重大な成分の生産環境は、緑膿菌または黄色ブドウ球菌などの特定の病原体の存在、ヒトに関連するもっと一般的な微生物、その特定の環境または類似する環境で以前に同定されたバイオバーデンを表す水またはそれ以外のものの存在に関連する微生物の存在について、調査可能である。同様に、宇宙船を含む高精度の装置のための構造および組み立て領域は、生息することが知られている、または、そのような環境へ最も一般に導入される、あらかじめ同定された微生物について監視可能である。
いくつかの実施形態において、方法は、50ng未満のポリヌクレオチドを含む核酸サンプル中の配列変異体を同定する工程を含み、各ポリヌクレオチドは5’末端と3’末端を含む。いくつかの実施形態では、方法は:(a)環状ポリヌクレオチドを形成するために、サンプル中の個々のポリヌクレオチドをリガーゼで環状化する工程と、(b)上記環状ポリヌクレオチドからのリガーゼの分離の際に、コンカテマーを形成するために上記環状ポリヌクレオチド増幅する工程と、(c)複数の配列決定リードを生成するためにコンカテマーを配列決定する工程と、(d)複数の配列決定リードと参照配列との間の配列の差異を同定する工程と、(e)50ng未満ポリヌクレオチドの上記核酸サンプルからの複数のリードにおいて0.05%以上の頻度で生じる配列の差異を、配列変異体としてコールする工程を含む。
サンプル中のポリヌクレオチドの出発量は小さくてもよい。いくつかの実施形態では、出発ポリヌクレオチドの量は100ng未満である。いくつかの実施形態では、出発物質の量は75ng未満である。いくつかの実施形態において、出発物質の量は、45ng、40ng 35ngある、30ng、25ng、20ng、15ng、10ng、5ng、4ng、3ng、2ng、1ng、0.5ng、0.1ng未満などの50ng未満である。いくつかの実施形態において、出発ポリヌクレオチドの量は、1−75ng、5−50ng、あるいは10−20ngなど0.1−100ngの範囲である。概して、より低い出発物質は、様々な処理工程からの回収の増加の重要性を増大させる。その後の反応への関与のためにサンプル中のポリヌクレオチドの量を減らすプロセスは、稀な突然変異を検出することができる感度を減少させる。例えば、Lou et al. (PNAS, 2013, 110 (49))によって記載された方法は、出発物質のわずか10−20%しか回収しないと予想される。大量の出発物質(例えば、研究所で培養された細菌から精製されるなど)については、これは実質的な障害ではないことがある。しかしながら、出発物質が著しく低いサンプルについては、この低い範囲の回収は十分に稀な変異体の検出への実質的な障害になりえる。これに応じて、いくつかの実施形態では、本開示(例えば、その後の増幅工程あるいは配列決定工程の入力に利用可能な環状化工程への入力の質量分率)の方法において1つの工程から別の工程へのサンプル回収は、約50%、60%、75%、80%、85%、90%、95%、あるいは、それ以上である。特定の工程からの回収は100%近くなることもある。回収は、非円形のポリヌクレオチドの入力からの環状ポリヌクレオチドの回収など、特定の形態に対することもある。
ポリヌクレオチドは、本開示の様々な態様に対して本明細書に記載されたサンプルなど、任意の適切なサンプル由来のものであってもよい。サンプルからのポリヌクレオチドは、限定されないが、DNA、RNA、リボソームRNA(rRNA)、転移RNA(tRNA)、マイクロRNA(miRNA)、メッセンジャーRNA(mRNA)、これらのいずれかの断片、あるいはこれらの任意の2つ以上の組み合わせを含む様々なポリヌクレオチドのいずれかであり得る。いくつかの実施形態において、サンプルはDNAを含む。いくつかの実施形態において、ポリヌクレオチドは、獲得されるような、あるいは処置(例えば変性)による、一本鎖である。さらに、適切なポリヌクレオチドの例は、本開示の様々な態様のいずれかに対するなどして本明細書に記載されている。いくつかの実施形態において、ポリヌクレオチドは、抽出工程を伴わない、および/または精製工程を伴わない、その後の工程(例えば、環状化と増幅)にさらされる。例えば、流体サンプルは、精製された流体サンプルと細胞サンプルを生成する抽出工程なく細胞を撤去するために処置され、その後、精製された流体サンプルからDNAが単離されてもよい。沈澱または非特異的な結合などや、その後の結合したポリヌクレオチドを放出するための基質の洗浄などのポリヌクレオチドの単離のための様々な手順が利用可能である。ポリヌクレオチドが細胞抽出工程なくサンプルから単離される場合、ポリヌクレオチドは大部分が細胞外ポリヌクレオチドであるか、または死細胞あるいは損傷を受けた細胞に相当し得る無細胞DNAと無細胞RNAなどの「無細胞」ポリヌクレオチドである。こうした細胞の同一性は、微生物群などの、それらが由来する細胞または細胞集団を特徴づけるために使用されてもよい。サンプル中の細胞などから、ポリヌクレオチドを抽出するためにサンプルが処置される場合、様々な抽出法が利用可能であり、それらの例が(例えば、本開示の様々な態様のいずれかに関して)本明細書で提供される。
核酸サンプル中の配列変異体は様々な配列変異体のいずれかでありえる。配列変異体の複数の非限定的な例は、本開示の様々な態様のいずれかに対するなどして本明細書に記載されている。いくつかの実施形態において、配列変異体は一塩基多型(SNP)である。いくつかの実施形態において、配列変異体は、集団(「稀な」配列変異体とも呼ばれる)において低頻度で生じる。例えば、配列変異体は、約5%、4% 3% 2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%、あるいはそれ以下の頻度で生じることもある。いくつかの実施形態において、配列変異体は、約0.1%以下の頻度で生じる。
いくつかの実施形態に従って、サンプルのポリヌクレオチドはリガーゼの使用などによって環状化される。環状化は、ポリヌクレオチドの5’末端を、同じポリヌクレオチドの3’末端に、別のポリヌクレオチドの3’末端に、あるいは、異なるソース(例えば、オリゴヌクレオチドアダプターなどの人工ポリヌクレオチド)のポリヌクレオチドの3’末端に接合することを含み得る。いくつかの実施形態において、ポリヌクレオチドの5’末端は同じポリヌクレオチドの3’末端に接合される(「自己接合(self−joining)」とも呼ばれる)。環状化プロセス(例えば、アダプターオリゴヌクレオチドを用いる、および用いない)、試薬(例えば、アダプターのタイプおよびリガーゼの使用)、反応条件(例えば、自己接合を支持する)、および随意の追加の処理(例えば、反応後の精製)の非限定的な例が、本開示の様々な態様のいずれかに関するなどして本明細書で提供される。
以前に記載されたように、環状ポリヌクレオチドを形成するために(直接的に、または、1つ以上の中間アダプターオリゴヌクレオチドを用いて)ポリヌクレオチドの末端を互いに接合することにより、一般に、接合配列を有する接合部が生成される。ポリヌクレオチドの5’末端および3’末端は、アダプターポリヌクレオチドによって接合される場合、用語「接合部」とは、ポリヌクレオチドとアダプター(例えば5’末端接合部または3’末端接合部の1つ)との間の接合部、あるいは、アダプターポリヌクレオチドによって形成され、および、アダプターポリヌクレオチドを含むようなポリヌクレオチドの5’末端と3’末端との間の接合部を指すことがある。ポリヌクレオチドの5’末端と3’末端が介在性のアダプター(例えば、一本鎖DNAの5’末端と3’末端)なしで接合される場合、用語「接合部」とはこれらの2つの末端が接合される点を指す。接合部は接合部を含むヌクレオチドの配列(「接合配列」とも呼ばれる)によって同定されることがある。いくつかの実施形態において、サンプルは、天然の分解プロセス(細胞溶解、細胞死、および、DNAが細胞からその周辺環境(そこで、無細胞のポリヌクレオチド、無細胞DNA、および無細胞のなどでさらに分解されることもある)に放出される他のプロセス)、サンプル処理(固定、染色、および/または保管手順)の副産物である断片化、ならびに、DNAを制限なく特定の標的配列に切断する方法による断片化(例えば、超音波処理などによる機械的な断片化;DNase I、フラグメンターゼ(fragmentase)などの非配列特異的なヌクレアーゼ処置)によって形成された末端の混合物を有するポリヌクレオチドを含む。サンプルが末端の混合物を有するポリヌクレオチドを含む場合、2つのポリヌクレオチドが同じ5’末端または3’を有する可能性は低く、2つのポリヌクレオチドが同じ5’末端と3’末端の両方を独立して有している可能性は著しく低い。これに応じて、いくつかの実施形態では、接合部は異なるポリヌクレオチドを識別するために使用されてもよく、この場合、2つのポリヌクレオチドは同じ標的配列を有する部分を含むことさえある。ポリヌクレオチド末端が介在性のアダプターなしで接合される場合、接合配列は参照配列へのアラインメントによって同定されることがある。例えば、2つの成分配列の順序が参照配列と逆であるように見える場合、その逆転が生じているように見える点はその点での接合部を示唆するものであり得る。ポリヌクレオチド末端が1つ以上のアダプター配列によって接合される場合、接合部は既知のアダプター配列への近接によって、あるいは、配列決定リードが環状化したポリヌクレオチドの5’末端と3’末端の両方の配列を得るのに十分な長さである場合には上のようなアラインメントによって同定されてもよい。いくつかの実施形態において、特定の接合部の形成は、それがサンプルの環状化したポリヌクレオチドの中で特有なものとなるような十分に稀な事象である。
環状化の後、反応産物が増幅または配列決定の前に精製されることで、その後の工程(例えば、環状ポリヌクレオチドの単離、あるいは反応における1つ以上の他の分子の除去)に関与するために利用可能な環状化したポリヌクレオチドの相対的濃度または純度を増大させることもある。例えば、環状化反応あるいはその成分を処理することで、エキソヌクレアーゼを用いる処置などによって一本鎖(非環状化)ポリヌクレオチドを除去することもある。さらなる例として、環状化反応またはその一部を立体排除クロマトグラフィーにさらすこともあり、それによって小さな試薬が保持および廃棄される(例えば、未反応アダプター)か、あるいは、環状化産物が別々の量で保持および放出される。Zymo Research製のZymo オリゴ精製キットによって提供されるキットなどの、ライゲーション反応を清浄するための様々なキットが利用可能である。いくつかの実施形態において、精製は、環状化反応で使用されるリガーゼを除去または分解するための、および/または、環状化したポリヌクレオチドをそのようなリガーゼから精製するための処置を含む。いくつかの実施形態において、リガーゼを分解する処理はプロテアーゼを用いる処理を含む。適切なプロテアーゼは、前核生物、ウイルス、および真核生物から入手可能である。プロテアーゼの例としては、プロテイナーゼK(Tritirachium albumからの)、プロナーゼE(ストレプトマイセス−グリセウスからの)、バチルス−ポリミキサプロテアーゼ、サーモリシン(高温細菌からの)、トリプシン、サブチリシン、フューリンなどが挙げられる。いくつかの実施形態では、プロテアーゼは、プロテイナーゼKである。プロテアーゼによる処置は、メーカーのプロトコルに従うこともあれば、標準的な条件(例えば、Sambrook and Green, Molecular Cloning: A Laboratory Manual, 4th Edition (2012)で提供される)にさらされることもある。プロテアーゼ処置には抽出と沈澱を伴うこともある。1つの例では、環状化したポリヌクレオチドは、0.1%のSDSと20mMのEDTAの存在下においてプロテイナーゼK(Qiagen)処置によって精製され、1:1のフェノール/クロロホルムとクロロホルムで抽出され、エタノールまたはイソプロパノールで沈殿される。いくつかの実施形態では、沈殿はエタノール中である。
本開示の他の態様に対して記載されたように、環状化は、その後の環状化したポリヌクレオチドの配列決定を直接伴うこともある。代替的に、配列決定は、1つ以上の増幅反応に先行することがある。ポリヌクレオチド(例えば、DNAおよび/またはRNA)を増幅する様々な方法が利用可能である。増幅は線状であるか、指数関数的であるか、または多相の増幅プロセスにおいて直線位相と指数関数位相の両方を含むこともある。増幅方法は、熱変性工程などの温度の変動を含むこともあれば、あるいは熱変性を必要としない等温過程であることもある。適切な増幅プロセスの非限定的な例は、本開示の様々な態様のいずれかに関して本明細書に記載されている。いくつかの実施形態では、増幅はローリングサークル増幅(RCA)を含む。本明細書の他の場所で記載されるように、典型的なRCA反応混合物は、1つ以上のプライマー、ポリメラーゼ、およびdNTPを含み、コンカテマーを生成する。典型的には、RCA反応でのポリメラーゼは鎖置換活性を有するポリメラーゼである。様々なこうしたポリメラーゼが利用可能であり、その非限定的な例としては、エキソヌクレアーゼ minus DNAポリメラーゼI large(Klenow)断片、Phi29 DNAポリメラーゼ、Taq DNAポリメラーゼなどが挙げられる。概して、コンカテマーは、鋳型ポリヌクレオチドからの標的配列の2つ以上のコピー(例えば、標的配列の約2、3、4、5、6、7、8、9、10、あるいはそれ以上のコピー;いくつかの実施形態では、約2つ以上のコピー)を含むポリヌクレオチド増幅産物である。増幅プライマーは、約または少なくとも約5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、またはそれ以上のヌクレオチドなど、任意の適切な長さであってもよく、その一部または全ては、プライマーがハイブリダイズする対応する標的配列に相補的であってもよい(例えば、約または少なくとも約5、10、15、20、25、30、35、40、45、50、またはそれ以上のヌクレオチド)。ランダムプライマー、標的特異的なプライマー、およびアダプターを標的とするプライマーの使用などの様々なRCAプロセスの例が本明細書に記載されており、その一部が図7のA−Cで例示されている。
環状化したポリヌクレオチドが(例えば、コンカテマーを生成するために)配列決定の前に増幅される場合、増幅された産物は富化なく直接配列決定にさらされることもあれば、あるいはその後、1つ以上の富化工程にさらされることもある。適切な富化プロセスの非限定的な例は、本開示の様々な態様のいずれかに関して本明細書に記載されている(例えば、第2の増幅工程のB2Bプライマーの使用)。いくつかの実施形態に従って、環状化したポリヌクレオチド(あるいは随意に富化されているかもしれないその増幅産物)は、配列決定リードを生成するために配列決定反応にさらされる。そのような方法によって生成された配列決定リードは、本明細書で開示される他の方法と合わせて使用されてもよい。様々な配列決定方法、とりわけ、ハイスループット配列決定方法が利用可能である。例としては、限定されないが、Illumina(HiSeq(登録商標)とMiSeq(登録商標)などの配列決定システム)、Life Technologies(Ion Torrent(登録商標)、SOLiD(登録商標)など)、Rocheの454 Life Sciences systems、Pacific Biosciences systemsなどによって製造された配列決定システムが挙げられる。いくつかの実施形態において、配列決定は、長さが約50、75、100、125、150、175、200、250、300、またはそれ以上のヌクレオチドのリードを生成するためにHiSeq(登録商標)とMiSeq(登録商標)のシステムの使用を含む。増幅プラットフォームおよび方法の追加の非限定的な例が、本開示の様々な態様のいずれかに関して本明細書で記載されている。
いくつかの実施形態にしたがって、配列決定リードと参照配列との間の配列の差異は、少なくとも2つの様々なポリヌクレオチド(例えば、異なる接合部を有するため識別可能な2つの異なる環状ポリヌクレオチド、あるいは、異なる5’末端および/または異なる3’末端を有する2つの異なるポリペプチド)で生じる場合に、純粋な配列変異体(例えば、増幅または配列決定の前のサンプル中で存在し、これらのプロセスのいずれかの結果ではない)と呼ばれる。増幅または配列決定の誤差の結果である配列変異体が同じ標的配列を含む2つの異なるポリヌクレオチド上では正確に(例えば、位置とタイプ)複製されない可能性他あるため、このバリデーションパラメータを追加することで、誤った配列変異体のバックグラウンドを大幅に減少させ、サンプル中の実際の配列変異を検出する感度と精度を同時に増大させる。いくつかの実施形態では、約5%、4% 3% 2%、1.5%、1%、0.75%、0.5%、0.25%、0.1%、0.075%、0.05%、0.04%、0.03%、0.02%、0.01%、0.005%、0.001%、あるいはそれ以下の頻度を有する配列変異体は、正確なコールを可能にするほどバックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体は、約0.1%以下の頻度で生じる。いくつかの実施形態において、方法は、0.001%−2%または0.01%−1%など約0.0005%−約3%の範囲の頻度を有する配列の差異を、純粋な配列変異体とコールする工程を含む。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率(例えば、約0.05、0.01、0.001、0.0001以下のp値)を統計的に有意なほど上回る場合に、バックグラウンドよりも十分に高い。いくつかの実施形態において、配列変異体の頻度は、バックグラウンド誤差率よりも約または少なくとも約2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、100倍、またはそれ以上である場合に、バックグラウンドよりも十分に高い(例えば、少なくとも5倍高い)。いくつかの実施形態において、所定の位置で配列を正確に決定する際のバックグラウンド誤差率は、約1%、0.5% 0.1%、0.05%、0.01%、0.005%、0.001%、0.0005%以下である。いくつかの実施形態では、誤差率は0.001%よりも低い。頻度および誤差率を決定するための方法は、本開示の様々な態様のいずれかに関して本明細書で記載されている。
いくつかの実施形態において、純粋な配列変異体を同定する(「コールする(calling)または(making a call)」とも呼ばれる)ことは、2つの間の差を同定するために、および、接合部を同定するために参照配列に1つ以上の配列決定リードを最適にアラインすることを含む。概して、アラインメントは、1つの配列を別の配列に沿って置き、各配列に沿ってギャップを反復して導入し、2つの配列がどれくらいよく一致しているかスコア化し、参照配列に沿って様々な位置について好ましくは反復することを含む。最良のスコアの一致がアラインメントであると思われ、配列間の関係の程度に関する推論を表している。それらを実行する様々なアラインメントアルゴリズムおよびアライナーが利用可能であり、その非限定的な例が、本開示の様々な態様のいずれかに関して本明細書で記載されている。いくつかの実施形態において、配列決定リードが比較される参照配列は、参照ゲノム(例えば、被験体と同じ種のメンバーのゲノム)などの既知の参照配列である。参照ゲノムは完全なこともあれば不完全なこともある。いくつかの実施形態において、参照ゲノムは、参照ゲノムから、あるいは分析中の配列決定リードから生成されたコンセンサスからなど、標的ポリヌクレオチドを含む領域のみからなる。いくつかの実施形態において、参照配列は、1つ以上の細菌、古細菌、ウイルス、原生生物、菌類あるいはその他の生物からの配列など、1つ以上の生物のポリヌクレオチドの配列を含み、または該配列からなる。いくつかの実施形態において、参照配列は、分析中の1つ以上の標的配列に対応する領域(例えば1つ以上の遺伝子あるいはその一部)などの参照ゲノムの一部のみからなる。例えば、(汚染検出の場合などでは)病原体の検出のために、参照ゲノムは、特定の株または血清型のなどの特定で役立つ、病原体(例えば、HIV、HPV、あるいは有害な菌株、例えば、大腸菌)の全ゲノムあるいはその一部である。いくつかの実施形態において、複数の様々な生物あるいは菌株についてスクリーニングするなどのために、配列決定リードは複数の様々な参照配列にアラインされる。配列の差異が同定され得る参照配列(および、コールされた配列変異体)の追加の非限定的な例が、本開示の様々な態様のいずれかに関して本明細書で記載されている。
1つの態様では、本開示は、反応混合物において、標的配列の2つ以上のコピーを含む複数の様々なコンカテマーを増幅する方法を提供し、標的配列は5’〜3’の方向に配向された配列Aと配列Bを含む。いくつかの実施形態において、方法は反応混合物を核酸増幅反応にさらす工程を含み、反応混合物は、(a)複数のコンカテマーであって、複数のコンテカマーの個々のコンカテマーが、5’末端と3’末端を有する個々のポリヌクレオチドを環状化することにより形成された異なる接合部を含む、複数のコンカテマーと、(b)配列A’を含む第1のプライマーであって、第1のプライマーが配列Aと配列A’との間の配列相補性によって標的配列の配列Aに特異的にハイブリダイズする、第1のプライマーと;(c)配列Bを含む第2のプライマーであって、第2のプライマーが配列Bと配列B’との間の配列相補性によって標的配列の補体を含む相補的なポリヌクレオチド中に存在する配列B’に特異的にハイブリダイズする、第2のプライマーと、(d)増幅されたポリヌクレオチドを生成するために第1のプライマーと第2のプライマーを伸長するポリメラーゼを含み、標的配列の配列Aの5’末端と配列Bの3’末端との間の距離が75nt以下である。
関連する態様において、本開示は、標的配列を含む複数の異なる環状ポリヌクレオチドを反応混合物中で増幅する方法を提供し、標的配列は、5’から3’方向に配向される配列A及び配列Bを含む。幾つかの実施形態において、前記方法は、反応混合物を核酸増幅反応にさらす工程を含み、反応混合物は以下を含む:(a)複数の環状ポリヌクレオチドであって、その中の個々の環状ポリヌクレオチドは5’末端及び3’末端を持つ個々のポリヌクレオチドの環状化により形成された異なる接合部を含む、複数の環状ポリヌクレオチド;(b)配列A’を含む第1のプライマーであって、配列Aと配列A’との間の配列相補性を介して標的配列の配列Aに特異的にハイブリダイズする、第1のプライマー;(c)配列Bを含む第2のプライマーであって、配列BとB’との間の配列相補性を介して標的配列の補体を含む相補的ポリヌクレオチドに存在する配列B’に特異的にハイブリダイズする、第2のプライマー;及び(d)増幅されたポリヌクレオチドを産生するために第1のプライマーと第2のプライマーを伸長するポリメラーゼ;ここで、配列A及び配列Bは内因的な配列であり、配列Aの5’末端と標的配列の配列Bの3’末端との間の距離は75nt以下である。
環状ポリヌクレオチド又はコンカテマーの何れかを増幅しても、そのようなポリヌクレオチドは、(直接的に、或いは増幅などにより間接的に)任意の適切なサンプルソースから由来し得る。様々な適切なサンプルソース、随意の抽出プロセス、ポリヌクレオチドのタイプ、及び配列変異体のタイプが、本開示の様々な態様の何れかなどに対して、本明細書で記載される。環状ポリヌクレオチドは非環状ポリヌクレオチドの環状化に由来し得る。環状化プロセス(例えば、アダプターオリゴヌクレオチドを用いる及び用いない)、試薬(例えば、アダプターのタイプ、及びリガーゼの使用)、反応条件(例えば、自己接合を好む)、随意の追加の処理(例えば、反応後の精製)、及びそれらによって形成された接合部の非限定的な例は、本開示の様々な態様の何れかに関するものなど、本明細書で提供される。コンカテマーは環状ポリヌクレオチドの増幅に由来し得る。ポリヌクレオチド(例えばDNA及び/又はRNA)を増幅する様々な方法が利用可能である、その非限定的な例も本明細書で記載されている。幾つかの実施形態において、コンカテマーは環状ポリヌクレオチドのローリングサークル増幅によって生成される。
図10は、標的配列の多数のコピーを含む単一の反復(典型的に環状でなければ増幅されない)及びコンカテマーの状況における標的配列に対する第1及び第2のプライマーの配置の一例を例示する。本明細書に記載される他の態様に関して注記されるように、このプライマーの配置は、「背中合わせ(B2B)」又は「逆転した」プライマーと称され得る。B2Bプライマーでの増幅は、環状及び/又はコンカテマーの鋳型の富化を促進する。更に、接合部が、(互いに面する、標的配列におよぶ)典型的な増幅反応に見出されるプライマー配置におけるほどプライマー間には恐らく生じないことから、比較的小さなフットプリント(プライマーの対におよぶ総距離)と組み合わされたこの配向は、標的配列周囲のより広範囲の断片化イベントを可能にする。幾つかの実施形態において、配列Aの5’末端と配列Bの3’末端との間の距離は、約200、150、100、75、50、40、30、25、20、15、或いはそれ以下のヌクレオチドである。幾つかの実施形態において、配列Aは配列Bの補体である。幾つかの実施形態において、複数の異なる標的配列に向けられるB2Bプライマーの多数の対は、並行して複数の異なる標的配列(例えば、約、或いは少なくとも約10、50、100、150、200、250、300、400、500、1000、2500、5000、10000、15000、又はそれ以上の異なる標的配列)を増幅させるために同じ反応で使用される。プライマーは、本明細書に別記されるものなどの適切な長さであり得る。増幅は、本明細書に記載される増幅反応など、適切な条件下での適切な増幅反応を含み得る。幾つかの実施形態において、増幅はポリメラーゼ連鎖反応である。
幾つかの実施形態において、B2Bプライマーは、少なくとも2つの配列要素、配列相補性を介して標的配列にハイブリダイズする第1の要素、及び、(例えば、尾部と第1の要素が結合する場所に対して3’に隣接する標的配列の部分との間の配列相補性の不足による)第1の要素がハイブリダイズする第1のハイブリダイゼーション温度での第1の増幅段階中に標的配列にハイブリダイズしない5’「尾部」を含む。例えば、第1のプライマーは配列A’に対して配列C5’を含み、第2のプライマーは配列Bに対して配列D5’を含み、及び配列Cと配列Dは何れも、第1のハイブリダイゼーション温度での第1の増幅段階中に複数のコンカテマー(又は環状ポリヌクレオチド)にハイブリダイズする。そのような尾部付加プライマー(tailed primer)が使用される幾つかの実施形態において、増幅は第1の段階と第2の段階を含むことができ;第1の段階は第1の温度でのハイブリダイゼーション工程を含み、その間に、第1及び第2のプライマーは、コンカテマー(又は環状ポリヌクレオチド)及びプライマー伸長にハイブリダイズし;第2の段階は、第1の温度よりも高い第2の温度でのハイブリダイゼーション工程を含み、その間に、第1及び第2のプライマーは、伸長された第1又は第2のプライマー、又はその補体、及びプライマー伸長を含む増幅産物にハイブリダイズする。2つの温度の各々での増幅サイクルの数は、望ましい産物に基づいて調整することができる。典型的に、第1の温度は、約15、10、9、8、7、6、5、又はそれ以下のサイクルなど、比較的少ない数のサイクルのために使用される。より高温度でのサイクルの数は、第1の温度でのサイクルの数とは無関係に選択することができるが、典型的には、約、又は少なくとも約5、6、7、8、9、10、15、20、25、又はそれ以上のサイクルなど、同じくらい又はより多くのサイクルである。より高温度では、プライマー中の第1の要素のみとコンカテマー内の内部標的配列との間のハイブリダイゼーションによって形成された、より短い断片にわたって、プライマー伸長産物におけるプライマーの第1の要素と尾部要素との間のハイブリダイゼーションが好まれる。従って、二段階の増幅が、短い増幅産物が他の場合に好まれる程度を減らして、それにより標的配列の2つ以上のコピーを持つ増幅産物の比較的高い比率を維持するために使用され得る。例えば、第2の温度及びプライマー伸長でのハイブリダイゼーションの5つのサイクル(例えば少なくとも5、6、7、8、9、10、15、20、又はそれ以上のサイクル)の後、反応混合物中の増幅されたポリヌクレオチドの少なくとも5%(例えば、少なくとも5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、又はそれ以上)は、標的配列の2つ以上のコピー含む。この二段階に従った実施形態の例示として、尾部付加B2Bプライマー増幅プロセスは、図11のA−Dに例示される。更なる実施の例示が図15のA−Cで提供される。
幾つかの実施形態において、増幅は、コンカテマーからのアンプリコンの長さを増大させるために歪められる条件下で行われる。例えば、プライマー濃度は、どの刺激部位もプライマーをハイブリダイズせず、故にPCR産物をより長くするように、少なくすることができる。同様に、サイクル中のプライマーハイブリダイゼーション時間の減少は、より少数のプライマーがハイブリダイズすることを可能にし、故に平均PCRアンプリコンのサイズを増大させる。更に、サイクルの温度及び/又は伸長時間の増大は、同様にPCRアンプリコンの平均長さを増大させる場合がある。これら技術のあらゆる組み合わせも使用することができる。
幾つかの実施形態において、特にB2Bプライマーでの増幅が実行された場合、増幅産物は、コンカテマーを含む混合物のモノマーの数を減らす及び/又は除去するために、サイズに基づいて結果として生じるアンプリコンをフィルタリングするために処理される。これは、(例えば、長さ約300、400、500、又はそれ以上のヌクレオチドよりも大きな断片を富化するための)ゲルからの断片切除及びゲル濾過を含むがこれらに限定されない様々な利用可能な技術;同様に、結合緩衝液濃度の微調整によるサイズ選択のためのSPRIビーズ(Agencourt AMPure XP)を用いて行うことができる。例えば、DNA断片との混合中の0.6x結合緩衝液の使用が、優先的に約500塩基対(bp)よりも大きなDNA断片を結合するために使用されてもよい。
幾つかの実施形態において、第1のプライマーは配列A’に対して配列C5’を含み、第2のプライマーは配列Bに対して配列5’を含み、配列Cと配列Dは何れも、第1のハイブリダイゼーション温度での第1の増幅段階中に複数の環状ポリヌクレオチドにハイブリダイズしない。増幅は第1の段階及び第2の段階を含む場合があり;ここで、第1の段階は第1の温度でのハイブリダイゼーション工程を含み、その間に、第1及び第2のプライマーは、プライマー伸長の前にそれらの環状ポリヌクレオチド又は増幅産物にハイブリダイズし;第2の段階は、第1の温度よりも高い第2の温度でのハイブリダイゼーション工程を含み、その間に、第1及び第2のプライマーは、伸長された第1又は第2のプライマー或いはその補体を含む増幅産物にハイブリダイズする。例えば、第1の温度は、配列A’、配列B、又はこれらの平均のおよそのTm又はそれ以上として、或いは、1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、又はこれらTmの1つよりも高い温度として選択され得る。この例において、第2の温度は、組み合わせた配列(A’+C)、組み合わせた配列(B+D)、又はこれらの平均のおよそのTm又はそれ以上として、或いは、1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、又はこれらTmの1つよりも高い温度として選択され得る。用語「Tm」は「融解温度」とも称され、一般的には、参照配列(実際にはより大きなポリヌクレオチド内のサブ配列でもよい)及びその相補的配列から成るオリゴヌクレオチドの50%がハイブリダイズされる(又は分離される)温度を表わす。一般的に、Tmは長さの増大により増大し、そのため、配列A’のTmは組み合わせ配列(A’+C)のTmより低いと推測される。
一態様において、本開示は、配列変異体を検出するためのシステムを提供する。幾つかの実施形態において、システムは、(a)サンプル上で検出反応を実行するためのユーザーリクエストを受信するように構成されたコンピュータ;(b)ユーザーリクエストに応じてサンプル又はその一部の上で核酸増幅反応を実行する増幅システムであって、増幅反応は、(i)リガーゼ酵素を使用して複数の円形のポリヌクレオチドを形成するために複数のポリヌクレオチドにおいて個々のポリヌクレオチドに環状化する工程であって、複数のポリヌクレオチドの各々がライゲーションの前に3’末端と5’端部との間に接合部を持つ、工程;(ii)リガーゼ酵素を分解する工程;及び(ii)増幅されたポリヌクレオチドを産生するためにリガーゼ酵素を分解した後に環状ポリヌクレオチドを増幅する工程を含み;ポリヌクレオチドは工程(i)と(iii)の間には精製又は単離されない、増幅システム;(c)増幅システムによって増幅されたポリヌクレオチドのために配列決定リードを生成し、配列決定リードと参照配列との間の配列の差異を同定し、且つ異なる接合部を持つ少なくとも2つの環状ポリヌクレオチドに生じる配列の差異を配列変異体としてコールする、配列決定システム;及び(d)配列変異体の検出に関する結果を含む報告書をレシピエントに送信する報告書作成装置を備えている。幾つかの実施形態において、レシピエントはユーザーである。図32は、本開示の方法において有用なシステムの非限定的な例を説明する。図29と30は、例示的なワークフロー設計の例示的な概要を提供する。
本システムで使用されるコンピュータは1つ以上のプロセッサを含むことができる。プロセッサは、1つ以上の制御装置、計算ユニット、及び/又はコンピュータシステムの他のユニットに関連付けられるか、又は所望されるようにファームウェアに埋め込まれてもよい。ソフトウェアに実施されれば、ルーチンは、RAM、ROM、フラッシュメモリ、磁気ディスク、レーザーディスク(登録商標)、又は他の適切な記憶媒体などの任意のコンピュータ可読メモリに記憶され得る。同様に、このソフトウェアは、例えば、電話回線、インターネット、ワイヤレス接続などの通信チャネル上、或いはコンピュータ可読ディスク、フラッシュドライブなどの移動式媒体を介して等が挙げられる、あらゆる既知の送達方法を介してコンピューティングに送達され得る。様々な工程が、順番にハードウェア、ファームウェア、ソフトウェア、或いはハードウェア、ファームウェア、及び/又はソフトウェアの任意の組み合わせに実装され得る様々なブロック、操作、ツール、モジュール、及び技術として実施されてもよい。ハードウェアで実施されるとき、ブロック、操作、技術などの幾つか又は全ては、例えば、カスタム集積回路(IC)、特定用途向け蓄積回路(ASIC)、カスタム(フィールドプログラマブルロジックアレイ(FPGA)、プログラマブルロジックアレイ(PLA)などで実施され得る。クライアントサーバーリレーショナルデータベース構造が、本システムの実施形態に使用することができる。クライアントサーバーアーキテクチャは、ネットワーク上のコンピュータ又はプロセスがそれぞれ、クライアント又はサーバーのいずれかである、ネットワークアーキテクチャである。サーバーコンピュータは典型的に、ディスクドライブ(ファイルサーバー)、プリンター(プリントサーバー)、又はネットワークトラフィック(ネットワークサーバー)の管理に対する専用の高性能コンピュータであり得る。クライアントコンピュータは、PC(パーソナルコンピュータ)又はユーザーがアプリケーションを実行するワークステーションの他に、本明細書に開示されるような例となる出力デバイスを含むことができる。クライアントコンピュータは、ファイル、デバイス、及び更に処理パワーなどのリソースのためのサーバーコンピュータに依存する。サーバーコンピュータは、データベース機能性の全てを処理する。クライアントコンピュータは、フロントエンドのデータ管理全てを処理するソフトウェアを有することができ、ユーザーからデータ入力を受信することができる。
本システムはサンプル上で検出反応を実行するためのユーザーリクエストを受信するように構成され得る。ユーザーリクエストは直接的又は間接的でもよい。直接リクエストの例には、キーボード、マウス、又はタッチスクリーンなどの入力デバイスによって送信されるものが挙げられる。間接リクエストの例には、インターネット(有線又は無線)上などの通信媒体を介した送信が挙げられる。
本システムは、ユーザーリクエストに応じてサンプル又はその一部の上で核酸増幅反応を実行する増幅システムを更に含み得る。ポリヌクレオチド(例えばDNA及び/又はRNA)を増幅する様々な方法が利用可能である。増幅は線状、指数関数的であるか、又は多重フェーズ増幅プロセスにおいて線状と指数関数的の両方に関与し得る。増幅方法は、熱変性工程などの温度変化に関与し、或いは熱変性を必要としない等温プロセスであり得る。適切な増幅プロセスの非限定的な例は、本開示の様々な態様の何れかに関するものなど、本明細書に記載される。幾つかの実施形態において、増幅はローリングサークル増幅(RCA)を含む。ポリヌクレオチドを増幅するための様々なシステムが利用可能であり、実行される増幅反応のタイプに基づいて変動し得る。例えば、温度変化のサイクルを含む増幅方法に関しては、増幅システムはサーモサイクラーを含み得る。増幅システムは、Applied Biosystems、Roche、及びStrategeneによって製造されたシステムなどのリアルタイム増幅及び検出器機を含み得る。幾つかの実施形態において、増幅反応は、(i)複数の環状ポリヌクレオチドを形成するために個々のポリヌクレオチドを環状化する工程であって、環状ポリヌクレオチドの各々が5’末端と3’末端との間に接合部を有する、工程;及び(ii)環状ポリヌクレオチドを増幅する工程を含む。サンプル、ポリヌクレオチド、プライマー、ポリメラーゼ、及び他の試薬は、様々な態様の何れかに関するものなど、本明細書に記載されるものの何れかであり得る。環状化プロセス(例えば、アダプターオリゴヌクレオチドを用いる及び用いない)、試薬(例えば、アダプターのタイプ、及びリガーゼの使用)、反応条件(例えば、自己接合を好む)、随意の追加の処理(例えば、反応後の精製)、及びそれらによって形成された接合部の非限定的な例は、本開示の様々な態様の何れかに関するものなど、本明細書で提供される。そのような方法を実行するためのシステムが選択及び設計され得る。
システムはさらに、増幅システムによって増幅されたポリヌクレオチドのために配列決定リードを生成し、配列決定リードと参照配列との間の配列の差異を同定し、且つ異なる接合部を持つ少なくとも2つの環状ポリヌクレオチドに生じる配列の差異を配列変異体としてコールする、配列決定システムを含んでもよい。配列決定システム及び増幅システムは同じであるか、又は重なり合う機器を含み得る。例えば、増幅システム及び配列決定システムは共に同じサーモサイクラーを利用し得る。本システムで使用するための様々な配列決定プラットフォームが利用可能であり、選択された配列決定法に基づいて選択され得る。配列決定法の例が本明細書に記載される。増幅及び配列決定は、液体ハンドラーの使用を含み得る。様々な市販されている液体ハンドラーシステムは、これらプロセスの自動化を実行するために利用することができる(例えば、例としてPerkin−Elmer、Beckman Coulter、Caliper Life Sciences、Tecan、Eppendorf、Apricot Design、Velocity 11製の液体ハンドラーを参照)。様々な自動配列決定機械が市販で入手可能であり、Life Technologies(SOLiDプラットフォーム、及びpHベースの検出)、Roche(454プラットフォーム)、Illumina(例えば、フローセルベースのシステム、Genome Analyzer devicesなど)によって製造されたシーケンサーが挙げられる。2、3、4、5、又はそれ以上の自動装置間(例えば、液体ハンドラー及び配列決定装置の1つ以上の間)での伝達は、手動又は自動であり得る。
配列の差異を同定し且つ参照配列に対して配列変異体をコールするための方法が、本開示の様々な態様の何れかなどに関して、本明細書に記載される。配列決定システムは典型的に、配列決定データの入力、及び望ましいパラメータ(例えば参照ゲノムの選択)の入力に応じて、これら工程を実施するためのソフトウェアを含む。これらアルゴリズムを実施するアラインメントアルゴリズム及びアライナーの例が本明細書で記載され、限定されないがNeedleman−Wunschアルゴリズム(例えば、随意にデフォルト設定を伴う、www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.htmlにて利用可能なEMBOSS Needleアライナーを参照 )、BLASTアルゴリズム(例えば、随意にデフォルト設定を伴う、blast.ncbi.nlm.nih.gov/Blast.cgiにて利用可能なBLASTアラインメントツールを参照)、又はSmith−Watermanアルゴリズム(例えば、随意にデフォルト設定を伴うwww.ebi.ac.uk/Tools/psa emboss_water/nucleotide.htmlにて利用可能なEMBOSS Waterアライナーを参照)が挙げられる。最適なアラインメントは、デフォルトパラメータを含む選択されたアルゴリズムのあらゆる適切なパラメータを使用して評価され得る。そのようなアラインメントアルゴリズムは、配列決定システムの一部を形成し得る。
本システムは、配列変異体の検出に関する結果を含む報告書をレシピエントに送信する報告書作成装置を更に備えている。報告書は、プロセスの進行として周期的な更新と共に、配列決定リード中、又は配列決定データが分析されている間などで、リアルタイムで生成され得る。加えて、又は代替的に、報告書は分析の終わりに生成され得る。報告書は自動的に生成されてもよく、そのような場合、配列決定システムは全ての配列変異体をコールする工程を完了する。幾つかの実施形態において、報告書はユーザーからの指示に応じて生成される。配列変異体の検出の結果に加えて、報告書はまた、1つ以上の配列変異体に基づく分析を含み得る。例えば、1つ以上の配列変異体が特定の不純物又は表現型に関連付けられる場合、報告書は、不純物又は表現型が存在する可能性、どのようなレベルかなどのこの関連性に関する情報、及び随意にこの情報に基づく示唆(例えば追試、モニタリング、又は改善策)を含み得る。報告書は様々な形態の何れかをとることができる。本開示に関するデータは、受信者による受信及び/又は確認のためにそのようなネットワーク又は通信(connections)(或いは、限定されないがプリントアウトなどの物理報告書の郵送を含む、情報を送信するための他の適切な手段)上で送信することができる。受信者は、個人、又は電子装置(例えば1つ以上のコンピュータ、及び/又は1つ以上のサーバー)であり得るが、これらに限定されない。
一態様において、本開示は、1つ以上のプロセッサによる実行に際して、配列変異体を検出する方法を実施するコードを含むコンピュータ可読媒体を提供する。幾つかの実施形態において、実施された方法は、(a)サンプル上で検出反応を実行するためのカスタマーリクエストを受信する工程;(b)カスタマーリクエストに応じてサンプル又は一部の上で核酸増幅反応を実行する工程であって、増幅反応は、(i)リガーゼ酵素を使用して複数の円形のポリヌクレオチドを形成するために複数のポリヌクレオチドにおいて個々のポリヌクレオチドに環状化する工程であって、複数のポリヌクレオチドの各々がライゲーションの前に5’端部と3’末端を有する、工程;(ii)リガーゼ酵素を分解する工程;及び(ii)増幅されたポリヌクレオチドを産生するためにリガーゼ酵素を分解した後に環状ポリヌクレオチドを増幅する工程を含み;ポリヌクレオチドは工程(i)と(iii)の間には精製又は単離されない、増幅システム;(c)配列決定分析を行う工程であって、(i)増幅反応で増幅されたポリヌクレオチドの配列決定リードを生成すること;(ii)配列決定リードと参照配列との差を同定すること;及び(iii)異なる接合部を持つ少なくとも2つの環状ポリヌクレオチドに生じる配列の差異を配列変異体としてコールすること、を含む工程;及び(d)配列変異体の検出に関する結果を含む報告書を生成する工程を含む。
コンピュータ実行可能コードを含むマシン可読媒体は、有形ストレージ媒体、搬送波媒体、又は物理的伝送媒体を含むが、これらに限定されない、多くの形態をとってもよい。不揮発性記憶媒体には、例えば、データベースなどを実装するために使用することができるような、コンピュータなどにおける記憶装置のいずれかなどの光ディスク又は磁気ディスクが含まれる。揮発性記憶媒体は、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリを含む。有形送信媒体は、同軸ケーブル;コンピュータシステム内のバスを含むワイヤーを含む、銅線及び光ファイバーを含んでいる。搬送波送信媒体は、無線周波(RF)及び赤外線(IR)データ通信中に生成されたものなどの、電気信号又は電磁気信号、或いは音波又は光波の形態をとり得る。それ故、コンピュータ可読媒体の共通の形態は、例えば:フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の磁気媒体、CD−ROM、DVD若しくはDVD−ROM、他の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の物理的な記憶媒体、RAM、ROM、PROM及びEPROM、FLASH−EPROM、他のメモリチップ若しくはカートリッジ、データ若しくは命令を輸送する搬送波、そのような搬送波を伝達するケーブル若しくはリンク、又はコンピュータがプログラミングのコード及び/又はデータを読み取り得る他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサに1つ以上の命令の1つ以上のシーケンスを運ぶことに関係し得る。
主題のコンピュータ実行可能コードは、サーバー、PC、又はスマートフォン又はタブレットなどのモバイルデバイスが挙げられる、プロセッサを含む任意の適切な装置上で実行することができる。あらゆる制御装置又はコンピュータが随意に、ブラウン管(「CRT」)ディスプレイ、平面パネルディスプレイ(例えばアクティブマトリクス型液晶ディスプレイ、液晶ディスプレイ等)、或いはその他であり得るモニターを含む。コンピュータ回路は多くの場合、マイクロプロセッサ、メモリ、インターフェース回路、及びその他などの多数の集積回路チップを含むボックス内に配される。ボックスはまた随意に、ハードディスクドライブ、フロッピーディスクドライブ、書き込み可能なCD−ROMなどの高容量の取り外し可能なドライブ、及び他の共通の周辺要素も含む。キーボード、マウス、又はタッチセンススクリーンなどの入力装置は随意にユーザーからの入力を提供する。コンピュータは、パラメータフィールドのセットへのユーザー入力の形態、例えばGUIで、或いは、予めプログラムされた命令の形態、例えば様々な異なる特定の操作のために予めプログラムされたもので、ユーザーの命令を受信するのに適切なソフトウェアを含み得る。
本明細書に開示される様々な態様の何れかの幾つかの実施形態において、方法、組成物、及びシステムは、患者サンプルの特徴づけ及び随意に被験体の疾病の診断などにおける治療用途を持つ。治療用途はまた、本明細書に記載される方法の結果に基づいて、患者が最も反応し得る治療(「セラノスティック」とも称される)、及び必要とする被験体の実際の処置の選択を知らせる工程を含み得る。特に、本明細書に開示される方法及び組成物は、特に分析されたポリヌクレオチドがcfDNA、ctDNA、cfRNA、又は断片化された腫瘍DNAを含む、或いはそれらから成るときに、腫瘍の存在、進行、及び/又は腫瘍の転移を診断するために使用されてもよい。幾つかの実施形態において、被験体は処置効果のためにモニタリングされる。例えば、経時的にctDNAをモニタリングすることによって、ctDNAの減少は効果的な処置の指標として使用することができ、一方で増加は異なる処置又は異なる用量の選択を促進することができる。他の使用は、移植レシピエントの臓器拒絶の評価(この場合、移植ドナーゲノムに対応する循環DNAの量の増加が移植拒絶反応の初期の徴候として使用される)、及びウイルス又は細菌感染などの病原体感染症の遺伝子型判定/アイソタイピング(isotyping)を含む。循環胎児DNAの配列変異体の検出が胎児の疾病を診断するために使用されてもよい。
本明細書で使用されるように、「処置」又は「処置すること」或いは「緩和すること」又は「寛解させること」は互換的に使用される。これらの用語は、限定されないが治療効果及び/又は予防効果を含む、有益な又は所望の結果を得るための方法を指す。治療効果は、処置の下での1つ以上の疾患、疾病、又は症状における治療に関連する改善、或いはそれらに対する効果を意味する。予防効果に関して、組成物は、特定の疾患、疾病、又は症状が未だに明らかになっていなくとも、疾患、疾病、又は症状を進行する危険のある被験体に、又は、疾患の生理学的な症状の1つ以上を報告する被験体に投与され得る。典型的に、予防効果は、(例えば、処置集団と未処置集団の間、或いは被験体の処置状態と未処置状態の間として)処置の下での1つ以上の疾患、疾病、又は症状の発生及び/又は悪化を減らすことを含む。治療結果の改善は、1つ以上の治療薬、又は他の治療介入(手術など)による処置から利益を得る、又は得ない者として被験体を同定するために、被験体の状態を診断することを含み得る。そのような診断用途において、1つ以上の治療薬による処置の成功の全体的な割合は、本開示の方法に従い診断なしにグループ分けされた患者間の有効性に比べて、改善され得る(例えば、少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、又はそれ以上の治療効果の測定値の改善として)。
用語「被験体」、「個体」、及び「患者」は、脊椎動物、好ましくは哺乳動物、より好ましくはヒトを指すために本明細書で互換的に使用される。哺乳動物には限定されないが、マウス、サル、ヒト、家畜、スポーツ動物(sport animals)、及びペットが挙げられる。インビボで得られたか又はインビトロで培養された組織、細胞、及びそれらの生物学的実体の子孫も包含される。
用語「治療薬」、「治療可能な薬剤」、又は「処置剤」は互換的に使用され、被験体の投与に際してある程度の有益な効果を与える分子又は化合物を指す。有益な効果は、診断上の判定の可能性;疾患、症状、障害、又は病理学的疾病の改善;疾患、症状、障害、又は疾病の発症の軽減又は予防;及び一般的に、疾患、症状、障害、又は病理学的疾病を中和することを含む。
本明細書に記載された様々な方法の幾つかの実施形態において、サンプルは被験体由来である。被験体はあらゆる生物であり、その非限定的な例として、植物、動物、真菌、原生生物、モネラ、ウイルス、ミトコンドリア、及び葉緑体が挙げられる。サンプルポリヌクレオチドは、細胞サンプル、組織サンプル、体液サンプル、又は臓器サンプル(或いはこれらの何れかに由来する細胞培養物)など、被験体から単離されるものであり、例えば、培養細胞株、生検、血液サンプル、口腔粘膜検体採取物、又は細胞を含む流体サンプル(例えば唾液)が挙げられる。場合によっては、サンプルは無傷細胞を含まず、細胞を除去するために処置され、或いはポリヌクレオチドは、細胞の抽出工程(例えば、無細胞DNAなどの無細胞ポリヌクレオチドを単離すること)を用いることなく単離される。サンプルのソースの他の例には、血液、尿、糞便、鼻孔、肺、腸、他の体液又は排泄物、それらから得られるもの、或いはそれらの組み合わせに由来するものが挙げられる。被験体は、限定されないがウシ、ブタ、マウス、ラット、トリ、ネコ、イヌなどを含む動物であり、且つ通常はヒトなどの哺乳動物である。幾つかの実施形態において、サンプルは被験体からの腫瘍組織のサンプルなどの中の腫瘍細胞を含む。幾つかの実施形態において、サンプルは、血液サンプル又はその一部(例えば血漿又は血清)である。血清と血漿は、そのような組織間での高割合の悪性細胞死に関連する腫瘍DNAの相対的な富化により、特に興味深いものであり得る。サンプルは、新鮮なサンプル、又は1つ以上の保管プロセスにさらされるサンプル(例えばパラフィン包埋サンプル、特にホルマリン固定パラフィン包埋(FFPE)サンプル)であり得る。幾つかの実施形態において、一人の個体からのサンプルは、2回、3回、4回、又はそれ以上繰り返される分析などの、本開示の方法に独立してさらされる、複数の別個のサンプル(例えば2、3、4、5、6、7、8、9、10、又はそれ以上の別個のサンプル)に分割される。サンプルが被験体由来である場合、参照配列も被験体由来であってもよく、分析中のサンプルのコンセンサス配列、或いは同じ被験体の別のサンプル又は組織由来のポリヌクレオチドの配列などである。例えば、血液サンプルはctDNA突然変異のために分析され得るが、別のサンプル(例えば頬側又は皮膚サンプル)からの細胞内DNAは参照配列を判定するために分析される。
ポリヌクレオチドは、適切な方法に従い、サンプル中の細胞からの抽出を用いて又は用いることなく、サンプルから抽出され得る。様々なキットが、ポリヌクレオチドの抽出、サンプルのタイプに依存し得るものの選択、或いは単離される核酸のタイプのために利用可能である。抽出方法の例は、本明細書に開示される様々な態様の何れかに対して記載されるものなど、本明細書で提供される。一例において、サンプルは、EDTA管(例えばBDヴァキュテイナー)において採取されたサンプルなどの血液サンプルでもよい。血漿は、遠心分離(例えば4℃で1900×gを10分)によって末梢血細胞から分離することができる。6mLの血液サンプル上でこのような方法で実行された血漿分離は典型的に、2.5から3mLの血漿をもたらす。循環する無細胞DNAは、製造者のプロトコルに従って、QIAmp Circulating Nucleic Acid Kit(Qiagene)を使用するなどにより、血漿サンプルから抽出されてもよい。その後、DNAは定量化され得る(例えば、Agilent 2100 Bioanalyzer with High Sensitivity DNA kit(Agilent)上で)。一例として、健康なヒトからのそのような血漿サンプルの循環DNAの収量は、血漿1mL当たり1ngから10ngに及び、癌患者サンプルにおいて有意に多い。
ポリヌクレオチドはまた、保管されたサンプル、凍結された又はアーカイブ保管されたサンプルに由来し得る。サンプルを保管するための1つの共通の方法は、それらをホルマリン固定及びパラフィン包埋することである。しかし、このプロセスは核酸の分解にも関連付けられる。FFPEサンプルから処理及び分析されたポリヌクレオチドは、50−200の塩基対又はそれよりも短い範囲における断片などの、短いポリヌクレオチドを含み得る。多数の技術が、固定されたパラフィン包埋サンプルからの核酸の精製のために存在し、WO2007133703に記載されるもの、及びFoss, et al Diagnostic Molecular Pathology, (1994) 3:148−155並びにPaska, C., et al Diagnostic Molecular Pathology, (2004) 13:234−240に記載される方法などがある。市販されているキットは、FFPEサンプルからポリヌクレオチドを精製するために使用されてもよく、Ambion’s Recoverall Total Nucleic acid Isolation kitなどがある。典型的な方法は、キシレン又は他の有機溶媒による抽出、その後、熱、及び組織とタンパク質を切断し且つ組織からゲノム材料を放出するのを支援するプロテアーゼ様プロテイナーゼKによる処理を介して、組織からパラフィンを除去する工程から始まる。その後、放出された核酸は、膜上で捕捉又は溶液から沈殿させ、洗浄して不純物を除去することができ、mRNA単離の場合には、DNase処置工程が時折、不要なDNAを分解するために加えられる。FFPE DNAを抽出するための他の方法が利用可能であり、本開示の方法に使用することができる。
幾つかの実施形態において、複数のポリヌクレオチドは、無細胞DNA(cfDNA)、無細胞RNA(cfRNA)、循環腫瘍DNA(ctDNA)、又は循環腫瘍RNA(ctRNA)などの無細胞ポリヌクレオチドを含む。無細胞DNAは健康な個体及び病気の個体において循環する。無細胞RNAは健康な個体及び病気の個体において循環する。腫瘍(ctDNA)からのcfDNAは、あらゆる特異的な癌タイプには制限されないが、異なる悪性病変にわたる共通の所見であると考えられる。幾つかの測定に従い、血漿中の遊離循環DNA濃度は、対照被験体では約14−18ng/ml、及び腫瘍形成を伴う患者では約180−318ng/mlである。アポトーシス及び壊死の細胞死は、体液中の無細胞循環DNAに起因する。例えば、有意に増大した循環DNAレベルは、前立腺癌患者、及び良性の前立腺肥大及び前立腺炎(Prostatits)などの他の前立腺疾患患者の血漿において観察された。加えて、循環腫瘍DNAは、原発性腫瘍が生じる臓器から生じる流体に存在する。故に、乳癌検出は、乳管洗浄;便の大腸癌検出;唾液の肺癌検出、及び尿又は射精液の前立腺癌検出において達成することができる。無細胞DNAは様々なソースから得られる場合がある。1つの共通のソースは被験体の血液サンプルである。しかし、cfDNA又は他の断片化されたDNAは様々な他のソースに由来する場合もある。例えば、尿及び糞便サンプルはctDNAを含むcfDNAのソースであり得る。無細胞RNAは様々なソースから得られる場合もある。
幾つかの実施形態において、ポリヌクレオチドは、抽出工程の無い、及び/又は精製工程のない後の工程(例えば環状化及び増幅)にさらされる。例えば、流体サンプルは、精製された液体サンプル及び細胞サンプルを産生するための抽出工程、その後の精製された流体サンプルからのDNAの単離無しに細胞を除去するために処理され得る。ポリヌクレオチドの単離のための様々な手順が、沈殿又は基質への非特異的結合、その後の結合されたポリヌクレオチドを放出するための基質の洗浄などにより、利用可能である。ポリヌクレオチドが細胞抽出工程なしにサンプルから単離される場合、ポリヌクレオチドの大部分は細胞外又は「無細胞」のポリヌクレオチドである。例えば、無細胞ポリヌクレオチドは、無細胞DNA(「循環」DNAとも称される)を含み得る。幾つかの実施形態において、循環DNAは、体液又は排泄物(例えば血液サンプル)などからの腫瘍細胞由来の循環腫瘍DNA(ctDNA)である。無細胞ポリヌクレオチドは無細胞RNA(「循環」RNAとも称される)を含み得る。幾つかの実施形態において、循環RNAは、腫瘍細胞由来の循環腫瘍RNA(ctRNA)である。腫瘍は頻繁にアポトーシス又は壊死を示し、それにより腫瘍核酸は、異なる形態及び異なるレベルで、様々なメカニズムを介して、被験体の血流を含む身体へと放出される。典型的に、ctDNAのサイズは、より小さな断片のより高い濃度、通常は長さ70から200のヌクレオチドから、最大数千キロベースの大きな断片のより低い濃度に及び得る。
本明細書に記載される様々な態様の何れかの幾つかの実施形態において、配列変異体を検出することは、参照配列に対して、或いは突然変異の無いバックグラウンドにおいて突然変異(例えば、稀な体細胞突然変異)を検出することを含み、ここで配列変異体は疾患に関連する。一般的に、疾患又は形質との関連性の統計的、生物学的、及び/又は機能的な証拠が存在する配列変異体は、「原因遺伝子変異体」と称される。単一の原因遺伝子変異体は、1より多くの疾患又は形質に関連付けられ得る。幾つかの実施形態において、原因遺伝子変異体は、メンデル形質、非メンデル形質、又はその両方に関連付けられ得る。原因遺伝子変異体は、1、2、3、4、5、6、7、8、9、10、20、50、又はそれ以上の配列の差異(原因遺伝子変異体を含むポリヌクレオチドと、同じ相対的なゲノム位置にて原因遺伝子変異体を欠くポリヌクレオチドとの間など)など、ポリヌクレオチドにおける変形として現れ得る。原因遺伝子変異体のタイプの非限定的な例は、一塩基多型(SNP)、欠失/挿入多型(DIP)、コピー数多型(CNV)、短いタンデム反復(STR)、制限酵素断片長多型(RFLP)、単純反復配列(SSR)、長さが様々なタンデム反復(VNTR)、ランダム増幅多型DNA(RAPD)、増幅断片長多型(AFLP)、レトロトランスポゾン間増幅多型(IRAP)、長分散型核内反復配列及び分散型核内反復配列(LINE/SINE)、長いタンデム反復(LTR)、可動要素、レトロトランスポゾン−マイクロサテライト増幅多型、レトロトランスポゾンベースの挿入多型、配列特異的増幅多型、及び遺伝性の後成的修飾(例えばDNAメチル化)を含む。原因遺伝子変異体はまた、密接に関連する原因遺伝子変異体のセットであり得る。幾つかの原因遺伝子変異体は、RNAポリヌクレオチドにおける配列の変形として影響を及ぼす場合もある。このレベルで、幾つかの原因遺伝子変異体は、一種のRNAポリヌクレオチドの有無によっても示される。また、幾つかの原因遺伝子変異体はタンパク質ポリペプチドにおける配列の変形を結果としてもたらす。多数の原因遺伝子変異体が報告されている。SNPである原因遺伝子変異体の一例は、鎌状赤血球貧血を引き起こすヘモグロビンのHb S変異体である。DIPである原因遺伝子変異体の一例は、嚢胞性繊維症を引き起こすCFTR遺伝子のデルタ508突然変異である。CNVである原因遺伝子変異体の一例は、ダウン症候群を引き起こすトリソミー21である。STRである原因遺伝子変異体の一例は。ハンチントン病を引き起こすタンデム反復である。原因遺伝子変異体及びそれらが関連する疾患の非限定的な例は、表1で提供される。原因遺伝子変異体の追加の非限定的な例はWO2014015084に記載される。突然変異が疾患に関連付けられ、且つ配列変異体が本開示の方法に従い検出され得る、遺伝子の更なる例は、表2で提供される。
幾つかの実施形態において、方法は更に、検出された原因遺伝子変異体に関連付けられる疾患を抱える被験体を診断すること、或いは患者がそのような疾患を抱える又は進行させる可能性を報告することなど、コール工程に基づいて被験体を診断する工程を含む。疾患、関連する遺伝子、及び関連する配列変異体の例は本明細書で提供される。幾つかの実施形態において、結果は、本明細書に記載されるような報告書作成装置を介して報告される。
幾つかの実施形態において、1つ以上の原因遺伝子変異体は、癌、或いは特定の特徴(例えば転移可能性、薬物耐性、薬物反応性)を持つ癌の、特定のタイプ或いは段階に関連付けられる配列変異体である。幾つかの実施形態において、本開示は、特定の突然変異が患者の結果に関連付けられると知られるものなど、予後の判定のための方法を提供する。例えば、ctDNAは、従来の癌抗原53(CA−53)及び循環腫瘍細胞の一覧よりも優れた、乳癌に関するバイオマーカーであると示されている(例えばDawson, et al., N Engl J Med 368:1199 (20 13)を参照)。加えて、本開示の方法は、治療上の決定、ガイダンス、及びモニタリングの他、癌治療の進行及び臨床試験において使用することができる。例えば、処置効果は、分子標的療法(単クローン薬物)、化学療法薬、放射プロトコルなど、或いはこれらの組み合わせなどの特定の治療による処置の前、間、及び後からの患者のctDNAサンプルを比較することによってモニタリングすることができる。例えば、ctDNAは、患者の症状を追跡するモニターの方法によってもたらされるよりも遥かに短い期間で医師が処置を改変(例えば、処置を継続、停止、又は変更)することを可能にする処置後に、特定の突然変異が増加するか又は減少するかどうか、新たな突然変異が現れるかどうかなどを確かめるのにモニタリングすることができる。幾つかの実施形態において、方法は更に、検出された配列変異体に関連付けられる特定の段階又はタイプの癌を抱える被験体を診断すること、或いは患者がそのような癌を抱える又は進行させる可能性を報告することなど、コール工程に基づいて被験体を診断する工程を含む。
例えば、分子マーカー(例えばハーセプチン及びher2/neu状態)に基づいて患者に特異的に標的とされる治療のために、患者は、特定の突然変異が腫瘍に存在するかどうかを見出すために試験され、このような突然変異は、治療に対する反応又は耐性を予測し、且つ治療を用いるかどうかの決定を導くために使用され得る。それ故、処置中にctDNAを検出及びモニタリングすることは、処置の選択を導く際に非常に有用であり得る。幾つかの第1(処置前)又は第2(処置後)の癌突然変異は、幾つかの治療に対する癌の耐性に起因する事がわかっている(Misale et al., Nature 486(7404):532 (2012))。
診断、予後、又は処置の決定に有用かもしれない癌の1つ以上の種類に関連付けられる様々な配列変異体が知られている。
本開示の方法での使用を見出す腫瘍学的有意性の適切な標的配列は、限定されないが、TP53遺伝子、ALK遺伝子、KRAS遺伝子、PIK3CA遺伝子、BRAF遺伝子、EGFR遺伝子、及びKIT遺伝子における改変を含む。特異的に増幅され、及び/又は配列変異体のために特異的に分析され得る標的配列は、癌に関連する遺伝子の全て又は一部であり得る。幾つかの実施形態において、1つ以上の配列変異体はTP53遺伝子において同定される。TP53はヒト癌における最も頻繁に変異した遺伝子の1つであり、例えば、TP53突然変異は、卵巣癌の45%、大腸癌の43%、及び上気道消化管の癌の42%に見出される(例えば、M. Olivier, et, al. TP53Mutations in Human Cancers: Origins, Consequences, and Clinical Use. Cold Spring Harb Perspect Biol. 2010 January; 2(1)を参照)。TP53の突然変異状態の特性付けは、臨床診断を補助し、予後の値を提供し、癌患者の処置に影響を及ぼし得る。例えば、TP53突然変異は、グリア細胞由来のCNS腫瘍における患者に関する予後不良の予測因子、及び慢性リンパ性白血病の患者の急速な疾患進行の予言者として使用されてもよい(例えば、McLendon RE, et al. Cancer.2005 Oct 15; 1 04(8): 1693−9; Dicker F, et al. Leukemia. 2009 Jan;23(1):117−24を参照)。配列の変形が、遺伝子内のあらゆる場所に生じ得る。故に、TP53遺伝子の全て又は一部は本明細書中で評価され得る。即ち、本明細書のあらゆる場所に記載されるように、標的特異的成分(例えば標的特異的プライマー)が使用されると、複数のTP53特異的配列は、例えば、選択された標的のために使用され得るような単に1つ以上の選択されたサブ配列(突然変異の「ホットスポット」など)ではなく、遺伝子に及ぶ断片を増幅且つ検出するために使用することができる。代替的に、1つ以上の選択されたサブ配列の上流又は下流をハイブリダイズする、標的特異的プライマーが設計されてもよい(用語「ホットスポット」により含まれる、被験体の分類のなかの突然変異の割合の増加に関連付けられるヌクレオチド又はヌクレオチド領域など)。そのようなサブ配列に及ぶ標準プライマーが設計され、及び/又は、そのようなサブ配列の上流又は下流をハイブリダイズするB2Bプライマーが設計されてもよい。
幾つかの実施形態において、1つ以上の配列変異体はALK遺伝子の全て又は一部において同定される。ALK融合は、肺腫瘍の7%もの数において報告され、その幾つかは、EGFRチロシンキナーゼ阻害剤(TKI)耐性に関連付けられる(例えば、Shaw et al., J Clin Oncol. Sep 10, 2009; 27(26): 4247−4253を参照)。最大2013の、ALKチロシンキナーゼドメイン全体にわたる様々な異なる点突然変異が、ALKチロシンキナーゼ阻害剤(TKI)に対する第2の耐性を持つ患者において見出されている(Katayama R 2012 Sci Transl Med. 2012 Feb 8;4(120))。故に、ALK遺伝子における突然変異検出は、癌治療の決定を補助するために使用することができる。
幾つかの実施形態において、1つ以上の配列変異体はKRAS遺伝子の全て又は一部において同定される。肺腺癌患者のおよそ15−25%、及び大腸癌患者の40%が、腫瘍に関連するKRAS突然変異を抱えると報告されている(例えばNeuman 2009, Pathol Res Pract. 2009;205(12):858−62を参照)。突然変異の大半は、KRAS遺伝子のコドン12、13、及び61に位置する。これら突然変異は、腫瘍細胞の成長と増殖を引き起こすKRASシグナル伝達経路を活性化する。一部の研究は、KRASの突然変異を抱える腫瘍を持つ患者が抗EGFR抗体療法単独、或いは化学療法と組み合わせて恐らく利益を得ることを示す(例えば、Amado et al. 2008 J Clin On col. 2008 Apr 1 ;26( 1 0): 1626−34, Bokemeyer et al. 2009 J Clin Oncol. 2009 Feb 10;27(5):663−71を参照)。配列変異体を同定するために標的とされ得る配列の変形のための1つの特定の「ホットスポット」は、遺伝子の位置35にある。KRAS配列変異体の同定は、大腸癌被験体のための処置選択などの処置選択において使用することができる。
幾つかの実施形態において、1つ以上の配列変異体はPIK3CA遺伝子の全て又は一部において同定される。PIK3CAの体細胞突然変異は頻繁に、様々なタイプの癌、例えば大腸癌の10−30%において見出されている(例えばSamuels et al. 2004 Science. 2004 Apr 23;304(5670):554.を参照)。これら突然変異は最も一般的に、エクソン9(螺旋状ドメイン)及びエクソン20(キナーゼドメイン)内の2つの「ホットスポット」領域内にあり、これらは検出配列変異体のための増幅及び/又は分析のために特異的に標的とされ得る。位置3140も特異的に標的とされ得る。
幾つかの実施形態において、1つ以上の配列変異体はBRAF遺伝子の全て又は一部において同定される。全ての悪性黒色腫の約50%が、BRAFの体細胞突然変異を抱えると報告されている(例えば、Maldonado et al., J Natl Cancer Inst. 2003 Dec 17;95(24):1878−90を参照)。BRAF突然変異は全ての黒色腫性の亜型で発見されたが、慢性の太陽により誘発される損傷を伴わない皮膚に由来した黒色腫において最も頻繁に見出された。黒色腫における最も共通のBRAF突然変異は、グルタミンを伴う位置600でバリンを置換する、ミスセンス突然変異V600Eである。BRAF V600E突然変異はBRAF阻害剤治療の臨床効果に関連付けられる。BRAF突然変異の検出は、黒色腫の処置の選択、及び標的療法に対する耐性の研究に使用することができる。
幾つかの実施形態において、1つ以上の配列変異体はEGFR遺伝子の全て又は一部において同定される。EGFR突然変異は頻繁に、非小細胞肺癌に関連付けられる(米国では約10%、東アジアでは35%;例えば、Pao et al., Proc Natl Acad Sci US A. 2004 Sep 7;101(36):13306−11を参照)。これら突然変異は典型的にEGFRエクソン18−21内で生じ、通常はヘテロ接合である。これら突然変異のおよそ90%は、エクソン19欠失又はエクソン21 L858R点突然変異である。
幾つかの実施形態において、1つ以上の配列変異体はKIT遺伝子の全て又は一部において同定される。消化管間質腫瘍(GIST)の約85%が、KIT突然変異を抱えると報告されている(例えばHeinrich et al. 2003 J Clin Oncol. 2003 Dec I ;21 (23):4342−9を参照)。KIT突然変異の大部分は、膜近傍ドメイン(エクソン11、70%)、細胞外二量化モチーフ(エクソン9、10−15%)、チロシンキナーゼ、I(TKI)ドメイン(エクソン13、1−3%)、及びチロシンキナーゼ2(TK2)ドメイン並びに活性化ループ(エクソン17、1−3%)に見出される。第2のKIT突然変異は一般に、標的の治療薬であるイマチニブの後、及び患者が治療に対する耐性を発達させた後に同定される。
癌に関連付けられる遺伝子、本明細書に記載される方法に従い配列変異体について分析され得るその全て又は一部の更なる非限定的な例は、限定されないが、PTEN;ATM;ATR;EGFR;ERBB2;ERBB3;ERBB4;Notch1;Notch2;Notch3;Notch4;AKT;AKT2;AKT3;HIF;HIF1a;HIF3a;Met;HRG;Bcl2;PPARα;PPARγ;WT1(ウィルムス腫瘍);FGF受容体ファミリーメンバー(5つのメンバー:1、2、3、4、5);CDKN2a;APC;RB(網膜芽細胞腫);MEN1;VHL;BRCA1;BRCA2;AR;(アンドロゲン受容体);TSG101;IGF;IGF受容体;Igf1(4つの変異体);Igf2(3つの変異体);Igf 1受容体;Igf 2受容体;Bax;Bcl2;カスパーゼファミリー(9つのメンバー:1、2、3、4、6、7、8、9、12);Kras;及びApcを含む。更なる例が本明細書のあらゆる場所で提供される。本明細書に開示される方法に従って1つ以上の配列変異体をコールすることに基づいて診断され得る癌の例は、限定されないが、棘細胞腫、腺房細胞腫、聴神経腫、末端性黒子性黒色腫、先端汗腺、急性好酸球性白血病、急性リンパ芽球性白血病、急性巨核芽球性白血病、急性単球性白血病、成熟による急性骨髄芽球白血病、急性骨髄性樹状細胞白血病、急性骨髄性白血病、急性前骨髄球性白血病、アダマンチノーム、腺癌、腺様嚢胞癌、腺腫、腺様歯原性腫瘍、副腎皮質癌、成人T細胞白血病、侵襲性NK細胞白血病、AIDS関連性癌、AIDS関連性リンパ腫、胞巣状軟部肉腫、エナメル芽細胞線維腫、肛門癌、未分化大細胞リンパ腫、組織非形成性甲状腺癌、血管免疫芽球性T細胞リンパ腫、血管筋脂肪腫、血管肉腫、虫垂癌、星細胞腫、非定型奇形腫様ラブドイド腫瘍、基底細胞癌、基底様癌、B細胞白血病、B細胞リンパ腫、ベリニ管癌、胆道癌、膀胱癌、芽細胞腫、骨癌、骨腫瘍、脳幹神経膠腫、脳腫瘍、乳癌、ブレンナー腫瘍、気管支腫瘍、細気管支肺胞上皮癌、褐色腫、バーキットリンパ腫、原発部位不明の癌、カルチノイド腫瘍、癌腫、上皮内癌、陰茎癌腫、原発部位不明の癌腫、癌肉腫、カストルマン病、中枢神経系胚芽腫、小脳星状細胞腫、大脳星細胞腫、子宮頚癌、肝内胆管癌、軟骨腫、軟骨肉腫、脊索腫、絨毛癌、脈絡叢乳頭腫、慢性リンパ性白血病、慢性単球性白血病、慢性骨髄性白血病細胞、慢性骨髄増殖性疾患、慢性好中球性白血病、明細胞腫瘍、結腸癌、大腸癌、頭蓋咽頭腫、皮膚T細胞リンパ腫、デゴス病、隆起性皮膚線維肉腫、類皮嚢胞、線維形成性小円形細胞腫瘍、びまん性大細胞型B細胞リンパ腫、胚芽異形成性神経上皮腫瘍、胎児性癌、内胚葉洞腫瘍、子宮内膜癌、子宮内膜子宮癌、子宮内膜性腫瘍、腸疾患関連性T細胞性リンパ腫、上衣芽細胞腫、上衣腫、類上皮肉腫、赤白血病、食道癌、感覚神経芽腫、腫瘍のユーイングファミリー、ユーイングファミリー肉腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管癌、乳腺外ページェット病、ファロピウス管癌、封入奇形胎児、繊維腫、繊維肉腫、濾胞性リンパ腫、濾胞性甲状腺癌、胆嚢癌、胆嚢癌、神経細胞神経膠腫、節神経腫、胃癌、胃リンパ腫、消化器系癌、消化管カルチノイド腫瘍、消化管間質腫瘍、消化管間質腫瘍、胚細胞腫瘍、胚細胞腫、妊娠性絨毛癌、妊娠性絨毛腫瘍、骨巨細胞腫、多形神経膠芽腫、神経膠腫、神経膠腫症、グロムス腫瘍、グルカゴノーマ、性腺芽細胞腫、顆粒膜細胞腫、ヘアリー細胞白血病、ヘアリー細胞白血病、頭頚部癌、頭頚部癌、心臓癌、血管芽細胞腫、血管周皮腫、血管肉腫、血液学的悪性腫瘍、肝細胞癌、肝脾T細胞リンパ腫、遺伝性乳房卵巣癌症候群、ホジキンリンパ腫、ホジキンリンパ腫、下咽頭癌、視床下部神経膠腫、炎症性乳癌、眼球内黒色腫、島細胞癌、島細胞腫、若年性骨髄単球性白血病、カポジ肉腫、カポジ肉腫、腎臓癌、クラッツキン腫瘍、クルッケンベルク腫瘍、喉頭癌、喉頭癌、悪性黒子型黒色腫、白血病、白血病、口唇癌及び口腔癌、脂肪肉腫、肺癌、黄体腫、リンパ管腫、リンパ管肉腫、リンパ上皮腫、リンパ性白血病、リンパ腫、マクログロブリン血症、悪性線維性組織球腫、悪性線維性組織球腫、骨悪性線維性組織球腫、悪性神経膠腫、悪性中皮腫、悪性末梢神経鞘腫瘍、悪性ラブドイド腫瘍、悪性トリトン腫瘍、MALTリンパ腫、マントル細胞リンパ腫、マスト細胞白血病、縦隔胚細胞腫瘍、縦隔腫瘍、骨髄甲状腺癌、髄芽腫、髄芽腫、髄様上皮腫、黒色腫、黒色腫、髄膜腫、メルケル細胞腫、中皮腫、中皮腫、原発不明の転移性頸部扁平上皮癌、転移性尿路上皮癌、ミュラー管混合腫瘍、単球性白血病、口腔癌、ムチン性腫瘍、多発性内分泌腫瘍症候群、多発性骨髄腫、多発性骨髄腫、菌状息肉腫、菌状息肉腫、骨髄異形成疾患、骨髄異形成症候群、骨髄性白血病、骨髄性肉腫、骨髄増殖性疾患、粘液腫、鼻腔癌、上咽頭癌、上咽頭癌、新生物、ノイリノーマ、神経芽細胞腫、神経芽細胞腫、神経繊維腫、神経腫、結節型黒色腫、非ホジキンリンパ腫、非ホジキンリンパ腫、非黒色腫性皮膚癌、非小細胞肺癌、眼腫瘍、乏突起星細胞腫、乏突起神経膠腫、膨大細胞腫、視神経鞘髄膜腫、口腔癌、口腔癌、口腔咽頭癌、骨肉腫、骨肉腫、卵巣癌、卵巣癌、卵巣上皮癌、卵巣性胚細胞腫瘍、低悪性度卵巣癌、乳房のパジェット病、パンコースト腫瘍、膵臓癌、膵臓癌、乳頭状甲状腺癌、乳頭腫症、傍神経節腫、副鼻腔癌、副甲状腺癌、陰茎癌、血管周囲類上皮細胞腫瘍、咽頭癌、クロム親和性細胞腫、中間型松果体実質腫瘍、松果体芽腫、下垂体細胞腫、下垂体腺腫、下垂体腫瘍、形質細胞腫瘍、胸膜肺芽腫、多胚腫、前駆体T−リンパ芽球性リンパ腫、原発性中枢神経系リンパ腫、原発性滲出性リンパ腫、原発性肝細胞性癌、原発性肝臓癌、原発性腹膜癌、原始神経上皮腫瘍、前立腺癌、腹膜偽性粘液腫、直腸癌、腎細胞癌、染色体15上のNUT遺伝子に関与する気道癌腫、網膜芽細胞腫、横紋筋腫、横紋筋肉腫、リヒター形質転換、仙尾部奇形腫、唾液腺癌、肉腫、神経鞘腫症、脂腺癌、続発性新生物、精上皮腫、漿液性腫瘍、セルトリ−ライディッヒ細胞腫、性器索間質腫瘍、セザリー症候群、シグネット環細胞癌、皮膚癌、小円形青色細胞腫瘍、小細胞癌、小細胞肺癌、小細胞リンパ腫、小腸癌、軟部組織肉腫、ソマトスタチン産生腫瘍、煤煙性疣贅、脊髄腫瘍、脊椎腫瘍、脾辺縁帯リンパ腫、扁平上皮癌、胃癌、表在拡大型黒色腫、テント上原始神経上皮腫瘍、表層上皮性間質性腫瘍、滑膜肉腫、T細胞急性リンパ芽球性白血病、T細胞大顆粒リンパ球白血病、T細胞白血病、T細胞性リンパ腫、T細胞前リンパ球性白血病、奇形腫、末梢リンパ腺癌(Terminal lymphatic cancer)、精巣癌、莢膜腫、喉頭癌、胸腺癌、胸腺腫、甲状腺癌、腎盂及び尿管の移行性細胞癌、移行上皮癌、尿膜管癌、尿管癌、泌尿生殖器腫瘍、子宮肉腫、ブドウ膜黒色腫、膣癌、ヴァーナー−モリソン症候群、疣状癌、視神経膠腫、外陰癌、ヴァルデンストレームマクログロブリン血症、ワルチン腫瘍、ウィルムス腫瘍、及びそれらの組み合わせを含む。癌に関連付けられる特定の配列変異体の非限定的な例は表3で提供される。
加えて、本明細書に開示される方法及び組成物は、1つ以上の癌のタイプ、段階、又は癌の特徴に関連付けられる新規で稀な突然変異を発見するのに有用であり得る。例えば、分析中の特徴(例えば、特定の疾患、癌のタイプ、癌の段階など)を共有する個体の集団は、配列変異体又は配列変異体のタイプ(例えば、特定の遺伝子又は遺伝子の部分における突然変異)を同定するために、本開示に従う配列変異体の検出方法にさらされてもよい。特徴のない個体におけるよりも統計的に有意に大きな頻度で特徴を共有する個体の群の中に生じると同定される配列変異体は、その特徴とのある程度の関連性を割り当てられる場合もある。そのように同定された配列変異体又は配列変異体のタイプはその後、それらを抱えると発見された個体を診断又は処置する際に使用されるかもしれない。
他の治療用途は、非侵襲性の胎児の診断法における使用を含む。胎児のDNAは妊婦の血液中で見つけることができる。本明細書に記載される方法及び組成物は、循環胎児DNAにおける配列変異体を同定するために使用することができ、故に、1つ以上の原因遺伝子変異体に関連付けられるものなど、胎児における1つ以上の遺伝病を診断するために使用されてもよい。原因遺伝子変異体の非限定的な例は本明細書に記載されており、三染色体性、嚢胞性繊維症、鎌状赤血球貧血、及びテイ−サックス病が挙げられる。本実施形態において、母親は、比較のために使用される対照サンプル及び血液サンプルを提供してもよい。対照サンプルは適切な組織であり、典型的には細胞内DNAを抽出するためのプロセスであり、これは後に参照配列を提供するために配列決定され得る。その後、胎児のゲノムDNAに対応するcfDNAの配列は、母親の参照に対する配列変異体として同定することができる。父親も、胎児の配列、及び配列変異体の同定を補助するために参照サンプルを提供してもよい。
また更なる治療用途は、情報が診断及び処置方法の選択を通知し得る、病原体(例えば細菌、ウイルス、真菌、及び微生物)などからの外因性ポリヌクレオチドの検出を含む。例えば、幾つかのHIV亜型は、薬物耐性に相関する(例えばhivdb.stanford.edu/pages/genotype−rxを参照)。同様に、HCVの分類、細分類、及びアイソタイプ突然変異も本開示の方法及び組成物を使用して行うことができる。更に、HPV亜型が子宮頚癌のリスクと相関される場合、そのような診断は更に癌のリスクの評価を通知する。更に、検出され得るウイルスの非限定的な例は、ヘパドナウイルス科B型肝炎ウイルス(HBV)、ウッドチャック肝炎ウイルス、リス(ヘパドナウイルス科)肝炎ウイルス、アヒルB型肝炎ウイルス、アオサギB型肝炎ウイルス、ヘルペスウイルス単純疱疹ウイルス(HSV)1型及び2型、水痘−帯状疱疹ウイルス、サイトメガロウイルス(CMV)、ヒト−サイトメガロウイルス(HCMV)、マウス−サイトメガロウイルス(MCMV)、モルモット−サイトメガロウイルス(GPCMV)、エプスタイン−バーウイルス(EBV)、ヒト−ヘルペスウイルス6(HHV変異体A及びB)、ヒト−ヘルペスウイルス7(HHV−7)、ヒト−ヘルペスウイルス8(HHV−8)、カポジ肉腫関連ヘルペスウイルス(KSHV)、Bウイルス・ポックスウイルス・ワクシニアウイルス、痘瘡ウイルス、天然痘ウイルス、サル痘ウイルス、牛痘ウイルス、ラクダ痘ウイルス、エクトロメリアウイルス、マウス痘ウイルス、ウサギ痘ウイルス、アライグマ痘ウイルス、伝染性軟属腫ウイルス、オルフウイルス、ミルカー結節ウイルス、ウシ丘疹性口内炎ウイルス、ヒツジ痘ウイルス、ヤギ痘ウイルス、ランピースキン病ウイルス、鶏痘ウイルス、カナリア痘ウイルス、鳩痘ウイルス、スズメ痘ウイルス、粘液腫ウイルス、野兎線維腫ウイルス、ウサギ線維腫ウイルス、リス線維腫ウイルス、豚痘ウイルス、タナ痘ウイルス、ヤナ痘ウイルス、フラビウイルス、デングウイルス、C型肝炎ウイルス(HCV)、GB肝炎ウイルス(GBV−A、GBV−B、及びGBV−C)、西ナイルウイルス、黄熱ウイルス、セントルイス脳炎ウイルス、日本脳炎ウイルス、ポワサンウイルス、ダニ媒介性脳炎ウイルス、キャサヌール森林病ウイルス、トガウイルス、ベネズエラウマ脳炎(VEE)ウイルス、チクングンヤウイルス、ロスリバーウイルス、マヤロウイルス、シンドビスウイルス、風疹ウイルス、レトロウイルス、ヒト免疫不全ウイルス(HIV)1型及び2型、ヒトT細胞白血球ウイルス(HTLV)1、2、及び5型、マウス乳腺腫瘍ウイルス(MMTV)、ラウス肉腫ウイルス(RSV)、レンチウイルス、コロナウイルス、重症急性呼吸器症候群(SARS)ウイルス、フィロウイルス、エボラウイルス、マールブルグウイルス、ヒトメタニューモウイルス(HMPV)などのメタニューモウイルス(MPV)、ラブドウイルス、狂犬病ウイルス、水疱性口内炎ウイルス、ブンヤウイルス、クリミア・コンゴ出血熱ウイルス、リフトバレー熱ウイルス、ラクロスウイルス、ハンタウイルス、オルソミクソウイルス、インフルエンザウイルス(A、B、及びC型)、パラミクソウイルス、パラインフルエンザウイルス(PIV1、2、及び3型)、呼吸系発疹ウイルス(A及びB型)、麻疹ウイルス、ムンプスウイルス、アレナウイルス属、リンパ球脈絡髄膜炎ウイルス、フニンウイルス、マクポウイルス、グアナリトウイルス、ラッサ熱ウイルス、Ampariウイルス、Flexalウイルス、イッピーウイルス、Mobalaウイルス、モペイアウイルス、ラチノウイルス、パラナウイルス、ピキンデウイルス、プンタトロウイルス(PTV)、タカリベウイルス、及びタミアミウイルスを含む。
本開示の方法によって検出され得る病原菌の例、病原菌の特定の例は、限定されないが、アシネトバクター・バウマンニ、アクチナバチルスsp.、放線菌、アクチノミセスsp.(イスラエル放線菌及びネスルンド放線菌など)、エロモナスsp.、(エロモナス・ハイドロフィラ、エロモナス・ベロニ次亜種ソブリア(エロモナス・ソブリア)、及びエロモナス・キャビエなど)、アナプラズマ・ファゴサイトフィルム、アクロモバクター・キシロソキシダンス、アシネトバクター・バウマニ、アクチノバシラス・アクチノミセテムコミタンス、バチルスsp.(バシラス・アンスラシス、バチルス・セレウス、バチルス・スブチリス、バチルス・スリンギエンシス、及びバチルス・ステアロテルモフィルスなど)、バクテロイデスsp.(バクテロイデス・フラジリスなど)、バルトネラsp.(バルトネラ・バシリホルミス及びバルトネラ・ヘンセラなど)、ビフィドバクテリウムsp.、ボルデテラsp.(ボルデテラ・パータッシス、ボルデテラ・パラパータシス、及びボルデテラ・ブロンキセプチカなど)、ボレリアsp.(回帰熱ボレリア及びボレリア・ブルグドルフェリなど)、ブルセラsp.(ブルセラ・アボルタス、ブルセラ・カニス、ブブルセラ・メリテンシス、及びブルセラ・スイスなど)、バークホルデリアsp.(バークホルデリア・シュードマレイ及びバークホルデリア・セパシアなど)、カンピロバクターsp.(カンピロバクター・ジェジュニ、カンピロバクター・コリ、カンピロバクター・ラリ、及びカンピロバクター・フィタスなど)、カプノシトファガsp.、カルジオバクテリウム・ホミニス、クラミジア・トラコマーティス、クラミドフィラ・ニューモニエ、クラミドフィラ・シタッシ、シトロバクターsp.、コクシエラ・ブルネッティ、コリネバクテリウムsp.(コリネバクテリウム・ジフテリエ、コリネバクテリウム・ジェイケウム、及びコリネバクテリウムなど)、クロストリジウムsp.(クロストリジウム・パーフリンジェンス、クロストリジウム・ディフィシレ、クロストリディウム・ボツリナム、及びクロストリジウム・テタニなど)、エイケネラ・コローデンス、エンテロバクターsp.(エンテロバクター・エロゲネス、エンテロバクター・アグロメランス、エンテロバクター・クロアカエ、及び、日和見性大腸菌、腸内毒素原性大腸菌、腸管侵入性大腸菌、病原大腸菌、腸管出血性大腸菌、腸管凝集性大腸菌、並びに尿路疾患性大腸菌を含む大腸菌など)、エンテロコッカスsp.(エンテロコッカス・フェカーリス及びエンテロコッカス・フェシウムなど)、エーリキアsp.(エーリキア・シャフェンシス及びエーリキア・カニスなど)、ブタ丹毒菌、ユーバクテリウムsp.、フランシセラ・ツラレンシス、フソバクテリウム・ヌクレアトゥム、ガードネレラ・バギナリス、ゲメラ・モルビロルム、ヘモフィルスsp.、(ヘモフィルス・インフルエンザエ、ヘモフィルス・デュクレイ、ヘモフィルス・エジプチウス、ヘモフィルス・パラインフルエンザ、ヘモフィルス・ヘモリチカス、及びヘモフィルス・パラヘモリティクス)、ヘリコバクターsp.(ヘリコバクター・ピロリ、ヘリコバクター・シネディ、及びヘリコバクター・フェネリエなど)、キンゲラ・キンギイ、クレブシェラsp.(クレブシエラ・ニューモニエ、クレブシエラ・グラニュロマティス、及びクレブシエラ・オキシトカなど)、ラクトバチルスsp.、リステリア・モノサイトゲネス、レプトスピラ・インターロガンス、レジュネラ・ニューモフィラ、レプトスピラ・インターロガンス、ペプトストレプトコッカスsp.、モラクセラ・カタラーリス、モルガネラsp.、モビルンカスsp.、ミクロコッカスsp.、マイコバクテリウムsp.(らい菌、マイコバクテリウム・ツベルクローシス、マイコバクテリウム・イントラセルラーレ、マイコバクテリウム・アビウム、マイコバクテリウム・ボビス、及びマイコバクテリウム・マリヌムなど)、マイコプラズマsp.(マイコプラズマ・ニューモニエ、マイコプラズマ・ホミニス、及びマイコプラズマ・ゲニタリウムなど)、ノカルジアsp.(ノカルジア・アステロイデス、ノカルジア・シリアシゲオルジカ、及びノカルジア・ブラジリエンシスなど)、ナイセリアsp.(ナイセリア・ゴノレア及びナイセリア・メニンギティディスなど)、パスツレラ・マルトシダ、プレジオモナス・シゲロイデス、プレボテラsp.、ポルフィロモナスsp.、プレボテラ・メラニノゲニカ、プロテウスsp.(プロテウス・ブルガリス及びプロテウス・ミラビリスなど)、プロビデンシアsp.(プロビデンシア・アルカリファシエンス、プロビデンシア・レットゲリ、及びプロビデンシア・スチュアルティイなど)、シュードモナス・エルジノーサ、プロピオニバクテリウム・アクネス、ロドコッカス・エクイ、リケッチアsp.(リケッチア・リケッチイ、リケッチア・アカリ及びリケッチア・プロワツェキイ、オリエンティア・ツツガムシ(以前は:リケッチア・ツツガムシ)及びリケッチア・チフィ)、ロドコッカスsp、セラチア・マルセスセンス、ステノトロホモナス・マルトフィリア、サルモネラsp.(サルモネラ・エンテリカ、サルモネラ・チフィ、サルモネラ・パラチフィ、サルモネラ・エンテリティディス、サルモネラ・コレレスイス、及びサルモネラ・ティフィムリウムなど)、セラチアsp.(セラチア・マルセセンス及びセラチア・リクファシエンスなど)、シゲラsp.(志賀赤痢菌、シゲラ・フレックスネリ、シゲラ・ボイディ、及びシゲラ・ソネイなど)、スタフィロコッカスsp.(スタフィロコッカス・アウレウス、スタフィロコッカス・エピデルミデス、スタフィロコッカス・ヘモリチカス、スタフィロコッカス−サプロフィティクスなどの)、連鎖球菌sp.(ストレプトコッカス・ニューモニエ(例えば、クロラムフェニコール耐性セロタイプ4肺炎連鎖球菌、スペクチノマイシン耐性セロタイプ6B肺炎連鎖球菌、ストレプトマイシン耐性セロタイプ9V肺炎連鎖球菌、エリスロマイシン耐性セロタイプ14肺炎連鎖球菌、オプトヒン耐性セロタイプ14肺炎連鎖球菌、リファンピシン耐性セロタイプ18C肺炎連鎖球菌、テトラサイクリン耐性セロタイプ19F肺炎連鎖球菌、ペニシリン耐性セロタイプ19F肺炎連鎖球菌、及びトリメトプリム耐性セロタイプ23F肺炎連鎖球菌、クロラムフェニコール耐性セロタイプ4肺炎連鎖球菌、スペクチノマイシン耐性セロタイプ6B肺炎連鎖球菌、ストレプトマイシン耐性セロタイプ9V肺炎連鎖球菌、オプトヒン耐性セロタイプ14肺炎連鎖球菌、リファンピシン耐性セロタイプ18C肺炎連鎖球菌、ペニシリン耐性セロタイプ19F肺炎連鎖球菌、又はトリメトプリム耐性セロタイプ23F肺炎連鎖球菌)、ストレプトコッカス・アガラクティエ、ストレプトコッカス・ミュータンス、ストレプトコッカス・ピオゲネス、A群溶連菌、ストレプトコッカス・ピオゲネス、B群溶連菌、ストレプトコッカス・アガラクティエ、C群溶連菌、ストレプトコッカス・アンギノスス、ストレプトコッカス・エキシミリス、D群溶連菌、ストレプトコッカス・ボビス、F群溶連菌、及びストレプトコッカス・アンギノスス、G群溶連菌など)、鼠咬症スピリルム、ストレプトバチルス・モニリホルム、トレポネーマsp.(ピンタフランベンジア、トレポネーマ・ペルテニュ、梅毒トレポネーマ、及びトレポネーマ・エンデミカムなど)、トロフェリマ・ホウィップリ、ウレアプラズマ・ウレアリチカム、ベイヨネラsp.、ビブリオsp.(ビブリオ・コレラエ、ビブリオ・パラヘモリチカス、ビブリオ・バルニフィカス、ビブリオ・パラヘモリチカス、ビブリオ・バルニフィカス、ビブリオ・アルギノリチカス、ビブリオ・ミミカス、ビブリオ・ホリセ、ビブリオ・フルビアリス、ビブリオ・メチニコフィイ、ビブリオ・ダムセラ、及びビブリオ・ファーニシイ)、エルジニアsp.(エルシニア・エンテロコリチカ、エルシニア・ペスチス、及びエルシニア・シュードツベルクローシスなど)、及びザントモナス・マルトフィリアなどの1つ以上(或いはそれらの組み合わせ)を含む。
幾つかの実施形態において、本開示の方法及び組成物は臓器移植レシピエントをモニタリング際に使用される。典型的に、ドナー細胞からのポリヌクレオチドは、受容細胞からのポリヌクレオチドのバックグラウンドにおける循環に見出される。ドナー循環DNAのレベルは通常、臓器が十分に受け入れられた場合に安定し、ドナーDNA(例えば、与えられたサンプルにおける頻度として)の急速な増加は、移植拒絶反応の初期兆候として使用することができる。処置は移植の失敗を予防するためにこの段階で与えることができる。ドナー臓器の拒絶は血液中のドナーDNAの増加を結果としてもたらすと示されている;Snyder et al., PNAS 108(15):6629 (2011)を参照。本開示は、この分野における以前の技術にわたって著しい感度の改善を提供する。本実施形態において、レシピエント対照サンプル(例えば口腔粘膜検体採取物など)及びドナー対照サンプルは、比較のために使用することができる。レシピエントサンプルはその参照配列を提供するために使用することができ、一方でドナーのゲノムに対応する配列はその参照に対する配列変異体として同定することができる。モニタリングは、一定期間にわたりレシピエントからサンプル(例えば血液サンプル)を得る工程を含み得る。初期のサンプル(例えば最初の数週間以内)はドナーcfDNAの分画のためのベースラインを確立するために使用することができる。後のサンプルはベースラインと比較することができる。幾つかの実施形態において、約、又は少なくとも約10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、100%、250%、500%、1000%、又はそれ以上のドナーcfDNAの分画の増加は、レシピエントがドナー組織を反映するプロセスにいることの指標として役立ち得る。
幾つかの実施形態において、検出の方法が提供される。
以下の例は、本発明の様々な実施形態を例証する目的で与えられ、いかなるやり方でも本発明を制限することを意図していない。本明細書に記載される方法とともに、本実施例は、好ましい実施形態の代表例である且つ典型的なものであり、本発明の範囲を限定するものとして意図されない。請求項の範囲によって定義される本発明の精神内に包含されるその変化および他の使用が、当業者に想定される。
実施例1:突然変異検出のための縦列反復の配列決定ライブラリの調製
12μLの水の中の>10ngの〜150bp DNA断片或いは10mMのTris−HCl pH8.0から始めて、2μLの10X CircLigase緩衝液混合物を加え、混合物を2分かけて95℃に加熱し、5分間氷の上で冷やした。これに、4μLの5Mベタイン、1μLの50mM MnCl2、及び1μLのCircLigase IIを加えた。反応物を少なくとも12時間、60℃でインキュベートした。次に、2μLのRCAプライマー混合物(それぞれ50nM、5nMの最終濃度まで)を加えて、混合した。混合を2分かけて95℃に加熱し、2時間かけて42℃に冷ました。CirLigation産物を、Zymoオリゴヌクレオチド精製キットにより精製した。製造者の指示に従って、28μLの水を50μLの全容積のために22μLのCircLigation産物に加えた。これを100μLのオリゴ結合緩衝液及び400μLのエタノールと混合した。これを30秒間>10,000xgで回転させ、通過画分を捨てた。750μLのDNA洗浄緩衝液を加え、次いで>10,000xgで30秒間回転させ、通過画分を捨て、全速力で更に1分間回転させた。カラムを新たなエッペンドルフ管に移し、17μLの水で溶出した(最終の溶出された容量はおよそ15μLであった)。
ローリングサークル増幅を約50μLの量で行った。15μLの溶出サンプルに、5μLの10X RepliPHI緩衝液(Epicentre)、1μLの25mM dNTPs、2μLの100mM DTT、1μLの100U/μL RepliPHI Phi29、及び26μLの水を加えた。反応混合物を30℃で1時間インキュベートした。残りの洗浄工程のために製造業者の指示に従い、80μLのAmpureビーズを加えることによりRCA産物を精製した。溶出のために、22.5μLの溶出緩衝液を加え、ビーズを65℃で5分間インキュベートした。簡単に回転させた後、管を磁石に戻した。
RCA反応からの約20μLの溶離された産物を、25μLの2X Phusion Master mix、2.5μLのDMSO、及び、0.5μLの10μM各B2Bプライマー混合物と混合させた。増幅は以下のPCRプログラムを使用した:95℃で1分間、5回のサイクルの拡大(95℃で15秒間、55℃で15秒間、72℃で1分間)、13−18回のサイクルの複製(95℃で15秒間、68℃で15秒間、72℃で1分間)、及び72℃で7分間の最終の拡大。PCR産物のサイズをE−ゲルの実行により確認した。範囲が100−500bpであった場合、0.6X Ampureビーズの精製を行い、300−500bpに富化して、小型RNAライブラリアダプタープライマーでPCRをもう1回行うために1−2ngを得た。産物のサイズ範囲が>1000bpであった場合、産物を1.6X Ampureビーズで生成し、Nextera XTアンプリコンライブラリ調製のために2−3ngを得て、0.6X Ampureビーズ精製によって400−1000bpの範囲でサイズを富化した。
配列決定データ上でバイオインフォマティクスを実行するために、FASTQファイルをMiSeqランから得た。配列を、BWAを使用して標的とされた配列(例えばKRAS及びEGFR)を含む参照ゲノム配列へと、FASTQファイルにおいて整列させた。反復単位及びその参照位置の領域と長さを、アラインメント結果を使用して各配列(両方のリード)について見出した。全ての遺伝子座における変異体を、各配列の反復単位のアラインメント結果及び情報を使用して見出した。2つのリードの結果を組み合わせた。変異体の標準化された頻度及びノイズレベルを計算した。確認された変異体からの変異体コールにおける複数のさらなる基準を適用し、これにはqスコア>30及びp値<0.0001が含まれる。これら基準を通過した、確認された変異体は、真の変異体(突然変異)として報告された。プロセスをコンピュータ言語(例えばパイソン)によって自動化することができる。
実施例2:配列変異体の検出のための縦列反復配列決定ライブラリの作成
12μLの容量において150bpの平均長さを持つ10ngのDNA断片を、縦列反復配列決定ライブラリ構築のために使用した。DNAを前もってT4ポリヌクレオチドキナーゼ(New England Biolabs)で処理し、5’末端にてリン酸基を加え、3’末端にてヒドロキシル基を残した。DNase I又は酵素断片化から生成され、或いは血清又は血漿から抽出されたDNA断片に関して、終点処理工程をスキップした。DNAを2μLの10X CircLigase緩衝液(Epicentre CL9021K)と混合した。混合物を2分かけて95℃に加熱し、5分間氷の上で冷まし、その後、4μLのベタイン、1μLの50mM MnCl2、及び1μLのCircLigase II(Epicentre CL9021K)を加えた。ライゲーション反応を少なくとも12時間、60℃で行った。200nMで1μLの各RCAプライマー混合物(10nMの最終濃度の最終まで)をライゲーション産物に加えて混合し、1分かけて96℃に加熱し、42℃に冷まし、42℃で2時間インキュベートした。
ハイブリダイズされたRCAプライマーを有するCircLigation産物を、Zymoオリゴヌクレオチド精製キット(Zymo Research, D4060)により精製した。これを行うために、21μLの産物を、28μLの水及び1μLの担体RNA(Sigma−Aldrich、R5636、1X TE緩衝液により200ng/μLで希釈)で50μLに希釈した。希釈したサンプルを、100μLのオリゴ結合緩衝液及び400μLの100%エタノールと混合した。混合物をカラムに載せ、>10,000xgで30秒間、遠心分離を行った。通過画分を捨てた。>10,000xgで30秒間遠心分離し、通過画分を捨て、且つ全速力で更に1分間遠心分離することにより、750μLのDNA洗浄緩衝液によりカラムを洗浄した。カラムを新たな1.5mLのエッペンドルフ管に移し、DNAを17μLの溶出緩衝液(10mM Tris=Cl pH8.0、最終の溶出量約15μL)で溶出した。
5μLの10X RepliPHI緩衝液、2μLの25mM dNTPs、2μLの100mM DTT、1μLの100U/μL RepliPHI Phi29、及び25μLの水(Epicentre, RH040210)を、50μLの総反応量のために、カラムからの15μLの溶出サンプルに加えた。反応混合物を30℃で2時間インキュベートした。RCA産物を、80μLのAmpure XPビーズ(Beckman Coulter, A63881)を加えることにより精製した。洗浄工程は製造業者の指示に従った。RCA産物を、22.5μL溶出緩衝液中の65℃で5分間のインキュベーションの後に溶出した。磁石に戻す前に管を簡単に遠心分離した。
RCA反応からの約20μLの溶出産物を、25μLの2X Phusion Master mix(New England Biolabs M0531S)、2.5μLの水、2.5μLのDMSO、及び0.5μLのB2Bプライマー(各々10μM)と混合した。増幅を、以下の熱循環プログラムで実行した:95℃で2分間、5回のサイクルの拡大(95℃で30秒間、55℃で15秒間、72℃で1分間)、18回のサイクルの複製(95℃で15秒間、68℃で15秒間、72℃で1分間)、及び72℃で7分間の最終の拡大。PCR産物のサイズを電気泳動によって確認した。一旦長いPCR産物が電気泳動によって確認されると、PCR産物を、精製のために30μLのAmpureビーズ(0.6X容量)と混合し、>500bpのPCR産物を富化した。精製された産物を、Qubit 2.0 Quantification Platform(Invitrogen)で定量化した。約1ngの精製DNAを、Nextera XT Ampliconライブラリ調製物(Illumina FC−131−1024)のために使用した。>500bpの挿入物サイズを持つライブラリ要素を、0.6X Ampureビーズでの精製によって富化した。
増幅されたライブラリの濃度及びサイズ分布を、Agilent DNA High Sensitivity Kit for the 2100 Bioanalyzer(Agilent Technologies Inc., Santa Clara, CA)を使用して分析した。配列決定を、2−250bpのMiSeq配列決定キットを伴うIllumina MiSeqを使用して実行した。MiSeqマニュアルに従って、12pMの変性ライブラリを配列決定ランに載せた。
この手順に対する変形において、Illuminaアダプターを、Nextera調製物の代わりにライブラリ調製物に使用した。これを行うために、約1ngの同様に精製されたDNAを、B2Bプライマーの普遍的部分及びIlluminaアダプター配列(P5及びP7;5’CAAGCAGAAGACGGCATACGA3’及び5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’)を含む1対のプライマーでのPCR増幅のために使用した。Phusion Master Mixを使用して、12回のサイクルの複製工程(95℃で30秒間、55℃で15秒間、72℃で60秒間)を行った。この増幅工程の目的はアンプリコン配列決定のためにIlluminaアダプターを加えることであった。長さ>500bpのアンプリコンを0.6X Ampureビーズにより富化した。アンプリコンライブラリの濃度及びサイズ分布を、Agilent DNA High Sensitivity Kit for the 2100 Bioanalyzer(Agilent Technologies Inc., Santa Clara, CA)を使用して分析した。配列決定を、2×250bpのMiSeq配列決定キットを伴うIllumina MiSeqを使用して実行した。B2Bプライマーの普遍的部分はまた、配列決定プライマー配列として機能し、プライマーがIllumina kitに含まれなかった場合にカスタム配列決定プライマーが加えられる。12pMの変性ライブラリを配列決定ランに載せた。
一例の分析における標的領域の被覆率を図33で例示する。下記の表6は標的領域の分析に関する結果を記載する。
表4は、本開示の方法において有用なRCAプライマーの例を提供する。表5は、本開示の方法において有用なB2Bプライマーの例を提供する。
実施例3:配列決定ライブラリ構築のためのゲノムDNAの断片形成
1μLのゲノムDNAを、製造者のプロトコルを従って、NEBNext dsDNA Fragmentaseキット(New England Biolabs)を使用して処理した。インキュベーション時間を37℃で45分に延ばした。断片化反応を、5μLの0.5M EDTA pH8.0を加えることにより止め、製造者のプロトコルに従いAmpure XPビーズ(Beckman Coulter, A63881)の2倍容量を加えることによって精製した。断片化されたDNAを、Bioanalyzer with a High Sensitivity DNA kit(Agilent)上で分析した。断片化されたDNAのサイズ範囲は典型的に約100bpから約200bpであり、ピークは約150bpであった。
実施例4:ライブラリ調製手順
この実施例では、KAPAライブラリ調製キット(KK8230)を例示目的のために使用した。
ビーズ精製に関与する工程のために、AMPure XPビーズ(cat#A63881)を室温に平衡化し、サンプルと混合する前に徹底的に再撹拌した。ボルテックス・ミキサー上でサンプルと徹底的に混合した後、これを室温で15分間インキュベートし、DNAがビーズに結合することを可能にした。その後、液体が透明になるまでビーズを磁気スタンドに置いた。その後、ビーズを200ulの80%エタノールで2回洗浄し、室温で15分間乾燥させた。
端部修復反応(end−repair reaction)を行うために、最大50μL(2−10ng)の無細胞DNAを、20μLの端部修復master mix(8μLの水、7μLの10X KAPA端部修復緩衝液、及び5μLのKAPA端部修復酵素混合物)と混合し、20℃で30分間インキュベートした。その後、120μLのAMPure XPビーズを70μL端部修復反応物に加えた。その後、サンプルを上記のように精製した。
A尾部付加反応(A−tailing reaction)を行うために、端部修復したDNA断片を含んでいる乾燥ビーズを、A尾部付加master mix(42μLの水、5μLの10X KAPA Aテーリング緩衝液、及びKAPA A尾部付加酵素)と混合した。反応混合物を30℃で30分間インキュベートした。90μLのPEG溶液(20%のPEG 8000、2.5M NaCl)を加えた後、混合物を、上記のビーズ精製プロトコルに従い洗浄した。このA尾部付加工程は、平滑末端ライゲーション反応ではスキップされた。
リンカーライゲーションのために、以下の配列を持つ2つのオリゴ(5’から3’)を使用し、アダプターポリヌクレオチド複製を形成した:/5Phos/CCATTTCATTACCTCTTTCTCCGCACCCGACATAGAT*T及び/5Phos/ATCTATGTCGGGTGCGGAGAAAGAGGTAATGAAATGG*T。端部修復(平滑ライゲーションのために)又はA尾部付加(リンカーに基づくライゲーションのために)を含む乾燥ビーズを、45μLのライゲーションマスターミックス(30μLの水、10μLの5x KAPAライゲーション緩衝液、及び5μLのKAPA T4DNAリガーゼ)、及び5μLの水(平滑末端ライゲーションのために)、又は5μLのモル当量混合物のリンカーオリゴヌクレオチド(リンカーに基づくライゲーションのために)と混合した。ビーズを徹底的に再懸濁し、20℃で15分間インキュベートした。50μLのPEG溶液(上記参照)を加えた後、混合物を上述のビーズ精製プロトコルに従い洗浄した。
多置換増幅(MDA)を、Illustra Genomiphi V2 DNA増幅キットを使用して実行した。ライゲートされた断片鎖を含む乾燥ビーズを、9μLのランダムヘキサマー含有緩衝液において再懸濁し、3分かけて95℃に加熱し、その後氷の上で急速冷却した。1μLの酵素混合物を加えた後、冷却されたサンプルを30℃で90分間インキュベートした。その後、反応を、65℃で10分間加熱することにより止めた。30μLのPEG溶液(上記参照)を加えた後、混合物を、上記の精製プロトコルに従って洗浄し、(65℃で5分間のインキュベーションにより)200μLのTEの中で再懸濁した。望ましい場合、精製した産物を、定量的PCR、デジタルドロップレットPCR(ddPCR)で定量化することができ、或いは次世代配列決定(NGS)を提案する。
MDAの後、長いライゲートされた断片鎖(例えば>2kb)を、130μLの全容積でCovaris S220を使用して、〜300bpにまで超音波処理した。製造者のプロトコルは140Wのピーク電力、10%のデューティファクタ、1つのバースト当たり200サイクル、及び80秒の処置時間を示した。〜300bpの断片長を選択し、無傷の初期の無細胞DNA断片を維持する可能性を増大させた。標準ライブラリ調製プロトコルを使用して、望ましい場合に配列決定のために超音波処理されたDNA断片上にアダプターを置くことができる。様々なリード組成物を、Illuminaシーケンサー(HiSeq又はMiSeqの何れか)上でのペアエンド配列決定ランから元に戻した。接合部(自己接合部、或いは、アダプターがライゲーション工程に含まれる場合にはアダプター接合部)がリード(非アダプター配列によって5’及び3’に隣接)に対し内部にあるものを使用して、目的の配列にバーコードを付けた。
実施例5:環状化及び増幅
これは、本明細書中の方法に従う環状化及び増幅の手順の一例を提供する。この手順は以下の供給部を使用した:PCR Machine (例えば、MJ research PTC−200 Peltier thermal cycler);Circligase II, ssDNA ligase Epicentre cat# CL9025K;エキソヌクレアーゼ(例えば、Exol, NEB Biolabs cat #M0293S; Exolll, NEB biolabs cat# M0206S);T4ポリヌクレオチドキナーゼ(NEB Biolab cat #M0201S);全ゲノム増幅キット(例えば、GE Healthcare, Illustra, Ready−To−Go, Genomiphi, V3 DNA増幅キット);GlycoBlue(例えばAmbion cat# AM9515);マイクロ遠心分離機(例えばEppendrof 5415D);DNA精製ビーズ(例えばAgencourt, AMpure XP, Beckman Coulter cat# A63881);磁気スタンド(例えば、The MagnaRack(商標)Invitrogen cat# CS15000);QubitR 2.0フルオロメーター(Invitrogen,cat#Q32866);分子プローブds DNA HSアッセイキット(Life Technology cat #032854);及びバイオアナライザー(Agilent 2100)、並びに高感度DNA試薬(cat#5067−4626)。
5’末端リン酸塩を欠くDNA断片(例えば無細胞DNA)の増幅のために、第1の工程は一本鎖の端部の修復及び形成であった。DNAを(例えばPCR Machine上で)96℃で30秒間変性させた。ポリヌクレオチドキナーゼ(PNK)反応物を、40μLのDNAと5μLの10X PNK反応緩衝液とを組み合わせ、その後37℃で30分間のインキュベーションにより、調製した。1mMのATP及びPNK酵素を反応物に加え、37℃で45分間インキュベートした。緩衝液の交換はDNAの沈殿及び再懸濁により行われた。PNK反応物からの50μLのDNA、5μLの酢酸ナトリウム0.5M pH5.2、1μLのGlycoBlue、1μLのオリゴ(100ng/μL)、及び150μLの100%エタノールを組み合わせた。混合物を−80℃で30分間インキュベートし、16k rpmで5分間遠心分離して、DNAをペレット上にした。DNAペレットを500μLの70%エタノールで洗浄し、室温で5分間風乾させ、DNAを12μLの10mM Tris=Cl pH8.0において懸濁させた。
その後、再懸濁されたDNAをライゲーションによって環状化した。DNAを96℃で30秒間変性させ、サンプルを氷の上で2分間冷やし、リガーゼ混合物(2μLの10X CircLigase緩衝液、4μLの5Mベタイン、1μLの50mM MnCl2、1μLのCircLigaseII)を加えた。ライゲーション反応物を、PCR machine上で、60℃で16時間インキュベートした。ライゲートされていないポリヌクレオチドをエキソヌクレアーゼ消化によって分解した。このために、DNAを80℃で45秒間変性させ、1μLのエキソヌクレアーゼ混合物(ExoI 20U/μL:ExoIII 100U/μL=1:2)を各管に加えた。これを、5回のピペットでの吸い上げと吐き出しにより混合し、簡単に回転させた。消化混合物を37℃で45分間インキュベートした。容量を30μLの水で50μLにし、更なる緩衝液交換を上述のような沈殿と再懸濁により行った。
全ゲノム増幅(WGA)を行うために、精製DNAを最初に65℃で5分間変性させた。GE WGAキットからの10μLの変性緩衝液を10μLの精製DNAに加えた。DNAを2分間、冷たいブロック又は氷の上で冷やした。20μLのDNAをReady−To−Go GenomiPhi V3ケーク(WGA)に加えた。WGA反応物を30℃で1.5時間インキュベートし、その後65℃で10分間の熱不活性化を行った。
AmpureXP磁気ビーズ(1.6X)を使用してサンプルを精製した。ビーズを攪拌し、80μLを1.5mLの管において等分した。その後、30μLの水、20μLの増幅DNA、及び80μLのビーズを組み合わせ、室温で3分間インキュベートした。管を2分間、磁気スタンドに配置し、透明な溶液をピペットで取り出した。ビーズを80%のエタノールで2回洗浄した。200μLの10mM Tris−Cl pH8.0を加えることによりDNAを溶出した。DNAビーズ混合物を65℃で5分間インキュベートした。管を2分間、磁気スタンドに戻した。195μLのDNAを新たな管に移した。1μLwをQbitによる定量化のために使用した。最後に、130μLのWGA産物を、Covaris S220を使用して超音波処理して、約400bpのサイズに到達させた。
実施例6:ライゲーション効率及びオンターゲット率の分析
上記実施例におけるように環状化され且つ全ゲノム増幅にさらされたcfDNAを、定量的PCR(qPCR)によって分析した。(KRASプライマーを使用して)サンプル標的に関するqPCR増幅曲線の結果を、図18のAとBに示す。図18のAに示されるように、インプットcfDNAの1/10のqPCR増幅は31.75の平均Ct(サイクル閾値)をもたらし、サンプルのライゲーション産物の1/10は31.927の平均Ctをもたらし、このことは、約88%の高ライゲーション効率を示している。ライゲーション効率は、約70%、80%、90%、95%、又は約100%に及ぶ場合もある。円形からほぼ全てのDNAを増幅することができるように、環状化されなかった線状のDNAは幾つかの例において取り除かれる。各サンプルは3回複製して実行された。図18のBに示されるように、10ngのWGA産物及び参照ゲノムDNA(gDNA)(12878、10ng)の増幅曲線は、互いに実質的に重複する。WGAサンプルの平均Ctは26.655であり、一方でgDNAサンプルの平均は26.605であり、このことは96%以上の高いオンターゲット率を示している。与えられた量の増幅DNAにおけるKRASの数は増幅されていないgDNAと比較可能であり、このことは偏見がない増幅プロセスを示している。各サンプルは3回複製して試験された。対比の点として、Lou et al. (PNAS, 2013, 110 (49))で提供される環状化プロトコルも試験した。記載される実施例の沈殿及び精製の工程を欠いたLouの方法を使用して、わずか10−30%の線状インプットDNAを環状DNAに変換した。そのような低い回復は、下流配列決定及び変異体検出に対する障害を提示する。
実施例7:ddPCRによる増幅された環状化DNAの分析
ドロップレットデジタルPCR(ddPCR)を使用して、環状化されたポリヌクレオチドから生成された全ゲノム増幅産物における対立遺伝子頻度の保存とバイアスを評価した。一般的に、ddPCRは、PCR増幅を支援する別個の、容積測定的に定義された油中水型ドロップレット区分に封入される核酸分子を計数することにより、絶対量を測定するデジタルPCRアッセイを指す。(Hinson et al, 2011, Anal. Chem. 83:8604−8610; Pinheiro et al, 2012, Anal. Chem. 84: 1003−1011)。単一のddPCR反応は、1つのウェル当たり少なくとも20,000の区分されたドロップレットで構成されてもよい。ドロップレットデジタルPCRは、PCR増幅を支援する別個の、容積測定的に定義された油中水型ドロップレット区分に封入される核酸分子を計数することにより、絶対量を測定するデジタルPCRアッセイを実行するプラットフォームを用いて、実行されてもよい。ドロップレットデジタルPCRに関する典型的な戦略を以下のように要約してもよい:サンプルを希釈し、数千から数百万の別個の反応槽(油中水型ドロップレット)へと区分し、それにより、各々が目的の核酸分子の1つ以上のコピーを含まなくなる。標的アンプリコン(目的の核酸分子)を含まない「負の」ドロップレットの数に対する、標的アンプリコン(目的の核酸分子)を含む「正の」検出されたドロップレットの数を使用して、元のサンプル中にある目的の核酸分子のコピー数を判定してもよい。ドロップレットデジタルPCRシステムの例は、核酸鋳型を含むサンプルを20,000ナノリットルのサイズのドロップレットへと区分するものである、Bio−RadのQX100(商標)Droplet Digital PCR System;及び、核酸鋳型を含むサンプルを1,000,000から10,000,000ピコリットルのサイズのドロップレットへと区分するRainDanceのRainDrop(商標)デジタルPCRシステムを含む。ddPCRのための方法の更なる例がWO2013181276A1で提供される。
この例において、黒色腫細胞株由来のBRAF V600EゲノムDNA(gDNA)を、特異的な割合(0%、0.67%、2.0%、6.67%、20%、又は100%)で参照ゲノムDNA12878と混合し、断片化して、cfDNAで見出されたものと同様のサイズ(この場合には約150bp)の断片を生成した。混合されたDNAサンプル(10ng)を実施例2に従い環状化し、増幅した。40ngの増幅DNAを、BRAF V600E及び野生型のためにddPCRにさらした。観察された突然変異対立遺伝子頻度を図で示し、図19において表にした。示されるように、増幅を伴う観察された突然変異対立遺伝子頻度(図19の表の中央の行)は、インプット変異遺伝子頻度(上の行)の他、増幅のない100ngのゲノムDNAからのddPCR結果(下の行)を反映している。ddPCRアウトプットによる対立遺伝子頻度を、ドロップレットを含む突然変異体及び野生型の両方の合計に対する、ドロップレットを含むBRAF突然変異の数として算出する。増幅を伴うDNAは白丸として示され、増幅のないものは小さな黒丸として示される。0.67%での小さな偏差を除いて、2つのデータセットは完全に重なっている。これは、実質的にバイアスを用いることなく、変異遺伝子頻度の真の表現の保存を実証する。
実施例8:バックグラウンドより上の配列変異体の検出
10ngの超音波処理されたgDNA(150bp、Multi−Gene Multiplexの参照DNA、Horizon)を環状化し、実施例2に記載されるように増幅し、その後超音波処理を行った。その後、断片化されたDNAをRubicon配列決定ライブラリ構築にさらした。捕捉配列決定の後、参照ホットスポットから50bp以内の変異体をプロットした。変異体のコールが異なる接合部により区別される2つの異なるポリヌクレオチドにおける検出を必要とする、変異体検出に関する結果を、図20に示す。7つの予想される参照ホットスポット(KIT D816V、EGFR G719S、EGFR T790M、EGFR L858R、KRAS G13D、KRAS G12D、NRAS Q61K)を位置0にてプロットする。他の2つの変異体も確認し、図20で白い三角形及び菱形として示した。
比較のために、gDNAを上記のように超音波処理したが、10ngの超音波処理されたgDNAを、環状化、及び2つの異なるポリヌクレオチドでの配列変異体の確認を必要とすることなく、共通の慣習に従いRubicon配列決定ライブラリ構築に直接さらした。捕捉配列決定の後、参照ホットスポットから50bp以内の変異体を再びプロットし、結果を図21に示す。7つの予想される参照ホットスポット(KIT D816V、EGFR G719S、EGFR T790M、EGFR L858R、KRAS G13D、KRAS G12D、NRAS Q61K)を位置0にてプロットする。他の位置での変異体は予想されず、これはおそらく配列決定の誤差によるものである。図20を作成するのに利用される方法の結果と対照的に、図21の結果は、標準的な配列決定法が、対立遺伝子頻度が低いとき(5%未満など)、真の突然変異シグナルを覆うことが可能なかなり高い偶然誤差率を持つことを示している。
2つの異なるポリヌクレオチドにおける検出を必要とする、及び必要としない配列決定法によって検出された感度及び背景雑音の別個の分析の結果を、図16−17に例示する。
これらの図が例示するように、検証の要件は背景雑音を大幅に減らし、感度を増大させる。
実施例9:GC組成物及びサイズ分布の分析
10ngの超音波処理されたgDNA(150bp、Multi−Gene Multiplexの参照DNA、Horizon)を環状化し、実施例5のように増幅し、配列決定し、2つのポリヌクレオチド検証フィルタ(左)をコールする変異体で分析した。CG割合の範囲を持つ配列の数を、図22に示されるように表にして、図でプロットした。左端のプロットに示されるように、実施例5に従い調製されたサンプルの配列は、(基礎的なゲノムの全GC含有量に相当する)中央のピークを除いて理論的分布に大いに類似している。対照的に、同じ量のgDNAがRubicon配列決定ライブラリ構築キットを使用する増幅なしに配列決定ライブラリを構築するために直接使用されたとき、配列決定結果と理論的分布との違いはかなり明らかである(中央のプロットを参照)。この直接のRubicon配列決定の中央のピークは理論的分布よりも高い。Newman et al. (2014; Nature Medicine, (20):548−54)は、32ngのcfDNAが使用されたとき、cfDNA配列決定GC含有量の分布が理論的分布と同様であることを報告した。これは右端のプロットで例示される。
DNAサイズ分布を、実施例5のように環状化、増幅、及び配列決定されたcfDNAのために評価した。図23に示されるように、配列決定結果により示される断片長の分布のピークは約150−180bpであり、これはcfDNAの典型的な分散パターンに類似する。
実施例10:増幅の均一性の評価
実施例5に従い環状化且つ増幅された10の産物のqPCR結果を、増幅されていない参照DNA(12878の細胞株のgDNA、Coriell Institute)と比較した。10ngのゲノム参照DNA又は増幅産物を各リアルタイムのqPCR反応のために使用し、比率をゲノムに対する増幅産物の相対的定量化によって生成した。図24に示されるように、各PCRの比率は2倍の変化以内であり、このことは、増幅されたDNAプール中のこれら標的のコピー数が増幅されていない参照DNAと非常に類似することを示唆している。6つの遺伝子(BRAF、cKIT、EGFR、KRAS、NRAS、PI3KCA)からのPCRプライマーの10のペアを設計し、前もって検証した。
実施例11:DNA断片の増幅収量の定量化
cfDNAを、4人の患者(患者1−4)及び1人の健康な対照から単離した。ゲノムDNA(gDNA、Multi−Gene Multiplex Horizon)を、およそ150bpの断片に超音波処理した。DNAを環状化し、ランダムプライマーで増幅させた。表7は、増幅反応へのDNAインプットの量、及び増幅によって産生されたDNAの量を示す。有意な増幅が最も小さなサンプル(0.4ng)でも得られ、全てのサンプルが少なくとも600倍増幅された。
実施例12:癌患者のcfDNAからの低頻度突然変異の検出
工程1において、cfDNAを環状化した。環状のライゲーション混合物を室温でPCR管の中に調製した。4ng−10ngのcfDNAを、12μlの容量のPCR管へピペットで移した。DNAwp96℃で30秒間変性させ、その後、PCR管を2分間氷の上で冷やした。ライゲーション混合物(2μlの10X CircLigase緩衝液、4μlの5Mベタイン、1μlの50mM MnCl2、1μlのCircLigase II)を各管に加え、反応をPCR machine上で、60℃で16時間勧めた。
工程2において、ライゲーション反応物を処理して、ライゲートされていない線状DNAを取り除いた。1μlのエキソヌクレアーゼ混合物(NEB M0206S、M0293S;ExoI 20u/μl:ExoIII 100u/μl=1:2)を各管に加え、混合し、PCR machine上で、37℃で30分間インキュベートした。
工程3において、ライゲーション反応物を緩衝液交換のために精製した。ライゲーション産物を、Oligo Clean & Concentrator(Zymo Research)で精製した。結合混合物(30μlの10mM Tris、100μlのオリゴ結合緩衝液、400μl100%エタノール)を、エキソヌクレアーゼ処理後にライゲーション反応物に加え、混合し、簡単に回転させた。Zymo−spinカラムを充填し、10,000xg以上で30秒間回転させた。カラムを750μlのDNA洗浄緩衝液で洗浄し、14,000xgで1分間遠心分離した。10,000xg以上で30秒間の遠心分離により、DNAを15μlの10mM Trisで溶出した。
工程4において、DNAをランダムプライミングにより増幅した。全ゲノム増幅(WGA)を、Ready−To−Go Genomiphi V3 DNA増幅キット(GE Healthcare)で行った。10μlの精製されたライゲーションを10μlの2x変性緩衝液と混合し、95℃で3分間インキュベートし、その後氷の上で4℃に冷やした。20μlの変性DNAをWGAプレミックス(pre−mix)に加えて、サンプルを30℃で1.5時間インキュベートし、その後65℃で10分間不活性化させた。
工程5において、増幅産物を、Agencourt AMPure XP Purification (1.6X) (Beckman Coulter)を使用してきれいにした。30μlの10mM Tris及び80μlのAMpureビーズを20μlのWGA反応物に加えた。混合物を室温で2分間インキュベートした。管を磁石スタンドに入れ、2分間インキュベートした。上清を除去し、廃棄した。サンプルを200μlのエタノール(80%)で2回洗浄し、5分間風乾して、DNAを200μlの10mM Tris pH8.0で溶出した。
工程6において、WGA DNAを断片化した。130μlのWGA産物を、Covaris S220ソニケーターを使用して超音波処理し、およそ400bpの断片サイズを得た。Covaris S220の設定は以下のとおりであった:ピーク入射電力=140W、デューティファクタ=10%、バースト当たりのサイクル=200、処置時間=55秒。
工程7において、サンプルをqPCRによって定量化した。ライゲーションインプット及びライゲーション産物の1/10を、ライゲーション効率を測定するための3つの複製でのqPCR反応のために使用した。10ngの参照gDNA(12878の細胞株)を加えた10ngの断片化WGA産物をqPCRのために使用し、オンターゲット率を測定した。反応物は、5μlの2xマスターミックス(TaqMan Fast Universal PCRマスターミックス(2x), Applied Biosystems; Evagreen dye, Biotium)、0.5μlのプライマー(5μM)、1.2μlのH2O、10μlのDNAを含んでいた。増幅を以下のプログラムに従い進めた:95℃、2分;及び[95℃、10秒;60℃、20秒]の40回のサイクル。
工程8において、配列決定ライブラリを構築した。配列決定ライブラリを、標準PCRライブラリ(KK8200)を用いるAPA Hyper Prep Kit(KK8500)又はKAPAライブラリ調製キットを使用して、500−1000ngの超音波処理した増幅DNAから調製した。アダプターライゲーション(1uMのアダプター最終濃度を有する)を製造者のプロトコルに従って調製した。ライゲートされた産物のアダプターライゲートされた洗浄物である、30μl(0.3x)の20%PEG8000/2.5M NaCl溶液を、100μlの再懸濁されてライゲートされた産物に加えた。ビーズをライゲートされた産物と共に徹底的に混合し、室温で15分間インキュベートした。その後、液体が透明になるまでビーズを磁石の上で捕捉した。その後、130μlの上清を、Ampure XPビーズを使用するサイズ選択にさらした。サンプルを新しいプレートに移し、その後、20μlのAmpure XPビーズ(0.5x)を加えた。ここでライゲートされた産物はビーズの中で補足され、200μlの80%エタノールで2回洗浄された。その後、ライゲートされた産物を再懸濁し、20μlのEB緩衝液の中で溶出した。サイズ選択及び精製の後、20μlのライゲートされた産物を、25μlの2x KAPA HiFi Hotstart ready mix、及び5μl−10μMのP5+P7プライマー(5’CAAGCAGAAGACGGCATACGA3’、5’ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’)に加え、以下のサイクルプログラムを使用してライブラリを増幅した:98℃、45秒;(98℃、15秒; 60℃、30秒;72℃、30秒)の5回のサイクル;72℃、60秒。増幅されたライブラリを、定量化のために断片アナライザー又はバイオアナライザー(高感度チップ)に充填する前に20倍に希釈した。更なるサイズ選択を、ゲルサイズ選別機(Blue Pippin prep from Sage Science)を介して行った。
工程9において、配列決定ライブラリを、xGEN Pan−Cancer Panel v1.5, 127908597 (IDT)からのプローブを使用するプローブ捕捉富化によって濃縮した。工程10において、ライブラリをHiSeq 2500において配列決定し、平均深度は1000xであった。
工程11において、配列決定データを分析し、変異体コールを作成した。変異体コールは、変異体として計数される2つの異なるポリヌクレオチド(例えば、異なる接合部により同定される)上に配列の差異が生じることをコールする工程を含んでいた。様々な体細胞突然変異を検出し、これらを公共のデータベース(COSMIC (Catalog of Somatic Mutations in Cancer))においても報告した。同定された突然変異は0.05%の対立遺伝子頻度を有するBRAF V600Mであり、これはインプットが低いときにもこのシステムの高感度を実証するものである。サンプル中の頻度を含む様々な突然変異の検出に関する結果を表8に示す。
実施例13:FFPEサンプルの多重参照DNAからの正確な突然変異検出
DNAを、製造者のプロトコル(Covaris truXTRAC(商標)FFPE DNA Kit)に従って、サンプルのHorizon FFPE−multiplex(HD200)から抽出した。Covaris S220ソニケーターを使用して130μlのFFPE gDNAを超音波処理し、およそ150bpの断片サイズを得た(Covaris S220の設定:ピーク入射電力=175W、デューティファクタ=10%、バースト当たりのサイクル=200、処置時間=430秒)。11μl容量での50ngのDNAを95℃で30秒間変性させた。10.5μlのH2O、2.5μlのリガーゼ緩衝液(NEB B0202S)、及び1μlのT4ポリヌクレオチドキナーゼ(NEB M0201S)を加えた。反応物をリン酸化のために37℃で30分間インキュベートした。
サンプルをライゲートし、その後Oligo Clean & Concentrator(Zymo Research)で精製した。結合混合物(30μlの10mM Tris、100μlのオリゴ結合緩衝液、400μl100%エタノール)を、エキソヌクレアーゼ処理後にライゲーション反応物に加え、ボルテックスにより混合し、簡単に回転させた。サンプルをZymo回転カラムに充填し、10,000xg以上で30秒間回転させた。カラムを750μlのDNA洗浄緩衝液で洗浄し、14,000xgで1分間遠心分離した。10,000xg以上で30秒間の遠心分離により、DNAを15μlの10mM Trisで溶出した。
サンプルを、実施例13の工程5−11に従い更に処理且つ分析した。結果を表9にまとめる。Horizonの多数の突然変異標準DNAにおける9つの突然変異の表現をこのプロセスにより大まかに保持し、一方でDNAの量は少なくとも600倍増加した。
実施例14:癌突然変異細胞株gDNAマルチマーからの低頻度の突然変異の検出
この実施例において、超音波処理されたゲノムDNAをライゲートしてマルチマーを形成し、これを後に増幅、断片化、及び分析にさらした。図25のAとBは、このプロセスの実施例を説明する。例示的なワークフローを図31で提供する。
メラノーマ細胞株SK−−mel−28(ATCC)含有BRAF V600E突然変異からのgDNAを参照gDNA(12878 Coriell Institute)と混合し、1%BRAF V600Eを達成した。実施例14におけるようにDNAを超音波処理して、およそ150bpの断片サイズを得た。11μl容量での100ngのDNAを95℃で30秒間変性させた。10.5μlのH2O、2.5μlのリガーゼ緩衝液(NEB B0202S)、及び1μlのT4ポリヌクレオチドキナーゼ(NEB M0201S)を加え、その後37℃で30秒間インキュベートし、DNAをリン酸化した。
サンプルをOligo Clean & Concentrator(Zymo Research)で精製した。これは、エキソヌクレアーゼ処理後にライゲーションに結合混合物(25μlの10mM Tris、100μlのオリゴ結合緩衝液、400μlの100%エタノール)を加える工程を含んでいた。これをボルテックスにより混合し、簡単に回転させた。Zymo回転カラムを充填し、10,000xg以上で30秒間回転させ、750μlのDNA洗浄緩衝液で洗浄し、14,000xgで1分間遠心分離した。10,000xg以上で30秒間の遠心分離により、DNAを15μlの10mM Trisで溶出した。
ライゲートするために、4μl容量で6ngのDNAを、0.45μlの10x端部修復緩衝液(Enyzymatics)、0.05μlのdNTP 25mM、0.5μlのATP 10mM、端部修復酵素混合物(Enyzymatics)、及びT4リガーゼ2000単位/μlと混合した。反応物を25℃で30分間、その後75℃で20分間インキュベートした。
全ゲノム増幅を、Ready−To−Go Genomiphi V3 DNA増幅キット(GE Healthcare)で行った。8μlのH2O及び10μlの精製されたライゲーションを10μlの2x変性緩衝液と混合した。DNAを95℃で3分間変性させ、その後氷の上で4℃に冷やした。20μlの変性DNAをWGAプレミックス(pre−mix)に加えて、30℃で1.5時間インキュベートし、その後65℃で10分間不活性化させた。
その後、増幅反応物を、Agencourt AMPure XP Purification (1.6X) (Beckman Coulter)を使用してきれいにした。30μlの10mM Tris及び80μlのAMpureビーズを20μlのWGA反応物に加えた。これを室温で2分間インキュベートした。管を磁石スタンドに入れ、2分間インキュベートした。上清を除去し、廃棄した。ビーズを200μlのエタノール(80%)で2回洗浄し、その後5分間風乾した。200μLの10mM Tris pH8.0でDNAを溶出した。その後、Covaris S220ソニケーターを使用して130μlのWGA産物を断片化し、およそ400bpの断片サイズを得た(Covaris S220の設定:ピーク入射電力=140W、デューティファクタ=10%、バースト当たりのサイクル=200、処置時間=55秒)。
BioRad Prime PCR ddPCR突然変異検出アッセイを使用するddPCRにより突然変異を検出した。突然変異検出ddPCR反応を、室温でPCR管に組み込んだ(80ngの増幅DNA、プローブ用の10μlの2x ddPCRスーパーミックス、1μlの20x標的(BRAF V600E,BioRad)プライマー(9μM)/プローブ(FAM;5μM、1μlの20x野生型プライマー(9μM)/プローブ(HEX;5μM)、8μlのDNAサンプル(50ng))。5回のピペットでの吸い上げと吐き出しにより反応物を混合し、その後、ドロップレット発生装置カートリッジに移した。QX200ドロップレット発生装置を使用してドロップレットを生成し、96ウェルのPCRプレートに移し、以下のPCRプログラムを使用して増幅させた:95℃、10分;[94℃、30秒、55℃、1分]の40回のサイクル;98℃、10分。PCR反応プレートをQX200ドロップレットリーダーに移し、結果を定量化した。インプットDNAに基づいて、BRAF V600E突然変異の期待度数は1%であった。このライゲーション及び増幅の手順によって、この度数は大まかに維持され(ddPCR分析に従い1.41%)、一方でDNAの量は約200倍増加した。
図26と27は図25のプロセスに対する例示的な変形を説明する。
実施例15:単一反応アッセイにおける稀な突然変異の検出
NGSを使用する無細胞DNAの循環における稀な突然変異を検出する性能は2つの要因に限定される:1つ目は配列決定技術の正確性であり;2つ目はアッセイの全体的な変換速度である。本明細書には、正確な変異体コールのための単一反応アッセイのワークフロー及びアルゴリズムを使用して、標的領域における稀な変異体の敏感な検出のための方法が記載される。単一反応アッセイのための例示的なワークフローを図34のAとBに提供する。
線状の単鎖ポリヌクレオチドを末端接合により環状化する。単鎖の環が望ましい場合、ポリヌクレオチドは最初に単離される単鎖ポリヌクレオチドであり、或いは、(例えば変性によって)ポリヌクレオチドに単鎖を与えるように処理されてもよい。この実施例において、ポリヌクレオチドを環状化するための方法は、リガーゼ(例えばRNAリガーゼ又はDNAリガーゼ)の使用など、酵素に関与している。反応条件は、選択された酵素の製造者によって特定されたものである。環状ポリヌクレオチドを形成するためにポリヌクレオチドの端部を接合することで(それ自体に直接、或いは、1つ以上の他のポリヌクレオチド、例えば2つの標的ポリヌクレオチドを含む環状標的ポリヌクレオチドに)、接合部配列を持つ接合部を産生する。
環状化の後、環状化反応の後にライゲートされていない核酸を消化するためにエキソヌクレアーゼ工程が含まれる。即ち、閉鎖式循環は、遊離した5’又は3’末端を含まず、故に、5’又は3’エキソヌクレアーゼの導入は閉鎖式循環を消化しないが、ライゲートされていない成分を消化する。場合によっては、これは多重システムにおける特定の使用を見出す。
環状化の後、リガーゼは、ライゲートされた分子上で結合されたままでもよい。ライゲーション接合部のリガーゼの存在は。重合反応中にプライマー伸長を阻害し、且つ増幅効率を減らすこともある(図34のAに例示されるように)。分解による環状化反応に使用されるリガーゼの除去は、ポリメラーゼが接合部を通って伸長し、且つコンカテマーとして環状化された標的分子を効果的に増幅することを可能にする。リガーゼの分解は、70℃で15分間のインキュベーションにより加熱不活性化(head−inactivated)され得る、Qiagenプロテアーゼなどの非耐熱性プロテアーゼでの処置を含む。
リガーゼの除去後、環状化DNA分子を、全ゲノム増幅のためのランダムプライマー又は標的にされた増幅のための特異的プライマーによって増幅することができる。増幅されたコンカテマーを無作為に超音波処理して、NGSライブラリ構築及び配列決定のためにサイズ範囲〜500bp−1000bpで断片を作成する。
この実施例でのアルゴリズムの改善を図35に例示する。コンカテマー配列における接合部(参照における開始及び端部位置を特徴とする)を、参照配列へのアラインメントを介して同定することができ、且つ元のインプットDNA断片のタグとして使用することができる。しかし、接合部のタイプの数(参照における開始と端部の組み合わせ)を与えられた標的領域において制限してもよく;及び、多数のインプットDNA断片が存在すると、2つの独立したインプットDNA断片の接合部において比較的高い不一致の可能性が存在する。結果的に、「接合部タグ」は、多くの用途における固有のタグとして扱われない場合があり、この種のタグに基づく誤差の補正と分子の計数は固有に区別を行わない場合がある。
コンカテマー寸断点をコンカテマー配列中の接合部と組み合わせることによって、より多くの特徴的なタグをインプット分子のために作成することができる。図35に例示されるように、環ライゲーション及びRCAの後に生成され得る一連の長いコンカテマーは、より短いコンカテマーを形成するために超音波処理或いは他の断片化の方法(例えば酵素切断)を使用して寸断される。これらは異なる構造を持つ多くのコンカテマーをもたらす:例えば、接合部に対する、リードにおける異なる数の反復或いは異なる開始/末端位置、即ち2つの端部にあるコンカテマー寸断点。
特徴的なタグを作成するためにコンカテマー寸断点を組み込むことによって、特徴的なタグによって同定されたリードファミリーから構築されたコンセンサス配列に基づいて追加の誤差補正を効果的に実行することが可能である。様々な投票方式を使用して、リードのファミリーからコンセンサス配列を構築し、且つ様々な変異体コールを行い、例えば、ファミリーにおける全てのリードが同じ変異体を報告する場合にのみ変異体がコールされる。2つ目に、特徴的なタグを使用して、インプット分子を集計し、対立遺伝子頻度を計算することを支援することができる。
コンカテマー寸断点を同定するための一例のアルゴリズムは以下のとおりである。1)自己アラインメント、参照配列へのアラインメント、或いは他の計算方法と共に行うことが可能な、コンカテマー配列(リード)において、反復長さ、反復領域、及び接合部を同定;2)参照配列のリードを整列させることによりリード内の接合部の位置を判定;3)変更される塩基の数を隣接接合部のリード位置により判定する一方、接合部の参照開始又は末端位置から位置を変えることによりコンカテマー寸断点(両端にある)の位置を計算。
実施例16:リガーゼ除去を用いる、又は用いない、リガーゼ処理したcfDNA分子のqPCR分析
様々な条件下で環状化且つ精製された、リガーゼ処理したcfDNAサンプルをqPCRによって分析した。3つの精製条件が試験に含まれていた:1.クロマトグラフィーカラムにより精製された、Circ−ライゲートされたDNA;2.フェノールクロロホルムによって精製された、Circ−ライゲートされたDNA;及び3.クロマトグラフィーカラムによる精製の前にリガーゼを取り除くためにプロテイナーゼKで処理された、Circ−ライゲートされたDNA。10ngのcfDNAを各条件(1、2及び3)のために使用した。cfDNAを96℃で30秒間変性させ、2分間氷ブロックの上で冷やし、その後ライゲーション混合物(2μLの10X Circligase緩衝液、4μLの5Mベタイン、1μLの50mM MnCl2、1μlのCircligase II(Epicentre # CL9025K))を加えた。「リガーゼ対照なし」(4)、及び「DNA対照なし」(5)を同時にセットアップした。「リガーゼ対照」は、2μLの10X Circligase緩衝液、4μLの5Mベタイン、1μLの50mM MnCl2と混合した10ngのcfDNAを含んでいたが、リガーゼは含まなかった。「DNA対照」は全てのライゲーション試薬を含んでいたが、cfDNAは含まなかった。全ての反応物を60℃で1時間インキュベートした。
ライゲーションの後、「リガーゼ対照なし」(4)、「DNA対照なし」(5)、及び条件1(クロマトグラフィーカラムによって精製された、Circ−ライゲートされたDNA)を、クロマトグラフィーカラムによって精製した。各反応物を、10mMのTris−Cl pH8.0で事前に洗浄したマイクロバイオ−スピンP−6カラムに充填し、1,000x(g)で4分間のカラムの遠心分離により溶出した。
条件2(フェノールクロロホルムによって精製された、Circ−ライゲートされたDNA)を、フェノールクロロホルム抽出及びエタノール沈澱によって精製した。180μLの10mM Trisを、エキソヌクレアーゼ処理から20μLのDNAに加えて、200μLの量を作り出し、200μLのフェノールを使用してDNAを抽出した。水層を集め、DNAをエタノール沈澱によって回収した。エタノール共沈殿混合物(フェノール抽出後の200μLのDNA溶液、20μLの酢酸ナトリウム0.5M pH5.2、1μLのGlycoBlue、1μLの担体オリゴ(100ng/μL)、600μLの100%エタノール)を、−80℃で30分間インキュベートし、16k rpmで5分間遠心分離して、DNAを沈殿させた。DNAペレットを500μLの70%エタノールで洗浄した。DNAペレットを室温で5分間風乾し、11μLの10mM Tris−Cl pH8.0で再懸濁した。
条件3(プロテイナーゼKで処理された、Circ−ライゲートされたDNA)を最初に37℃で30分間、プロテイナーゼKで処理し、その後、クロマトグラフィーカラムを使用して精製した。反応物を、10mMのTris−Cl pH8.0で事前に洗浄したマイクロバイオ−スピンP−6カラムに充填し、1,000x(g)で4分間のカラムの遠心分離により溶出した。
その後、各条件(1−5)の産物を定量的PCR(qPCR)によって分析した。3つの複製qPCR反応を各サンプルのためにセットアップし、平均Ctを算出した。表10に示されるように、DNA対照なし(5)のqPCR増幅は、40の平均Ct(サイクル閾値)をもたらし、リガーゼ対照なし(4)の産物は30.79の平均Ctをもたらし、このことは、リガーゼ処置のない条件下でのインプットDNAの高い回復を示している。条件1と2はそれぞれ34.80と35.18の平均Ctをもたらした。リガーゼ対照なし(4)と比較して、条件1と2は、両方の産物が遊離酵素を取り除くために精製されたとしても、リガーゼ処置後の増幅可能なDNAの有意な損失を示した。精製前にリガーゼが酵素分解により除去された条件3の産物は、リガーゼ対照なし(4)に匹敵する、30.42の平均Ctを示し、このことは、リガーゼの除去が増幅可能なDNAの効率的な回復に重要であることを示している。
実施例17:NGSライブラリの複雑性の比較
この実施例は、異なるワークフローによって調製されたNGSライブラリの複雑性を比較する。
この実施例で比較されたワークフローは以下を含む:
1.増幅前にフェノールクロロホルム抽出工程による環状化と精製を介して調製されたライブラリ;
2.精製なしに環状化及び直接の増幅を介して調製されたライブラリ;
3.15分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ;
4.20分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ;
5.30分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ;
6.60分間の環状化とプロテアーゼ処理、その後精製なしの増幅を介して調製されたライブラリ;
各条件のために、12μLの20ng cfDNAをライブラリ構築のためにインプットとして使用した。DNAサンプルを96℃で30秒間変性させ、2分間氷ブロックの上で冷やした。ライゲーション混合物(12μLのcfDNA、2μLの10X Circligase緩衝液、4μLの5Mベタイン、1μLの50mM MnCl2、1μLのCircligase II(Epicentre # CL9025K))の追加を冷たいブロックの上でセットアップし、ライゲーションを60℃で3時間行った。ライゲーションDNA混合物をPCR machine上で、80℃で45秒間インキュベートし、その後エキソヌクレアーゼ処理を行った。1μLのエキソヌクレアーゼ混合物(Exol 20U/μL:ExoIII 100U/μL=1:2)を各管に加え、反応物を37℃で30分間インキュベートした。
ワークフロー1のために、ライゲーション産物を、フェノールクロロホルムで抽出し、且つ塩とエタノールで沈殿させた。180μLの10mM Trisを、エキソヌクレアーゼ処理から20μLのDNAに加えて、200μLの量を作り出し、200μLのフェノールを使用してDNAを抽出した。水層を集め、DNAをエタノール沈澱によって回収した。エタノール共沈殿混合物(フェノール抽出後の200μLのDNA溶液、20μLの酢酸ナトリウム0.5M pH5.2、1μLのGlycoBlue、1μLの担体オリゴ(100ng/μL)、600μLの100%エタノール)を、−80℃で30分間インキュベートし、16k rpmで5分間遠心分離して、DNAを沈殿させた。DNAペレットを500μLの70%エタノールで洗浄した。
DNAペレットを室温で5分間風乾し、11μLの10mM Tris−Cl pH8.0で再懸濁した。全ゲノム増幅(WGA)を行うために、精製DNAを最初に65℃で5分間変性させた。GE WGAキットからの10μLの変性緩衝液を10μLの精製DNAに加えた。DNAを2分間、冷たいブロック又は氷の上で冷やした。20μLのDNAをReady−To−Go GenomiPhi V3ケーク(WGA)に加えた。WGA反応物を30℃で1.5時間インキュベートし、その後65℃で10分間の熱不活性化を行った。
ワークフロー2のために、0.12μLの0.5M EDTA及び0.58μLの1M KClを、エキソヌクレアーゼ処理したライゲーション産物に加え、十分に混合した。ライゲーション混合物を95℃で2分間変性させ、Ready−To−Go GenomiPhi V3ケーク(WGA)に加える前に氷の上で4℃に冷えた。WGA反応物を30℃で4.5時間インキュベートし、その後65℃で10分間の熱不活性化を行った。
ワークフロー3−6のために、エキソヌクレアーゼ処理したライゲーション産物を、最初にプロテアーゼで処理し、circligase IIを取り除いた。1μLのセリンプロテアーゼを各反応物に加え、55℃でのインキュベーション時間を15分から60分に漸増し(条件3:15分;条件4:20分;条件5:30分;条件6:60分)、その後、70℃で15分間の熱不活性化を行い、0.12μLの0.5M EDTA及び0.58μLの1M KClを、処理されたライゲーション産物に加えた。その後、ライゲーション混合物を95℃で2分間変性させ、Ready−To−Go GenomiPhi V3ケーク(WGA)に加える前に氷の上で4℃に冷えた。WGA反応物を30℃で4.5時間インキュベートし、その後65℃で10分間の熱不活性化を行った。
全ての条件のために、WGA産物を、AmpureXP磁気ビーズを使用してビーズ精製し、800bpの平均サイズに超音波処理した。その後、超音波処理されたDNAサンプルを、KAPAライブラリ調製物キットを使用した標準配列決定ライブラリ構築のために、インプットとして使用した。その後、ライブラリをIllumina HiSeq2500によって配列決定し、ライブラリ複雑性を、各ライブラリで検知された固有の分子の数を算出することにより評価した。ライブラリ複雑性の比較を以下の図面で示し、固有分子の数を相対的な基準で調整した。ワークフロー1は最低の複雑性を示し;ワークフロー2はワークフロー1よりもわずかに高いライブラリ複雑性を示し、このことは、精製をスキップすることによる分子欠損があまりないことを示し;リガーゼの除去(ワークフロー3−6)の除去はライブラリにおける固有の分子の数を大幅に増大し、より長いプロテアーゼ処理時間が検出されたより多くの固有の分子に通じる。検出された分子の増加は、この実験での30分のインキュベーションの後に安定水準に達し始めた。結果を図38に表す。
実施例18:変異体コール
この実施例は、本明細書に記載される方法を使用して変異体コールを評価し、ここで、少なくとも2つの異なる切断されたポリヌクレオチドに生じる配列変異体は真の配列変異体として同定される。
9つの細胞株からのゲノムDNAを〜150bpの平均サイズに断片化し、混合して、DNA混合物を産生した。DNA混合物は、0.1%の対立遺伝子頻度(AF)で8つの癌ホットスポット(表11)を占めている。12μLの20ng DNA混合物を各反応のライブラリ構築のためにインプットとして使用した。DNAサンプルを96℃で30秒間変性させ、2分間氷ブロックの上で冷やした。ライゲーション混合物(12μLのcfDNA、2μLの10X Circligase緩衝液、4μLの5Mベタイン、1μLの50mM MnCl2、1μLのCircligase II(Epicentre # CL9025K))の追加後、反応物を冷たいブロックの上でセットアップし、ライゲーションを60℃で3時間行った。ライゲーションDNA混合物をPCR machine上で、80℃で45秒間インキュベートし、その後エキソヌクレアーゼ処理を行った。1μLのエキソヌクレアーゼ混合物(Exol 20U/μL:ExoIII 100U/μL=1:2)を各管に加え、反応物を37℃で30分間インキュベートした。Circligase IIをプロテアーゼ処理によって取り除き、0.12μLの0.5M EDTA/0.58μLの1M KClを反応物に加えた。その後、ライゲーション混合物を95℃で2分間変性させ、Ready−To−Go GenomiPhi V3ケーク(全ゲノム増幅、WGA)に加える前に氷の上で4℃に冷えた。WGA反応物を30℃で4.5時間インキュベートし、その後65℃で10分間の熱不活性化を行った。
WGA産物を、AmpureXP磁気ビーズを使用してビーズ精製し、〜800bpの平均サイズに超音波処理した。その後、超音波処理されたDNAサンプルを、KAPAライブラリ調製物キットを使用した標準配列決定ライブラリ構築のために、インプットとして使用した。図39に例示されるように、超音波処理又は他の断片化方法(例えば酵素切断)を使用して、RCAから結果として生じる一連の長いコンカテマーからより短いコンカテマーを生成することができる。結果として生じるコンカテマーには様々な構造があり得る。形成されたより短いコンカテマーには異なる数の反復、又はインプットDNA配列のコピー、接合部に対するリードにおける異なる開始/末端位置(例えばコンカテマー寸断点)がある場合がある。場合によっては、様々な構造を持つコンカテマーは、ランダムプライミングによって産生される(図40)。
ライブラリをIllunima HiSeq2500によって配列決定し、配列決定リードを配列分析にさらした。配列分析において、コンカテマー寸断点を配列決定リードの接合部配列と組み合わせて、配列決定リードに関連しうる固有のタグを作成することができる。固有のタグによって同定されたリードファミリーから構築されたコンセンサス配列を使用して、追加の誤差補正を実行することができる。
様々な投票方式を使用して、リードのファミリーからコンセンサス配列を構築し、変異体コールを実行してもよい。コンセンサスは、例えば、同じ変異体を報告するファミリーの大多数のリードに基づいて作成することができる。配列の差異をリードファミリーのコンセンサス配列と参照配列との間で同定することができ、場合によっては、同じ配列の差異が少なくとも2つの異なるリードファミリーに生じるときに変異体をコールする。固有タグを使用して、インプット分子を集計し、対立遺伝子頻度を計算することを支援することもできる。
コンカテマー寸断点を同定し且つ変異体コールを実行するための例示的なアルゴリズムにおいて、
1)例えば自己アラインメント、参照配列へのアラインメント、或いは他の計算方法により、コンカテマー配列(リード)において、反復長さ、反復領域、及び接合部を同定。
2)参照配列のリードを整列させることによりリード内の接合部の位置を判定。
3)変更される基部の数を隣接接合部のリード位置により判定する一方、接合部の参照開始又は末端位置から位置を変えることによりコンカテマー寸断点(両端にある)の位置を計算。
4)「接合部タグ」(例えば固有のタグ)と組み合わせて寸断点に基づいてリードをグループ分けし、各々が固有のタグを持つリードの異なるリードファミリーを作成。
5)リードファミリーにおけるリードの大部分が変異体を全体一致で支持、即ち、全てのリードがコンカテマー確認により変異体を報告した場合、このファミリーは変異体ファミリーとして計数される(図41A);それ以外では、このファミリーは変異体ファミリーとして計数されない(図41B)。
6)変異体ファミリーの数を使用して、「接合部タグ」により同定されたインプット分子が、様々なカットオフが適用される「変異体分子」として計数することが可能かどうかを判定することができる。例えば、図41Cにおいて、同じ配列の差異(開始)が少なくとも2つの異なるリードファミリーに生じたときに、変異体がコールされる。場合によっては、「変異体分子」の数を使用して、変異体がコールされるべきかどうかを判定し、且つ、対立遺伝子頻度を算出することができる。
本明細書に記載される方法を使用した変異体検出の改善を判定するために、配列の差異が第1の切断されたポリヌクレオチドからの配列決定リードの大多数且つ第2の切断されたポリヌクレオチドからの配列決定リードの大多数に生じるときに、配列決定リードにおいて検出される配列の差異を変異体としてコールすることにより同定される変異体の数は、そのような要求を必要としない方法により同定された変異体と比較された。表12に示されるように、少なくとも2つの異なる切断されたポリヌクレオチドに生じる配列変異体の要件は、非特異的偽陽性変異体を〜23.39%減らし、一方で真の陽性コールはどれも取り除かれず(取り除かれた特異的な真の変異体は0%である)、このことは、感度に影響を及ぼすことのない特異性の有意な改善を示す。
本発明の好ましい実施形態が本明細書中で示され且つ記載されてきたが、このような実施形態はほんの一例として提供されるものであることは、当業者に明らかであろう。多数の変形、変更、及び置き換えは、本発明から逸脱することなく、当業者によって現在想到されるものである。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用されるかもしれないことを理解されたい。以下の特許請求の範囲は本発明の範囲を定義するものであり、この特許請求の範囲及びその同等物の範囲内の方法及び構造は、それにより包含されることが、意図されている。