配列表
核酸およびタンパク質配列は、37 C.F.R. 1.822で定義されている通り、ヌクレオチド塩基に関する標準的な文字の略語を使用して示される。各核酸配列の一方の鎖のみが示されるが、表示された鎖に言及される場合はいつでも相補鎖が含まれるものと理解される。2017年2月9日に作成されサイズが16KBの「seq listing」と命名されたテキストファイルの内容は、参照によりその全体が本明細書に組み入れられる。
配列番号1は、アミノ酸600で複数のBRAFコード配列を検出することができるNPPF核酸配列を示す。
配列番号2は、野生型ヒトBRAF配列の一部を示す。
配列番号3は、V600E突然変異をコードするBRAF配列の一部を示す。
配列番号4は、V600K突然変異をコードするBRAF配列の一部を示す。
配列番号5は、V600R突然変異をコードするBRAF配列の一部を示す。
配列番号6は、V600E2突然変異をコードするBRAF配列の一部を示す。
配列番号7は、V600D突然変異をコードするBRAF配列の一部を示す。
配列番号8は、アミノ酸12で複数のKRASコード配列を検出することができるNPPF核酸配列を示す。
配列番号9は、野生型ヒトKRAS配列の一部を示す。
配列番号10は、G12D突然変異をコードするKRAS配列の一部を示す。
配列番号11は、G12V突然変異をコードするKRAS配列の一部を示す。
配列番号12は、G12A突然変異をコードするKRAS配列の一部を示す。
配列番号13は、G12C突然変異をコードするKRAS配列の一部を示す。
配列番号14は、G12S突然変異をコードするKRAS配列の一部を示す。
配列番号15は、G12R突然変異をコードするKRAS配列の一部を示す。
配列番号16は、G13D突然変異をコードするKRAS配列の一部を示す。
配列番号17は、アミノ酸61で複数のKRASコード配列を検出することができるNPPF核酸配列を示す。
配列番号18は、野生型ヒトKRAS配列の一部を示す。
配列番号19は、Q61E突然変異をコードするKRAS配列の一部を示す。
配列番号20は、Q61R突然変異をコードするKRAS配列の一部を示す。
配列番号21は、Q61L突然変異をコードするKRAS配列の一部を示す。
配列番号22は、Q61H−C突然変異をコードするKRAS配列の一部を示す。
配列番号23は、Q61H−T突然変異をコードするKRAS配列の一部を示す。
配列番号24は、NPPFの5’−フランキング配列を示す。
配列番号25は、NPPFの3’−フランキング配列を示す。
配列番号26は、実験的タグ(例えば配列番号28、29、36、37、38、39、40、50、51、または54など)を含めるのに使用することができる8ヌクレオチドの領域を有するフォワードプライマー配列を示す。
配列番号27は、実験的タグ(例えば配列番号30、31、32、33、34、35、41、42、43、44、45、46、47、48、49、52、53、55、56、57、58、59、60または61など)を含めるのに使用することができる6ヌクレオチドの領域を有するリバースプライマー配列を示す。
配列番号28から61は、例示的な実験的タグ配列を示す。
配列番号62は、標的野生型ヒトBRAF配列の一部を示す。
配列番号63は、V600E突然変異をコードする標的BRAF配列の一部を示す。
配列番号64は、V600E2突然変異をコードする標的BRAF配列の一部を示す。
詳細な説明
別段の規定がない限り、専門用語は慣例的用法に従って使用される。分子生物学における共通用語の定義は、Benjamin Lewin、Genes VII、Oxford University Press出版、2000年(ISBN019879276X);Kendrewら(編)、The Encyclopedia of Molecular Biology、Blackwell Publishers出版、1994年(ISBN0632021829);Robert A. Meyers(編)、Molecular Biology and Biotechnology: a Comprehensive Desk Reference、Wiley, John & Sons, Inc.出版、1995年(ISBN0471186341);およびGeorge P. Redei、Encyclopedic Dictionary of Genetics, Genomics, and Proteomics、第2版、2003年(ISBN:0−471−26821−6)に見出すことができる。
単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈上明らかに別段の指示がない限り、1つまたは1つより多くを指す。例えば、用語「NPPFを含む」は、単数または複数形のNPPFを含み、成句「少なくとも1つのNPPFを含む」と同等とみなされる。用語「または」は、文脈上明らかに別段の指示がない限り、述べられた選択的な要素の単一の要素または2つもしくはそれより多くの要素の組合せを指す。「含む(comprises)」は、本明細書で使用される場合、「含む(includes)」を意味する。したがって、「AまたはBを含む(comprising)」は、「A、B、またはAおよびBを含む(including)」を意味し、追加の要素は排除されない。
さらに、核酸またはポリペプチドに関して記載される全ての塩基サイズまたはアミノ酸サイズ、および全ての分子量または分子量の値は近似値であり、説明のために提供されることが理解されるものとする。本明細書に記載されたものに類似した、または同等な方法および材料が本開示の実施または試験で使用できるが、好適な方法および材料は、後述される。本明細書で述べられた全ての刊行物、特許出願、特許、および他の参考文献は、参照によりそれら全体が開示に組み入れられ、GenBank(登録商標)受託番号(2016年2月11日に存在する配列の場合)も同様である。矛盾がある場合、本明細書が用語の説明も含めて優先されることになる。加えて、材料、方法、および実施例は単なる例示にすぎず、限定することを意図しない。
別段の指示がある場合を除き、本開示の方法および技術は、一般的に、当技術分野において周知の従来の方法に従って、さらに本明細書にわたり引用され論じられた様々な総合的でより具体的な参考文献に記載されたように実行される。例えば、Sambrookら、Molecular Cloning:A Laboratory Manual、第2版、Cold Spring Harbor Laboratory Press、1989年;Sambrookら、Molecular Cloning:A Laboratory Manual、第3版、Cold Spring Harbor Press、2001年;Ausubelら、Current Protocols in Molecular Biology、Greene Publishing Associates、1992年(および2000年までの別冊);Ausubelら、Short Protocols in Molecular Biology:A Compendium of Methods from Current Protocols in Molecular Biology、第4版、Wiley & Sons、1999年;HarlowおよびLane、Antibodies:A Laboratory Manual、Cold Spring Harbor Laboratory Press、1990年;およびHarlowおよびLane、Using Antibodies:A Laboratory Manual、Cold Spring Harbor Laboratory Press、1999年を参照されたい。
I.概説
本開示は、標的核酸分子の直接シーケンシングを可能にする方法であって、さらに、多重化できるか(例えば、単一の試料中の複数の標的を検出すること)もしくはハイスループットに適しており(例えば、複数の試料中の標的を検出すること)、または多重化かつハイスループットである(例えば、複数の試料中の複数の標的を検出すること)方法を提供する。開示された方法は、現在利用可能なシーケンシング方法を超える数々の改善を提供する。例えば、本方法は、サロゲートを使用する代わりに目的の標的核酸分子(またはそのアンプリコン)を直接シーケンシングすることから、標的(例えば点突然変異など)の検出をより正確にすることが可能である。加えて、開示された方法は標的化されるため、データ分析は簡易化され、例えば、シーケンサーアウトプットを適用可能なNPPF配列(または適用可能なNPPF配列の相補物)の相対的に小さいデータベースに対してアラインできることから、複雑な核酸データベース(例えば全ゲノムなど)に対してシーケンサーアウトプットをアラインする必要性と、標的を同定するためのシーケンシングした断片のアセンブリが回避される。またヌクレオチドの長いリードも必要ではなく、これはなぜなら、例えば、シーケンシングされるライゲートした標的は、相対的に少数のヌクレオチドからなり(例えば同じ標的をコードするインタクトなmRNAと比較して)、ライゲートした標的の十分な数のヌクレオチドだけを読み取ればよいためであり(多くの場合、完全なライゲートした標的配列より少ない)、相対的に単純な参照データベース(上記で論じられた)に対するアライメントの成功を可能にする。さらに、一部のシーケンサーは、1回のシーケンシング試行で「読み取り」可能なヌクレオチドの数を制限するが、目的の標的を同定するために読み取らなければならないヌクレオチドの数を低減することによって、より有用なデータを各シーケンシング試行から得ることができる。加えて、結果は、複雑なバイオインフォマティクス分析を必要とすることなく単に計数することができる。加えて、本方法が必要とする標的核酸分子の加工がより少ないため、このような加工によって導入されるバイアスを低減するかまたはなくすことができる。例えば、一部の現行方法では、例えば標的がRNA(例えばmRNAおよび/またはmiRNAなど)である場合、方法は、典型的には、試料からRNAを単離または抽出するステップ、それをRT−PCRに供するステップ、RNAをライゲートするステップ、またはそれらの組合せを採用する。従来の方法はまた、望ましくない核酸分子、例えばtRNAおよび/またはrRNAなどを除去するために枯渇または分離ステップを必要とする場合もある。開示された方法の一部の実施形態では、このようなステップは必要ではない。結果として、本方法は、別の状況では検出シーケンシングに適さない様々な試料タイプを分析することを許容する。加えて、これにより試料からのRNAの損失がより少なくなることから、より正確な結果が提供される。
本方法は、DNAまたはRNA、例えば1つまたは複数の遺伝子の融合、挿入または欠失などの突然変異、タンデムリピート、単一ヌクレオチド多形(SNP)、単一ヌクレオチドバリアント、およびDNAメチル化のステータスを検出するのに使用することができる。一例において、本方法は、標的核酸分子中の点突然変異を検出するのに使用される。このような突然変異は、公知の突然変異であってもよいし、または開示された方法を使用して新たに発見された突然変異であってもよい。例えば、本方法は、単一の標的核酸分子中の、または複数の標的核酸分子中の、1つまたは複数の点突然変異(例えば少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10個またはそれより多くの点突然変異、例えば1、2、3、4、5、6、7、8、9、10個の異なる点突然変異)を検出するのに使用することができる。一部の例において、それぞれの異なる点突然変異は、異なる標的核酸分子とみなされる(例えば、図10は、配列番号1が、野生型BRAF遺伝子と5つの異なるその突然変異体とを含む6つの異なる標的核酸分子(配列番号2〜7)を検出するのに使用できることを示す)。一部の例において、本方法は、2つまたはそれより多くの異なる標的核酸分子中の1つまたは複数の点突然変異を検出するのに使用することができる。本方法は、核酸プローブを使用し、この核酸プローブは、本明細書では、フランキング配列を含むヌクレアーゼ保護プローブ(NPPF)、同様に相補的フランキング配列(CFS)と称される。NPPFおよびCFSの使用は、多重性を許容し、一部の例において、シーケンシングされた標的核酸分子の化学量論を大まかに保存するが、これはなぜなら、CFSは、化学量論を有意に変更することなく、増幅のための万能なプライマー結合部位を許容し、シーケンシングアダプターおよび実験的タグの付加(例えば多重性を増加させるために、3’または5’末端のいずれか、または両方の末端に)を許容するためである。CFSは万能であり得るため、CFSがライゲートされるいずれの標的核酸分子を増幅するのに同じプライマーを使用することができ、したがって多重性がもたらされ、一部の例において化学量論が大まかに保存される。
加えて、プライマー(これは、CFSにハイブリダイズする)は、CFSが最終的にライゲートされる標的核酸分子へのタグ(例えば多重性を増加させるための、3’または5’末端のいずれかにおける、または両方の末端における、標的そのものの全体をシーケンシングすることなく標的の同定を許容するための、または異なる患者もしくは異なる実験またはそれ以外からの試料を、1回のシーケンシング試行に合わせることを許容するための実験タグ、加えて、特定のシーケンシングプラットフォームに必要な配列の付着、および一部のシーケンシングプラットフォームのためのコロニー形成を許容するためのシーケンシングアダプター)の付加を許容する。シーケンシングライブラリーは、標的全体(または標的全体の多数の断片)というよりも目的の標的(またはライゲートした標的アンプリコン)の公知部分を含有するため、NPPFおよびCFSの使用はまた、分析される(例えば、シーケンシングされる)シーケンサーインプット(シーケンシングライブラリーとも称される)の複雑さも簡易化する。NPPFは、最終的にライゲートした標的から解離される(例えば、消化する、切断される、分離する、またはそれらの任意の組合せ)ため、最終的にシーケンシングされるのは、サロゲートとしてのNPPFではなくライゲートした標的(またはそのアンプリコン)である。ライゲートした標的(またはライゲートした標的のアンプリコン)のシーケンシングは、他のシーケンシング方法に必要となるものと比較してデータ分析を簡易化し、配列をゲノムに適合させ、標準的なシーケンシング方法から得られる複数の配列/遺伝子をデコンボリューションしなければならないのではなく、アルゴリズムを単にシーケンシングされたライゲートした標的を計数することのみに限定する。
一例において、本開示は、試料中の少なくとも1つの標的核酸分子(例えば少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも100、少なくとも500、少なくとも1000、少なくとも2000、または少なくとも3000個の標的核酸分子など)をシーケンシングするための方法を提供する。一部の例において、試料中の核酸分子を変性させるため、例えば、それに続く試料中のNPPFと標的核酸分子とのハイブリダイゼーション、加えてNPPFとその対応するCFSとのハイブリダイゼーションを許容するために、試料、例えば核酸(例えばDNAおよび/またはRNA)などの試料は加熱される。一部の例において、試料は、溶解した試料である(したがって、一部の例において、本方法は、試料を溶解することを含む)。一部の例において、試料は、固定された試料(例えばパラフィン包埋ホルマリン固定(FFPE)試料、ヘマトキシリンおよびエオシン染色された組織、またはグルタルアルデヒド固定組織など)である。例えば、標的核酸分子は、固定されていてもよいし、架橋されていてもよいし、または不溶性であってもよい。
一部の例において、開示された方法は、複数の試料中の少なくとも1つの標的核酸分子(例えば少なくとも2つの異なる標的核酸分子など)を同時または同時発生的にシーケンシングする。同時のシーケンシングは、同時に、または実質的に同じ時間に行われるシーケンシング、および/または同じシーケンシングライブラリーまたは同じシーケンシング反応で行われるシーケンシング、もしくは同じシーケンシングフローセルまたは半導体チップで実行される(例えば、同時発生の)シーケンシングを指す。一部の例において、事象は、互いに1マイクロ秒から120秒以内(例えば0.5から120秒以内、1から60秒以内、または1から30秒以内、または1から10秒以内)に起こる。一部の例において、開示された方法は、例えば(i)それぞれ異なる標的核酸分子に特異的な、少なくとも2つの異なるNPPFを使用して、(ii)複数の異なる標的核酸分子に特異的な1つのNPPF(例えば、図10は、配列番号1(これは、標的核酸分子の領域に相補的なNPPFの部分である)は、野生型BRAF遺伝子と5つの異なるBRAF突然変異体とを含む6つの異なる標的核酸分子(配列番号2〜7)を検出するのに使用できることを示す;KRASについても類似の例が示される)を使用することによって、または(iii)それらの組合せによって、試料中の2またはそれより多くの標的核酸分子をシーケンシングする(例えば同時または同時発生的に)。一例において、試料は、複数のNPPF(例えば少なくとも2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000、またはそれより多く)と接触し、各NPPFは、特定の標的核酸分子に特異的に結合する。例えば、10個の標的核酸分子がある場合、試料は、それぞれ10個の標的のうち1つに特異的な10個の異なるNPPFと接触させることができる。しかしながら、一部の例において、試料は、少なくとも1つのNPPF(例えば少なくとも2、3、4、5、10、15、20、25、50、75、100、200、300、500、1000、2000、3000、4000、5000個、またはそれより多く)と接触し、各NPPFは、少なくとも2つの(例えば少なくとも2、3、4、5、6、7、8、9、10個、またはそれより多くの)異なる標的核酸分子(例えば野生型遺伝子および野生型遺伝子の1つまたは複数の突然変異など)に特異的に結合する。一部の例において、試料は、それぞれ特定の標的核酸分子に特異的に結合する1つまたは複数のNPPFと接触し、さらに、それぞれ少なくとも2つの異なる標的核酸分子(例えば野生型遺伝子および野生型遺伝子の1つまたは複数の突然変異など、例えば図10を参照)に特異的に結合する1つまたは複数のNPPFと接触する。一例において、少なくとも1つのNPPFは、miRNA標的核酸分子に特異的であり、少なくとも1つのNPPFは、mRNA標的核酸分子に特異的である。一部の例において、少なくとも10個の異なるNPPFは、試料と共にインキュベートされる。しかしながら、一部の例において、単一の標的核酸分子に特異的な1つより多くのNPPF(例えば2、3、4、5、10、20個、またはそれより多く)、例えば同じ標的核酸の異なる領域に特異的なNPPFの集団、または標的核酸およびそれらのバリエーション(例えば突然変異または多形を有するものなど)に結合できるNPPFの集団などが使用できることが認識されている。例えば、低く発現される核酸標的は、より高いレベルで発現される核酸標的に比べてより多くのそれにハイブリダイズするNPPFを有する場合があり、例えば、4つのNPPFが低く発現される核酸標的にハイブリダイズし、単一のNPPFが高く発現される核酸標的にハイブリダイズする。したがって、NPPFの集団は、少なくとも2つの異なるNPPF集団(例えば2、3、4、5、10、20、または50個の異なるNPPF配列など)を含んでいてもよく、各NPPF集団(または配列)は、異なる標的核酸分子に特異的に結合する。
本方法は、試料を、フランキング配列を含む少なくとも1つのヌクレアーゼ保護プローブ(NPPF)と、NPPFが標的核酸分子に特異的に結合するかまたはハイブリダイズするのに十分な条件下で接触させるステップを含む。ハイブリダイゼーションは、第1の核酸分子(例えば、NPPF)と第2の核酸分子(例えば、核酸標的およびCFS)との間に安定で特異的な結合(例えば、塩基対合)が起こるように、2つの核酸分子間に十分な程度の相補性が存在する場合に起こるプロセスである。NPPF分子は、5’末端および3’末端に加えて、その間の標的核酸分子の全てまたは一部に相補的な配列を含む。核酸配列の5’末端は、末端残基の5’の位置がヌクレオチドと結合していないところである。核酸分子の3’末端は、末端残基の3’においてそれに結合したヌクレオチドがない末端である。これは、NPPFと標的核酸分子との特異的な結合またはハイブリダイゼーションを許容する。例えば、標的核酸分子の領域に相補的なNPPFの領域は、高い特異性で、標的核酸分子のその領域に結合するかまたはハイブリダイズする。NPPF分子はさらに、1つまたは複数のフランキング配列を含み、このフランキング配列は、NPPFの5’末端および/または3’末端にある。したがって、1つまたは複数のフランキング配列は、標的核酸分子に相補的な配列の5’、3’、または両方に配置される。各フランキング配列は、数個の連続したヌクレオチドを含み、核酸分子中に認められないが他の様式で試料中に存在する配列(例えば少なくとも12個の連続したヌクレオチドの配列など)が生成される。NPPFが5’末端および3’末端の両方にフランキング配列を含む場合、一部の例において、各NPPFの配列は、異なっており、互いに相補的ではない。一例において、NPPF(例えば一方もしくは両方のフランキング配列中、および/または標的核酸分子の全てもしくは一部に相補的な領域の配列中の)は、少なくとも1つのdUTP、例えば少なくとも2、少なくとも3、少なくとも4、または少なくとも5つのdUTP(例えば1、2、3、4、5、6、7、8、9、または10個のdUTP)を含む。一例において、NPPF中の「T」の全てが、「U」で置き換えられている。このような塩基の存在は、一本鎖NPPFを、後のステップで(例えば、ライゲートした標的からのNPPFの変性の後、ただしシーケンシングの前、例えばライゲートした標的の増幅の前またはその間に)ウラシルDNAデグリコシラーゼ(UDG)で分解または破壊することを可能にする。一例において、NPPF(例えば標的核酸分子の全てまたは一部に相補的な領域の配列中の、またはフランキング領域の配列中の)は、少なくとも1ヌクレオチドのミスマッチを含み、例えば、標的核酸分子に相補的ではないヌクレオチドを含む。例えば、図10で示されるように、配列番号1は、12位に「A」の代わりに「G」を含有し、配列番号8は、15位に「A」の代わりに「G」を含有し、配列番号17は、13位に「C」の代わりに「T」を含有する。一部の例において、ミスマッチは、フランキング配列中に存在しない。一部の例において、ミスマッチは、フランキング配列の2塩基以内に存在しない(すなわち、NPPFの標的核酸分子の全てまたは一部に相補的な領域の5’末端または3’末端の2塩基以内ではない)。一部の例において、ミスマッチしたヌクレオチドは、フランキング配列と標的核酸分子の領域に相補的なNPPFの領域との間のジャンクションに存在せず、例えば、このようなジャンクションから10、11、12、13、14、または15ヌクレオチドである。一部の例において、ミスマッチの存在は、NPPFを標的核酸分子と区別することを可能にする。
フランキング配列は、相補的フランキング配列(CFS)に相補的である。CFSは、増幅プライマーの少なくとも一部に相補的な万能なハイブリダイゼーション/増幅配列を提供する。一部の例において、CFSは、実験的タグ、シーケンシングアダプター、またはそれらの組合せを含んでいてもよい(またはそれらの付加を許容する)。一部の例において、少なくとも一方のフランキング配列は、少なくとも1つのdUTPを含む。一部の例において、NPPFは、それぞれ少なくとも1つのdUTPを有する2つのフランキング配列を含む。一部の例において、NPPFは、2つのフランキング配列を含むが、1つのみが少なくとも1つのdUTPを有する。一部の例において、NPPFは、少なくとも1つのdUTPを有する単一のフランキング配列を含む。一部の例において、dUTPの配置は、標的核酸分子の領域に相補的な配列に近接しており、例えば、標的核酸分子の領域に相補的な配列から1、2、3、4、5塩基離れている(例えば、上記配列の1、2、3、4、5塩基以内である)。一部の例において、dUTPの配置は、標的核酸分子の領域に相補的な配列から少なくとも2塩基(例えば少なくとも3、少なくとも4、または少なくとも5塩基)離れている。
本方法は、試料を、フランキング配列(CFS)に対する相補性を有する少なくとも1つの核酸分子と、CFSがNPPFのフランキング配列に特異的に結合するかまたはハイブリダイズするのに十分な条件下で接触させるステップをさらに含む。例えば、NPPFが5’−フランキング配列を有する場合、試料を、5’−フランキング配列に相補的な配列(5CFS)および5’末端リン酸を有する核酸分子と、5’−フランキング配列が5CFSに特異的に結合するのに十分な条件下で接触させる。同様に、NPPFが3’−フランキング配列を有する場合、試料を、3’−フランキング配列に相補的な配列(3CFS)を有する核酸分子と、3’−フランキング配列が3CFSに特異的に結合するのに十分な条件下で接触させる。一例において、3CFSおよび5CFSの少なくとも1つは、標的配列の捕獲、分離、回収、または単離を許容する捕獲部分を含む。当業者は、フランキング配列を保護するのに単一のCFSを使用する代わりに、複数のCFSを使用してフランキング配列を保護することができる(例えば、5’−フランキング配列を保護するのに複数の5CFSを使用することができる)ことを理解するであろう。一部の例において、標的核酸分子は、DNAであり、5CFSおよび3CFSは、DNAであるか、または5CFSは、DNAであり、3CFSは、RNAである。一部の例において、標的核酸分子は、RNAであり、5CFSは、DNAであり、3CFSは、RNAであるか、または5CFSは、RNAであり、3CFSは、RNAである。一部の例において、標的核酸分子は、RNAまたはDNAであり、5CFSおよび/または3CFSは、RNA−DNAハイブリッドオリゴであり、例えば5’塩基または5CFSの塩基および/または3’塩基または3CFSの塩基は、RNAであり、5CFSおよび3CFSの残りは、DNAである。一部の例において、1つまたは複数のCFSは、塩基への改変、またはCFSの3’もしくは5’末端への改変、例えば、ホスホロチオエート(phosphothiorate)結合、ロックド核酸(LNA)をもたらすヌクレオチド(例えば、2’酸素および4’炭素を接続する余分な架橋で改変されたリボース)、または鎖ターミネーター(例えば、ddCTPまたは転位したT塩基)などを含有する。
これにより、標的核酸分子(またはその一部)に加えてCFSに結合したNPPF分子が生成され、それによってハイブリダイゼーションで標的およびCFS上の相補的塩基に係合したNPPFの塩基を含む二本鎖分子が生成される。CFSは、それに続くステップで、ヌクレアーゼでの消化物からのその対応するフランキング配列にハイブリダイズし、したがってそれを保護する。一部の例において、各CFSは、その対応するフランキング配列の正確な長さを有する。一部の例において、CFSは、その対応するフランキング配列に完全に相補的である。しかしながら、当業者は、5’末端フランキング配列を保護する5CFSの3’末端または3’末端フランキング配列を保護する3CFSの5’末端は、これらの位置のそれぞれにおいて、例えばヌクレオチドミスマッチ、上記で論じられた改変、またはそれらの組合せなどの差を有していてもよいことを理解するであろう。
標的核酸分子およびCFSをNPPFに結合させた後、本方法はさらに、試料を、一本鎖(ss)核酸分子または核酸分子のss領域に特異的なヌクレアーゼ、例えばS1ヌクレアーゼなどと、相補的塩基にハイブリダイズしない核酸塩基を除去するのに十分な条件下で接触させるステップを含む。したがって、例えば、標的核酸分子またはCFSに結合していないNPPF、加えて未結合の一本鎖標的核酸分子、試料中の他のss核酸分子、および未結合のCFSが分解される。これにより、5CFS、3CFS、または両方、および標的核酸の一部にハイブリダイズした二本鎖付加物として存在するインタクトなNPPFを含む消化された試料が生成される。一部の例において、例えばNPPFがDNAで構成される場合、ヌクレアーゼは、エキソヌクレアーゼ、エンドヌクレアーゼ、またはそれらの組合せを含み得る。
その後、CFSを、標的核酸にライゲートすることができ、例えば5CFSの5’−リン酸を標的核酸分子の3’末端にライゲートし、3CFSの3’末端を標的核酸分子の5’末端にライゲートし、それによってライゲートした標的核酸分子(本明細書ではライゲートした標的またはcNPPFと称される)が生成される。一部の例において、ライゲーションに加えて、CFSを、ポリメラーゼ処理(例えば、DNAポリメラーゼ)に供し、例えば、ヌクレアーゼ処理中に除去された可能性があるヌクレオチドを置き換える。ポリメラーゼ処理は、例えば同じ反応容器で、ライゲーションと同時に実行してもよい。一部の例において、ポリメラーゼ処理は、ライゲーションの前に実行される。
二本鎖NPPF:ライゲートした標的核酸分子は、ss核酸分子に分離され(例えば、変性を促進する環境を作り出すこと、例えば加熱(例えば、緩衝液中で約95℃またはdH2O中で約50℃)、試料のpHを増加させること、または50%ホルムアミド/0.02%Tween(登録商標)界面活性剤での処理、またはこのような処理の組合せなどによって)、それによってssNPPFおよびssのライゲートした標的核酸分子の混合物が生成される。一例において、二本鎖NPPF:ライゲートした標的核酸分子は、水中の0.02%Tween(登録商標)界面活性剤中で50℃10分、3回洗浄することによって、ss核酸分子に分離される。一例において、二本鎖NPPF:ライゲートした標的核酸分子は、室温で50%ホルムアミド/0.02%Tween(登録商標)界面活性剤で洗浄することによって、ss核酸分子に分離される。一部の例において、二本鎖NPPF:ライゲートした標的のその対応するss核酸分子への分離は、例えば標的分子がRNAであり、NPPFがDNAであり、3CFSおよび5CFSがRNAである場合、DNアーゼでの処理を含む。このような例において、NPPFは、ライゲートしたRNA標的分子から分解、切断、消化、分離することができ、またはそれらの組合せを行ってもよく、それによって遊離したssのライゲートした標的のさらなる分析(例えば増幅、逆転写、シーケンシング、またはそれらの組合せなど)が可能になる。一部の例において、二本鎖NPPF:ライゲートした標的のその対応するss核酸分子への分離は、例えば標的分子がDNAであり、NPPFがRNAであり、3CFSおよび5CFSがDNAである場合、RNアーゼでの処理を含む。このような例において、NPPFは、ライゲートしたDNA標的分子から分解、切断、消化、分離することができ、またはそれらの組合せを行ってもよく、それによって遊離したssのライゲートした標的のさらなる分析(例えば増幅、シーケンシング、またはそれらの組合せなど)が可能になる。ssのライゲートした標的核酸分子は、任意選択で、例えばそれを捕獲することによって、例えばハイブリダイゼーションまたは捕獲部分(例えば、5CFSまたは3CFS上の)の使用によって回収される。一部の例において、ssNPPFおよびssのライゲートした標的核酸分子の混合物は、少なくとも1つのdUTP(例えば2、3、4、5、または6つまたはそれより多くのdUTP)を有するssNPPFを切断または破壊するのに十分な条件下で、ウラシルDNAデグリコシラーゼ(UDG)と共にインキュベートされる。
本方法は、例えばNPPF、5CFSまたは3CFSの使用によって、シーケンシングされる標的の捕獲または回収を可能にする1つまたは複数のステップを含んでいてもよい。例えば、図2B〜2Dで示されるように、このような捕獲は、ハイブリダイゼーション中に、ヌクレアーゼ消化後に、またはハイブリダイゼーション後に、ただしライゲーションの前に行うことができる。図2Aおよび2Cは、捕獲がヌクレアーゼ消化の後になされる例を示す。さらに、例えばライゲーション後に、追加の捕獲ステップが含まれていてもよい。一例において、NPPF、5CFSまたは3CFSは、固体基板(例えばマルチウェルプレートなど)に付着しており、それにより、捕獲される分子を、それらが係留されたNPPF、5CFSまたは3CFSにハイブリダイズさせることを可能にする。別の例において、捕獲部分(例えば標的、NPPF、5CFSまたは3CFSに付着した粒子または標識など)を使用して、捕獲部分を含有する分子に付着またはハイブリダイズした分子を、試料の他の構成要素から物理的に分離することを可能にする。捕獲方法に応じて、このような方法は、固体捕獲部分を収集するための遠心分離、磁気ビーズの捕獲、固体支持体への結合またはハイブリダイゼーション、ろ過などを含んでいてもよい。加えて、このような捕獲ステップは、捕獲された核酸分子を洗浄することを含んでいてもよい(それによって捕獲されていない分子、例えばハイブリダイズしていないNPPFおよびハイブリダイズしていないCFSなどを、分離または除去することができる)。このような方法は、例えばマルチウェルプレートのウェルまたは単回反応用の管もしくは容器などの固体支持体から捕獲された核酸分子を放出させることを含んでいてもよいし、または捕獲された核酸分子は、固体支持体に、または固体支持体中に付着されたままでもよい。一部の例において、このステップは、例えば容器または管の底部に標的核酸分子を捕獲するための遠心分離、および望ましくないまたは不必要な薬剤を除去するために洗浄することを含む。一部の例において、このステップは、磁気ビーズによる標的核酸分子の捕獲、および望ましくないまたは不必要な薬剤を除去するための洗浄を含む。一部の例において、このステップは、標的核酸分子を捕獲するためのろ過、および望ましくないまたは不必要な薬剤を除去するための洗浄を含む。このステップは、標的核酸分子を洗浄することを含んでいてもよく、この洗浄は、一部の例において、もはや必要でない薬剤(例えば、ヌクレアーゼ)を除去し、および/または標的核酸分子を別の溶液中に懸濁することを許容し、それにより、特定の方法の実施形態では、1つまたは複数の次のステップを容易にすることができる。
一部の例において、本方法の複数のステップ(例えば図2Aに示されるステップのうち2、3、または4つなど)が、同じ容器またはコンテナー中で実行される。例えば、開示された方法は、複数のステップにわたり同じ容器中に望ましい構成要素を留めつつ、望ましくないまたは不必要な構成要素を除去する(例えば、繰り返しの捕獲および洗浄ステップを使用して)。例えば、分析される試料は、容器中で溶解することができる。その容器に、適切なNPPFおよびCFSを添加し、その容器にヌクレアーゼを添加し、その容器中でds核酸分子を捕獲する(例えば、容器の底部に引き寄せられた磁気ビーズを用いて)。捕獲されたds核酸分子を洗浄して望ましくない薬剤を除去し、容器に望ましい緩衝液または試薬(例えば、リガーゼ緩衝液)を添加する。次いで容器中でssのライゲートした標的核酸分子を捕獲し、洗浄することができる。
ライゲートした標的核酸分子を、任意選択で、例えばPCR増幅を使用して増幅する。このような方法は、実験タグおよび/または配列アダプターをライゲートした標的に付加するため、および/またはライゲートした標的のコピー数を増加させるために使用することができる。ssのライゲートした標的核酸分子(またはそのアンプリコン)の少なくとも一部がシーケンシングされ、それによって試料中の少なくとも1つの標的核酸分子の配列が決定される。一部の例において、標的核酸分子は、RNAであり、本方法は、シーケンシングの前にそれらをDNAに逆転写することを含む。
ライゲートした標的は、1つまたは複数の増幅プライマーを使用して増幅することができ、それによってライゲートした標的アンプリコンが生成される。少なくとも1つの増幅プライマーは、標的にライゲートしたCFSに相補的な領域を含む。一部の例において、標的は、その5’末端における5CFSおよびその3’末端における3CFSにライゲートされ、2つの増幅プライマーが使用され、この場合、一方の増幅プライマーは、5CFSの領域に同一な領域を有し、他方の増幅プライマーは、3CFSの領域に相補的な領域を有する。一部の例において、標的は、それぞれその5’末端および3’末端における5CFSまたは3CFSのいずれかにライゲートされ、1つの増幅プライマーが使用され(例えば迅速増幅またはcDNA末端を使用して)、この場合、増幅プライマーは、5CFSまたは3CFSの領域に相補的な領域を有する。増幅プライマーの一方または両方は、実験タグおよび/または増幅中にライゲートした標的アンプリコンへのシーケンシングアダプターの付着を許容する配列を含んでいてもよく、一方または両方のプライマーを標識して、NPPFアンプリコンの標識付けを許容することができる。一部の例において、実験タグおよびシーケンシングアダプターの両方は、例えばライゲートした標的アンプリコンの逆の末端に付加される。例えば、このようなプライマーの使用により、ライゲートした標的アンプリコンの5’末端もしくは3’末端から、または3’末端および5’末端の両方から伸長する実験タグおよび/または配列アダプターが生成して、生じ得る多重性の程度を増加させることができる。実験タグは、試料、対象、または標的核酸配列の同定を許容する固有な核酸配列を含んでいてもよい。シーケンシングアダプターは、シーケンシングプラットフォーム上で得られたライゲートした標的アンプリコンの捕獲を許容する核酸配列を含んでいてもよい。一部の例において、プライマーは、シーケンシングの前に混合物から除去される。
ライゲートした標的またはライゲートした標的アンプリコン(またはそれらの一部)がシーケンシングされる。ライゲートした標的またはライゲートした標的アンプリコンをシーケンシングするための任意の方法を使用することができ、本開示は、特定のシーケンシング方法に限定されない。一部の例において、使用されるシーケンシング方法は、鎖終結シーケンシング、色素終結シーケンシング、パイロシーケンシング、ナノポアシーケンシング、または大規模並列シーケンシング(次世代シーケンシング(またはNGS)とも称される)であり、その例示としては、ThermoFisher Ion Torrent(商標)Personal Genome Machine(PGM(商標))、IlluminaブランドのNGSシーケンサー(例えば、MiSeq(商標)、HiSeq(商標))(またはそれ以外のものとしてSolexa(商標)シーケンシングから派生したもの)、およびRoche Life Sciencesより入手可能な454シーケンシングが挙げられる。一部の例において、単一分子シーケンシングが使用される。一部の例において、本方法はまた、得られた標的配列を配列データベースと比較して、例えば、標的突然変異が存在しているか、または存在していないかを決定することも含む。一部の例において、本方法は、例えばbowtie、bowtie2、またはTMAP配列アライナーを使用して、得られた各標的配列(例えば、野生型、SNP、新たに同定されたバリアントなど)の数を決定すること(例えば、計数すること)を含む。一部の例において、本方法は、適切なゲノム(例えば、標的核酸分子がヒト遺伝子である場合、適切なゲノムはヒトゲノムである)またはそれらの一部にシーケンシング結果をアラインすることを含む。一例において、本方法は、予期される標的配列のみにアラインすること、ただし予期される配列への適合と予期される配列内のあらゆる変化の両方を挙げることを含む。
II.標的核酸分子の直接シーケンシングの方法
試料中に存在する1つまたは複数の標的核酸分子の直接シーケンシングの方法が本明細書で開示される。一部の例において、同じ試料または同じアッセイで、少なくとも2つの異なる標的核酸分子が検出される。一部の例において、少なくとも2つの異なる試料またはアッセイで(例えば、異なる患者からの試料で)、同じ標的核酸分子が検出される。したがって、開示された方法は、多重化(例えば、単一試料中の複数の標的を検出すること)、ハイスループット(例えば、複数の試料中の標的を検出すること)、または多重化かつハイスループット(例えば、複数の試料中の複数の標的を検出すること)が可能である。
開示された方法において、NPPFのそれらの標的および対応するCFSへのハイブリダイゼーション、ヌクレアーゼ消化の後、CFSを標的にライゲートさせて(一部の例において、ポリメラーゼで処理して)、ライゲートした標的が生成される。次いでdsNPPF:ライゲートした標的を分離して(例えば、変性させ)、結果としてssNPPFおよびssのライゲートした標的を得る。一部の例において、ssのライゲートした標的を、例えば3CFSまたは5CFS上の捕獲部分を使用することによって、回収または捕獲する(例えば、NPPFから単離する)。一部の例において、例えばCFSに相補的な(さらに、ライゲートした標的に実験タグおよび/または配列アダプターの取り込みを可能にする配列を含んでいてもよい)領域を有するプライマーを使用することによって、ssのライゲートした標的を増幅する。次いでこのssのライゲートした標的を直接的にシーケンシングすることができる(またはそのアンプリコンをシーケンシングすることができる)。一部の例において、開示された方法は、例えば変動が20%以下、15%以下、10%以下、9%以下、8%以下、7%以下、6%以下、5%以下、4%以下、3%以下、2%以下、1%以下、0.5%以下、または0.1%以下、例えば0.001%〜5%、0.01%〜5%、0.1%〜5%、または0.1%〜1%などの、試験試料中と同様の類似した相対的な量の核酸分子である、シーケンシングされた核酸分子を提供する。
図1Aおよび1Bは、例示的なNPPFを示す概略図である。図1Aで示されるように、少なくとも一方のフランキング配列を有するヌクレアーゼ保護プローブ(NPPF)100は、標的核酸配列(例えば、標的核酸配列の少なくとも一部)に特異的に結合する(例えばハイブリダイズする)配列を含む領域102を含む。標的核酸配列に特異的に結合する(例えばハイブリダイズする)配列を含む領域102、またはフランキング配列104、106、は、計画的なヌクレオチドミスマッチを含んでいてもよく(すなわち、ヌクレオチドは、それぞれ標的配列中またはCFS中の対応するヌクレオチドに相補的ではなく)、それにより例えば標的分子からNPPFを区別することを可能にする。標的核酸配列は、DNA(例えば、ゲノムDNAまたはcDNA)もしくはRNA(例えばmRNA、miRNA、tRNA、siRNAなど)、または両方であってもよい。NPPFは、1つまたは複数のフランキング配列104および106を含む。図1Aは、5’−フランキング配列104および3’−フランキング配列106の両方を有するNPPF100を示す。しかしながら、NPPFは、一部の例において、1つのみのフランキング配列(例えば、104または106の1つのみ)を有していてもよい。一部の例において、NPPF100は、例えばフランキング配列104、106の少なくとも1つ中に、少なくとも1つのdUTPを含み、それにより例えばNPPF100の分解を許容することができる。図1Aは、単一の核酸分子である例示的なNPPF100を示す。図1Bは、一緒にライゲートできない2つの別個の核酸分子128、130で構成される例示的なNPPF120を示す。例えばNPPF100が100merである場合、NPPF120は、2つの50merであってもよい。図1Aに示されるNPPF100のように、NPPF120は、標的核酸配列(例えば、標的核酸配列の少なくとも一部)に特異的に結合する(例えばハイブリダイズする)配列、および1つまたは複数のフランキング配列124および126を含む領域122を含む。2つの別個の核酸分子で構成されるNPPF(図1B)の使用は、不完全なヌクレアーゼ消化によるバックグラウンドシグナルを減少させるのに使用することができる。
図2Aは、NPPF202を使用して核酸分子をシーケンシングするための開示された方法の実施形態の概説を示す概略図である。ステップ1で示されるように、試料(例えば、試料崩壊緩衝液で処理済みの(例えば、溶解するかまたはそれ以外の方法で処理して核酸を接近可能にした)標的核酸200を含有することがわかっているかまたはその疑いのある試料など)は、第1の標的核酸200(例えば標的DNAまたはRNAなど)に特異的に結合する少なくとも1つのNPPFを含む、1つまたは複数のフランキング配列(NPPF)202(ここでは5’および3’−フランキング配列の両方、すなわちそれぞれ204および206と共に示される)を有する複数のヌクレアーゼ保護プローブと接触させるかまたはインキュベートする。一部の例において、少なくとも1つのNPPF202は、複数の標的核酸分子、例えば特定の遺伝子の野生型およびバリアント配列など(例えば、図10を参照)に結合することができる。この反応はまた、第2の標的核酸(または複数の追加の標的核酸分子)に特異的に結合する他のNPPFなども含んでいてもよい。一例において、本方法は、それぞれの固有な標的核酸分子に特異的になるように設計された1つまたは複数の異なるNPPFを使用する。したがって、100個の異なる核酸標的(例えば、遺伝子または遺伝子発現産物)の測定は、少なくとも100個の異なるNPPFを使用することができ、ここで標的1つ当たり少なくとも1つのNPPFが特異的である(例えば標的1つ当たり数個の異なるNPPF)。別の例において、本方法は、複数の標的核酸分子、例えば野生型遺伝子およびそれらのバリエーションに特異的になるように設計された1つまたは複数の異なるNPPFを使用する。したがって、複数の異なる核酸標的の測定は、単一のNPPFを使用することができる。一部の例において、これらの2つのタイプのNPPFの組合せは、単一の反応で使用される。したがって、本方法は、少なくとも2つの異なるNPPF、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも25、少なくとも50、少なくとも75、少なくとも100、少なくとも200、少なくとも500、少なくとも1000、少なくとも2000、または少なくとも2000個の異なるNPPF(例えば、2から500、2から100、5から10、2から10、2から20、100から500、100から1000、500から5000、または1000から3000個の異なるNPPF)を使用することができる。加えて、一部の例において、複数のNPPFは、単一の標的核酸分子に特異的な1つより多くの(例えば2、3、4、5、10、20、50個またはそれより多くの)NPPF(これは、NPPFのタイル状のセット(tiled set)と称される)を含んでいてもよいことが理解されるであろう。この反応はまた、フランキング配列(CFS)208、210に相補的な核酸分子も含む。したがって、NPPFが5’−フランキング配列204を有する場合、この反応は、5’−フランキング配列に相補的な配列(5CFS)208を含み、NPPFが3’−フランキング配列206を有する場合、この反応は、3’−フランキング配列に相補的な配列(3CFS)210を含む。一部の例において、5CFS208は、5’末端リン酸を有し(例えば、図3を参照)、それにより後のステップにおける標的200へのライゲーションが可能になる。一部の例において、CFSの少なくとも1つは、望ましい時間で標的の回収を許容する捕獲部分212を含む。捕獲部分212は、5CFS208で示されているが、それが存在する実施形態では、代替として3CFS210、NPPF202または標的200上に存在していてもよいことが理解されるであろう。当業者は、CFSの配列は存在するフランキング配列に応じて様々であることを理解するであろう。加えて、フランキング領域が保護されていることを確認するのに、1つより多くのCFSを使用することができる(例えば、単一のフランキング配列の異なる領域に結合する少なくとも2つのCFSを使用することができる)。CFSは、天然または天然にはない塩基を含んでいてもよい。
図3は、5CFS208、標的200、および3CFS208の方向(例えば、各分子の5’および3’末端に関する)のさらなる詳細を示す。図2に関して上記で論じられたように、図3の捕獲部分212は任意選択であるか、または3CFS210または標的200上にあってもよい。試料、NPPFおよびCFSを、NPPFがそれらそれぞれの標的核酸分子に特異的に結合する(例えばハイブリダイズする)のに十分な条件下で、さらに、CFSがNPPFフランキング配列上のそれらの相補的配列に結合する(例えばハイブリダイズする)のに十分な条件下でインキュベートする。一部の例において、CFS208、210は、NPPF202より過剰に添加され、例えばNPPFより少なくとも2倍多くのCFS(過剰モル量で)、例えば、NPPFより、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、少なくとも10倍、少なくとも20倍、少なくとも40倍、少なくとも50倍、または少なくとも100倍多くのCFSが添加される。一部の例において、NPPF202は、試料中の総核酸分子より過剰に添加され、例えば、試料中の総核酸分子より少なくとも50倍多くのNPPF(過剰モル量で)、例えば、試料中の総核酸分子より、少なくとも75倍、少なくとも100倍、少なくとも200倍、少なくとも500倍、または少なくとも1000倍多くのNPPFが添加される。実験上の便宜のために、測定された最も豊富な核酸標的に関して、その核酸標的に対する少なくとも50倍多くのNPPF、例えば少なくとも100倍過剰のNPPFが存在するようにカクテルを作製するために、類似の濃度の各NPPFを含めることができる。使用される全てのNPPFの実際の過剰な量および総量は、標的核酸標的にハイブリダイズしない全てのNPPFを破壊するヌクレアーゼ(例えば、S1ヌクレアーゼ)の能力によってのみ制限される。一部の例において、この反応を加熱し、例えば50℃で一晩インキュベートする(例えば16時間)。
図2Aのステップ2で示されるように、結合/ハイブリダイゼーション反応を生じさせた後、ss核酸分子、例えば未結合の核酸分子など(例えば未結合のNPPF、未結合のCFS、および未結合の標的核酸分子など、またはこのような分子の一本鎖のままの部分、例えば標的核酸分子のNPPFに結合していない部分など)を除去(または消化する)するのに十分な条件下で、試料を一本鎖(ss)核酸分子に特異的な試薬(例えばヌクレアーゼなど)と接触させる。これにより、dsNPPF/標的のハイブリダイズした複合体(または二重鎖)214が生成される。図2Aで示されるように、試料をss核酸分子に特異的なヌクレアーゼと共にインキュベートすることにより、存在する全てのss核酸分子の分解が起こり、結合したNPPF、ならびにCFSおよび標的核酸分子などのインタクトな二本鎖核酸分子が残る。例えば、この反応は、S1ヌクレアーゼと共に50℃で1.5時間インキュベートすることができる(加水分解が、他の温度で起こる可能性があり、他の期間で行ってもよく、部分的に、必要な時間および温度は、加水分解に必要なヌクレアーゼの量および核酸の量、加えて保護されている二本鎖領域のTmに応じて決まる)。
図2Aのステップ3で示されるように、NPPF/標的複合体214(これは、ライゲーション前のある時点で捕獲または回収され、図2B〜2Dを参照すれば、ハイブリダイズしていない材料が除去される)は、標的配列200(これは、DNAまたはRNAであってもよい)をCFS(例えば、5CFS208、3CFS210、または両方)にライゲートさせるライゲーション条件に晒され、それによってライゲートした標的216が生成される。標的配列およびCFSを共有結合で合体させることが可能なあらゆるリガーゼ、例えばT4 DNAリガーゼ、T4 RNAリガーゼ、またはTaqリガーゼなどを、使用することができる。使用されるリガーゼは、標的配列に最も近いCFSに存在するヌクレオチド(リボヌクレオチドまたはデオキシリボヌクレオチド)によって決めることができる。図4は、ライゲートされるエレメントのさらに詳細な図を示す。5CFS208は、標的200の3’末端にライゲートすることができる5’末端リン酸を含んでいてもよい。3CFS210は、標的の5’末端リン酸にライゲートすることができる3’末端(例えば3’末端ヌクレオチドなど)を含んでいてもよい。3CFS210は、オリゴヌクレオチドの5’末端の近くに(ただし5’末端にではなく)、ストレプトアビジンビーズまたは他の固体支持体への結合を可能にする内部ビオチン化Tを含んでいてもよい。代替として、5CFS208は、オリゴヌクレオチドの3’末端の近くに(ただし3’末端にではなく)、ストレプトアビジンビーズまたは他の固体支持体への結合を可能にする内部ビオチン化Tを含んでいてもよい。2つのCFSが示されているが、単一のCFSの実施形態もこの開示により予期される。1つのみのフランキング配列がNPPFに存在する場合、1つのみのCFSがNPPF/標的複合体において結合することになり、標的が1つのみのCFSにライゲートする。CFSは、DNAまたはRNA(または両方のヌクレオチドタイプの混合物)であってもよい。CFSまたは標的がDNAである場合、DNAへのライゲーションのための5’末端リン酸ドナーは、リボヌクレオチドであることはできない。一例において、標的がRNAである場合、5CFS208は、DNAまたはRNAであり、3CFS210は、RNAである。一例において、標的がDNAである場合、5CFS208は、DNAであるか(または5CFS208の少なくとも5’末端ヌクレオチドは、標的の3’末端にライゲートするdNTPであるか)またはRNAであり、3CFS210は、RNAである。
一部の例において、図2Aのステップ3はまた、ライゲーションに加えて、重合ステップも含む。例えば、重合は、ライゲーションと同時に(例えば、同じ反応で)、またはライゲーションの前に実行することができる。これは、ヌクレアーゼステップ中にCFSまたは標的から偶発的に除去されたヌクレオチドを回復させることができる。一部の例において、使用されるポリメラーゼは、有意な鎖置換活性または5’−3’エキソヌクレアーゼ能力を有さない(これは、単に失われた塩基を置き換えるというよりプローブにハイブリダイズした標的を除去して置き換えることができる)。一例において、例えばT4またはT7 DNAポリメラーゼまたはエキソヌクレアーゼ欠損熱安定性ポリメラーゼなどのDNAポリメラーゼが、dNTPの存在下で使用される。一例において、ポリメラーゼは、Taqポリメラーゼではない(エキソヌクレアーゼ活性を失っていない限り)。一例において、例えばE.coliのRNAポリメラーゼなどのRNAポリメラーゼが、rNTPの添加を伴い使用される。RNAポリメラーゼが使用される場合、本方法は、逆転写ステップをさらに含んでいてもよい(例えば、以下で論じられるライゲートした標的216のPCR増幅のときに)。一部の例において、例えば標的がDNAおよびRNAを含む場合、DNAポリメラーゼおよびRNAポリメラーゼの両方が使用される。
図2Aのステップ4で示されるように、CFSを標的にライゲートした後、ライゲートした標的216からNPPF202を分離する。すなわち、NPPF/標的複合体214(例えば、二本鎖核酸分子)は、2つの一本鎖核酸分子、NPPF202およびライゲートした標的216に分離される。一部の例において、NPPF202をDNアーゼで処理し、それによってライゲートした標的216からNPPF202を分離することを可能にする。このような例において、NPPF202は、DNAであってもよく、標的200は、RNAであってもよく、5CFS208は、RNAであってもよく、3CFS210は、RNAであってもよい。一部の例において、NPPF202をRNアーゼで処理し、それによってライゲートした標的216からNPPF202を分離することを可能にする。このような例において、NPPF202は、RNAであってもよく、標的200は、DNAであってもよく、5CFS208は、DNAであってもよく、3CFS210は、DNAであってもよい。このステップはまた、ライゲートしていない核酸分子(例えば、ライゲートしていないCFS)を除去することもできる。例えば、この反応物を、ライゲートした標的216からNPPF202を解離させる条件下で加熱するかまたはpHを変更することができ(例えば、塩基性pHを有する反応物が得られるように)、結果として一本鎖NPPF202および一本鎖のライゲートした標的216の混成集団が生じる。一部の例において、反応物にDNアーゼを添加して、DNAで構成されるNPPF202を、分解、消化、切断、分離することができ、またはそれらの任意の組合せを行ってもよく、それにより、ライゲートした標的216(これは、この例においてRNAであり得る)をNPPF202から遊離または分離させることが許容される。一部の例において、反応物にRNアーゼを添加して、RNAで構成されるNPPF202を、分解、消化、切断、分離することができ、またはそれらの任意の組合せを行ってもよく、それにより、ライゲートした標的216(これは、この例においてDNAであり得る)をNPPF202から遊離または分離させることが許容される。一部の例において、ライゲートした標的216は、CFS上の捕獲部分212を使用することによってこの混合物から分離される。本明細書に記載される捕獲方法を使用して、ライゲートした標的216を捕獲することができる。例えば捕獲部分212がビーズである場合、ライゲートした標的216は、遠心分離を使用して回収することができる。捕獲部分212が金属ビーズである場合、ライゲートした標的216は、磁石を使用して回収することができる。捕獲部分212がカルボキシル基を含む場合、ライゲートした標的216は、適切にアミンで標識された固体基板を使用して捕獲することができる。ライゲートした標的216の捕獲後、反応物の残り(例えば、NPPF202)を除去することができる(例えば、洗浄することによって)。一部の例において、ライゲートした標的216は、ろ過を使用して捕獲される。
図2Aのステップ5で示されるように、次いで単離されたライゲートした標的216(またはそのアンプリコン)は、シーケンシングされる。一部の例において、複数のライゲートした標的は、並行して、例えば同時または同時発生的にシーケンシングされる。したがって、この方法を使用して、複数のライゲートした標的配列をシーケンシングすることができる。
任意選択で、ライゲートした標的216を、シーケンシングの前に増幅(例えば、PCRを使用して)、洗浄するか、または両方を行う。一部の例において、例えば少なくとも一方のフランキング配列(例えば、図1Aの104、106)、または捕獲配列(例えば、図1Aの102)がdUTPを含む場合(図5を参照)、NPPF202はウラシルDNAデグリコシラーゼ(UDG)で分解される。このような分解は、増幅の前または増幅中に行うことができる。一部の例において、例えば標的がRNAである場合、逆転写ステップが増幅の一部として含まれていてもよい。したがって、得られたライゲートした標的アンプリコン226を次いで、シーケンシングすることができる。図5は、PCRプライマーまたはプローブを矢印として示す。PCRプライマーまたはプローブは、1つまたは複数の実験タグ222、224および/またはシーケンシングアダプター218、220(例えば、それにより、特定のシーケンシングプラットフォームによりライゲートした標的のシーケンシングを可能にするものであり、したがってこのようなアダプターは、シーケンシングチップ上の捕獲配列に相補的である)を含んでいてもよい。PCRプライマー/プローブの少なくとも一部は、5CFS208および/または3CFS210に特異的である。一部の例において、プライマーの濃度は、ライゲートした標的216より過剰であり、例えば少なくとも10,000倍、少なくとも50,000倍、少なくとも100,000倍、少なくとも150,000倍、少なくとも200,000倍、少なくとも400,000倍、少なくとも500,000倍、少なくとも600,000倍、少なくとも800,000倍、または少なくとも1,000,000倍過剰である。一部の例において、反応物中におけるプライマー208の濃度は、少なくとも200nM(例えば少なくとも400nM、少なくとも500nM、少なくとも600nM、少なくとも750nM、または少なくとも1000nMなど)である。
図2B〜2Dで示されるように、ライゲーション前の時点(例えば、図2Aのステップ3)で、それに付着/ハイブリダイズした標的(図2Aの200)および他の分子が回収または捕獲され(ステップ320)、したがって試料中の残存する薬剤(例えば、ハイブリダイズしていない材料)の除去、および新しい試薬の添加が可能になる。加えて、標的の捕獲は、それに続く標的にハイブリダイズした、またはそれ以外の方法で付着した核酸分子の洗浄(例えば残留した酵素を不活性化または除去するために)を可能にする。
一例において、標的は、ハイブリダイゼーション時に回収または捕獲される(図2B)。図2Bで示されるように、任意選択の変性300後、標的を含有する試料を、ハイブリダイゼーション310を許容する条件下でNPPFおよびCFSと共にインキュベートし、それによってハイブリダイズした複合体を産生する。このような例では、標的を、ハイブリダイズするNPPF、およびNPPFにハイブリダイズすることができるCFSと共に、得られたハイブリダイズした複合体320の捕獲を可能にする材料を含有する固体支持体の存在下でインキュベートする。例えば、3CSF、5CSF、および/またはNPPF上に存在する捕獲部分(例えば、図2Aの212)は、固体支持体として利用することができる。例えば捕獲部分がビーズまたはプレートである場合(例えば、カルボキシ−アミン結合、例えばCFS上のアミノ基およびビーズ上のカルボキシなどを使用してCFSに付着したもの)、固体支持体は、ビーズまたはプレートである。このケースにおいて、捕獲部分/固体支持体は、ハイブリダイズした複合体が固体支持体に結合することを可能にする(これはなぜなら、例えば、NPPFは、固体支持体に付着したCFSにハイブリダイズし、標的および他のCFSは、NPPFにハイブリダイズするためである)。本方法は、ハイブリダイゼーション後に洗浄ステップを含んでいてもよい。それに続くステップ、例えばヌクレアーゼ消化330、洗浄340、ライゲーション350、UDG消化370(任意選択であり、NPPFがdUTPを含む場合のみ)、および/またはPCR増幅380などの1つまたは複数は、固体支持体の存在下で行うことができ、それにより、試薬を除去したり捕獲された標的に添加したりすることが可能になる。
一例において、標的は、ヌクレアーゼ処理後に(例えば、図2Aのステップ2の後に)、ただしライゲーション前に(例えば、図2Aのステップ3の前に)回収または捕獲される(図2C)。図2Cで示されるように、任意選択の変性400、ハイブリダイゼーション410、およびヌクレアーゼ消化430の後、NPPF/標的複合体(図2Aの214)が産生され、NPPF/標的複合体は、ステップ420で試料混合物から回収される。一部の例において、NPPF/標的複合体は、NPPF/標的二重鎖をss核酸分子に分離することなく、CFS上の捕獲部分を使用することによって回収される。例えば、3CSF、5CSF、および/またはNPPF上に存在する捕獲部分(例えば、図2Aの212)は、固体支持体として利用することができる。例えば捕獲部分がビーズまたはプレートである場合(例えば、カルボキシ−アミン結合、例えばCFS上のアミノ基およびビーズ上のカルボキシなどを使用してCFSに付着したもの)、固体支持体は、ビーズまたはプレートである。このケースにおいて、捕獲部分/固体支持体は、NPPF/標的複合体の一部であり、その捕獲または回収が可能になる。本方法は、回収後に洗浄ステップ440を含んでいてもよい。それに続くステップの1つまたは複数、例えばライゲーション450、洗浄460、UDG消化470(任意選択であり、NPPFがdUTPを含む場合のみ)、および/またはPCR増幅480などは、固体支持体の存在下で行うことができ、それにより、試薬を除去したり捕獲された標的に添加したりすることが可能になる。
一例において、標的は、ハイブリダイゼーション後に(例えば、図2Aのステップ1の後に)、ただしヌクレアーゼ消化の前に(例えば、図2Aのステップ2の前に)回収または捕獲される(図2D)。図2Dで示されるように、任意選択の変性500およびハイブリダイゼーション510の後、ハイブリダイズした複合体が産生され、得られたハイブリダイズした複合体は、ステップ520で試料混合物から回収される。一部の例において、ハイブリダイズした複合体は、CFS上の捕獲部分を使用することによって回収される。例えば、3CSF、5CSF、および/またはNPPF上に存在する捕獲部分(例えば、図2Aの212)は、固体支持体として利用することができる。例えば捕獲部分がビーズまたはプレートである場合(例えば、カルボキシ−アミン結合、例えばCFS上のアミノ基およびビーズ上のカルボキシなどを使用してCFSに付着したもの)、固体支持体は、ビーズまたはプレートである。このケースにおいて、捕獲部分/固体支持体は、ハイブリダイズした複合体の一部であり、その捕獲または回収が可能になる。本方法は、回収後に洗浄ステップを含んでいてもよい。それに続くステップ、例えばヌクレアーゼ消化530、ライゲーション550、洗浄540、560、UDG消化570(任意選択であり、NPPFがdUTPを含む場合のみ)、および/またはPCR増幅580などの1つまたは複数は、固体支持体の存在下で行うことができ、それにより、試薬を除去したり捕獲された標的に添加したりすることが可能になる。
A.例示的なハイブリダイゼーション条件
NPPFまたは複数のNPPFが、標的核酸分子、例えば対象からの試料中に存在するDNAおよびRNAなどに特異的にハイブリダイズする、加えてフランキング配列に相補的なCFSに特異的にハイブリダイズするのに十分な条件が、本明細書で開示される。一部の例において、複数のNPPFは、少なくとも2、少なくとも5、少なくとも10、少なくとも20、少なくとも100、少なくとも500、少なくとも1000、または少なくとも3000個の(例えば2から5000、2から3000、10から1000、50から500、25から300、50から300、10から100、50から100、500から1000、または1000から5000個の)固有なNPPF配列を含む。
ハイブリダイゼーションは、二重鎖分子(ハイブリダイゼーション複合体とも称される)を形成する相補的一本鎖DNA、RNA、またはDNA/RNAハイブリッドの能力である。例えば、他の物質または分子への非特異的なハイブリダイゼーションを最小化しながら、選択されたストリンジェンシーの条件下における核酸(例えば、NPPF)の別の核酸(例えば、標的DNAまたは標的RNAまたはCFS)へのハイブリダイズを可能にする特徴(例えば長さ、塩基組成、および相補性の程度など)は、本開示に基づき決定することができる。「特異的にハイブリダイズする」および「特異的に相補的な」は、第1の核酸分子(例えば、NPPF)と第2の核酸分子(例えば核酸標的、例えばDNAもしくはRNA標的、またはCFSなど)との間で安定で特異的な結合が起こるような十分な程度の相補性を示す用語である。第1および第2の核酸分子は、必ずしも100%相補的でなくても、特異的にハイブリダイゼーション可能である。また特異的なハイブリダイゼーションは、本明細書では「特異的な結合」とも称される。特定の程度のストリンジェンシーをもたらすハイブリダイゼーション条件は、ハイブリダイゼーション方法の性質およびハイブリダイズする核酸配列の組成物および長さに応じて様々となる。一般的に、ハイブリダイゼーションの温度およびハイブリダイゼーション緩衝液のイオン強度(例えばNa+濃度など)が、ハイブリダイゼーションのストリンジェンシーを決定する。特定の程度のストリンジェンシーを達成するためのハイブリダイゼーション条件に関する計算は、Sambrookら、(1989年)Molecular Cloning、第2版、Cold Spring Harbor Laboratory、Plainview、NY(9および11章)で論じられている。
以下のセクションIIIで、NPPFの特徴をより詳細に論じる。典型的には、NPPFの領域は、選択されたストリンジェントなハイブリダイゼーション条件下におけるそのハイブリダイゼーションを可能にする、その対応する標的核酸分子に対する十分な相補性を有する核酸配列(例えば、図1A、102)、加えて、選択されたストリンジェントなハイブリダイゼーション条件下におけるそのハイブリダイゼーションを可能にする、その対応するCFSに対する十分な相補性を有する領域(例えば、図1A、104、106)を有する。一部の例において、NPPFは、その標的配列に対する、少なくとも90%、少なくとも92%、少なくとも95%、少なくとも98%、少なくとも99%または100%の相補性を共有する。例示的なハイブリダイゼーション条件は、約37℃またはそれより高い温度(例えば約37℃、42℃、50℃、55℃、60℃、65℃、70℃、75℃、またはそれより高い、例えば45〜55℃または48〜52℃など)でのハイブリダイゼーションを含む。変更可能なハイブリダイゼーションの反応パラメーターは、なかでも特に、塩濃度、緩衝液、pH、温度、インキュベーション時間、例えばホルムアミドなどの変性剤の量およびタイプである。例えば、核酸(例えば、複数のNPPF)は、緩衝液(例えばNaCl、KCl、H2PO4、EDTA、0.05%Triton X−100、またはそれらの組合せを含有する緩衝液など)、例えば溶解緩衝液中、約10pMから約10nMの範囲の濃度(例えば約30pMから5nM、約100pMから約1nM、例えば1nMのNPPFなど)で試料に添加することができる。
一部の例において、NPPFは、試料中の対応する標的核酸分子より過剰に添加され、例えば、試料中の対応する標的核酸分子より少なくとも10倍、少なくとも50倍、少なくとも75倍、少なくとも100倍、少なくとも250倍、少なくとも1,000倍、少なくとも10,000倍、少なくとも100,000倍、少なくとも1,000,000倍、または少なくとも10,000,000倍の過剰モル量、またはそれより多くのNPPFが添加される。一例において、各NPPFは、少なくとも10pM、例えば少なくとも20pM、少なくとも30pM、少なくとも50pM、少なくとも100pM、少なくとも150pM、少なくとも200pM、少なくとも500pM、少なくとも1nM、または少なくとも10nMの最終濃度で試料に添加される。一例において、各NPPFは、約30pMの最終濃度で試料に添加される。別の例において、各NPPFは、約167pMの最終濃度で試料に添加される。さらなる例において、各NPPFは、約1nMの最終濃度で試料に添加される。さらなる例において、各NPPFは、1μl当たり、少なくとも約100,000,000、少なくとも300,000,000、または少なくとも約3,000,000,000コピーで試料に添加される。一部の例において、CFSは、NPPFより過剰に添加され、例えば少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、または少なくとも10倍の過剰モル量のCFSがNPPFに添加される。一例において、各CFSは、プローブの量の少なくとも約6倍、例えばプローブの量の少なくとも10倍または少なくとも20倍(例えばプローブの量の6から20倍)の最終濃度で試料に添加される。一例において、各CFS(例えば、5CFSおよび3CFS)は、少なくとも1nM、少なくとも5nM、少なくとも10nM、少なくとも50nM、少なくとも100nM、または少なくとも200nm、例えば1から100、5から100または5から50nMで添加される。例えば6つのプローブが各166pMで存在する場合、各CFSは、5から50nMで添加することができる。
ハイブリダイゼーションの前に、試料中の核酸を変性し、それらを一本鎖にし、ハイブリダイゼーション(例えば約95℃から約105℃で約5〜15分、例えば95℃で10分など)に利用可能にする。異なる変性溶液を使用することによって、この変性温度は、温度および緩衝液組成の組合せが一本鎖標的DNAもしくはRNAまたは両方の形成を引き起こす限り、変更することができる。次いで試料中の核酸および5CFS、3CFS、または両方を、約4℃から約70℃の範囲の温度(例えば、約37℃から約65℃、約42℃から約60℃、または約50℃から約60℃、例えば50℃など)で、約10分間から約72時間の間(例えば、少なくとも約1時間から48時間、約2から16時間、約6時間から24時間、約12時間から18時間、約16時間、または一晩、例えば2から20時間など)、複数のNPPFにハイブリダイズさせる。一例において、ハイブリダイゼーションは、50℃で2から20時間実行される。ハイブリダイゼーション条件は、使用される特定のNPPFおよびCFSに応じて様々となるが、NPPFが標的分子およびCFSに確実にハイブリダイズするように設定される。一部の例において、複数のNPPFおよびCFSは、少なくとも約37℃、少なくとも約40℃、少なくとも約45℃、少なくとも約50℃、少なくとも約55℃、少なくとも約60℃、少なくとも約65℃、または少なくとも約70℃の温度で試料と共にインキュベートされる。一例において、複数のNPPFおよびCFSは、約37℃、約42℃、または約50℃で試料と共にインキュベートされる。
一部の実施形態では、本方法は、核酸精製を含まない(例えば、核酸精製が、試料をNPPFおよびCFSと接触させる前に実行されないか、および/または核酸精製が、試料をNPPFおよびCFSと接触させた後に実行されない)。一部の例において、細胞溶解を除いて、試料の予備加工は必要ではない。一部の例において、細胞溶解および試料を複数のNPPFおよびCFSと接触させることは、逐次的に行われる。他の例において、介在するステップがまったくない一部の非限定的な例では、細胞溶解および試料を複数のNPPFおよびCFSと接触させることは、同時に行われる。
B.ヌクレアーゼでの処理
試料中の標的核酸およびCFSへのNPPFのハイブリダイゼーション後、試料は、ヌクレアーゼ保護手順に供される。NPPFにハイブリダイズした標的核酸分子およびCFS(NPPF上に5’および3’−フランキング配列の両方または一方のみがあるかどうかに応じて、1または2つのCFS)は、ヌクレアーゼによって加水分解されず、引き続きシーケンシングすることができる(任意選択で増幅することができる)。
ヌクレアーゼは、ホスホジエステル結合を切断する酵素である。エンドヌクレアーゼは、ヌクレオチド鎖中の内部ホスホジエステル結合を切断する(ヌクレオチド鎖末端のホスホジエステル結合を切断するエキソヌクレアーゼとは対照的に)。したがって、エンドヌクレアーゼ、エキソヌクレアーゼ、およびそれらの組合せは、開示された方法で使用することができる。エンドヌクレアーゼとしては、制限エンドヌクレアーゼまたは他の部位特異的なエンドヌクレアーゼ(これらは、配列特異的な部位でDNAを切断する)、DNアーゼI、膵臓RNアーゼ、Bal31ヌクレアーゼ、S1ヌクレアーゼ、マングビーンヌクレアーゼ、リボヌクレアーゼA、リボヌクレアーゼT1、RNアーゼI、RNアーゼPhyM、RNアーゼU2、RNアーゼCLB、小球菌ヌクレアーゼ、およびアプリン/アピリミジンエンドヌクレアーゼが挙げられる。エキソヌクレアーゼとしては、エキソヌクレアーゼIIIおよびエキソヌクレアーゼVIIが挙げられる。特定の例において、ヌクレアーゼは、一本鎖核酸に特異的であり、例えばS1ヌクレアーゼ、P1ヌクレアーゼ、マングビーンヌクレアーゼ、またはBAL31ヌクレアーゼなどである。これらの酵素の反応条件は当技術分野において周知であり、経験的に最適化することができる。
1つまたは複数のヌクレアーゼでの処理は、全てのss核酸分子(NPPFにハイブリダイズしない(したがってそれにより保護されない)試料中のRNAおよびDNA、標的核酸にハイブリダイズしないNPPF、およびNPPFにハイブリダイズしないCFSを含む)を破壊することができるが、例えばCFSおよび試料中に存在する標的核酸分子にハイブリダイズしたNPPFなどのds核酸分子を破壊しない。例えば、試料が細胞抽出物または溶解産物を含む場合、不要な核酸、例えば、mRNAまたはDNA核酸標的のケースにおいて核酸の標的配列の大部分を構成する、非標的ゲノムDNA(例えば変性したゲノムDNAなど)、tRNA、rRNA、mRNA、miRNA、および相補的NPPF配列にハイブリダイズしない標的核酸分子の一部(例えばオーバーハングなど)の1つまたは複数は、このステップで実質的に破壊することができる。一部の実施形態では、このステップは、およそ化学量論量の標的核酸/CFS/NPPF二重鎖をあとに残す。標的分子が、固着により生じる組織に架橋されている場合、NPPFは、架橋された標的分子にハイブリダイズし、一部の実施形態では、逆の架橋、またはそれ以外の方法でそれに架橋された組織から標的核酸を放出する必要はない。
一部の例において、緩衝液(例えば酢酸ナトリウム、NaCl、KCl、ZnSO4、抗微生物剤(例えばProClin(商標)殺生剤など)、またはそれらの組合せを含有する緩衝液など)で希釈したS1ヌクレアーゼを、ハイブリダイズしたプローブ/試料混合物に添加し、約37℃から約60℃(例えば約50℃など)で10〜120分(例えば、10〜30分、30から60分、60〜90分、90分、または120分)インキュベートして、試料からのハイブリダイズしていない核酸ならびにハイブリダイズしていないNPPFおよびCFSを消化する。一例において、ヌクレアーゼ消化は、試料をヌクレアーゼ緩衝液中のヌクレアーゼと共に50℃で60から90分インキュベートすることによって実行される。
試料は、任意選択で、残留した酵素を不活性化または除去するために処理することができる(例えば、フェノール抽出、沈殿、カラムろ過、プロテイナーゼkの添加、ヌクレアーゼ阻害剤の添加、活性のためにヌクレアーゼが必要とする2価カチオンのキレート化、またはそれらの組合せによって)。一部の例において、試料は、例えばKOHもしくはNaOHまたは緩衝液(例えばpH9でトリス−HClまたはpH8でトリス−HClを含有する緩衝液など)の添加によって、pHを約7から約8に調整するために処理される。pHを上昇させることは、DNAの脱プリンを防ぐことができ、さらに多くのss特異的ヌクレアーゼ(例えば、S1)の完全な機能化も防ぐことができる。一部の例において、ヌクレアーゼを不活性化するために、試料を例えば10〜30分加熱する(例えば80〜100℃)。
一部の例において、ヌクレアーゼ消化後に、試料を、SSCを含む緩衝液で洗浄し、それに続いてより高いストリンジェントの洗浄(例えば、50〜60℃の水、50mMのNaOH、またはホルムアミド)を行うことができる。
C.標的の捕獲
本方法中の時間のどこかの時点で、シーケンシングされる標的核酸分子が回収または捕獲され、それにより反応混合物中の他の分子からの標的の分離が可能になる。図2B〜2Dに、標的をいつ捕獲できるかの例を示す。標的が一旦捕獲されたら、本方法の後続のステップの間中、標的が捕獲されたままにしてもよいし、または望ましいときに放出させてもよい。一部の例において、NPPF、5CFS、または3CFS上に存在する捕獲部分を使用することによって、標的は反応物から回収される。捕獲部分は、例えば未結合のNPPF、未結合の標的、および未結合のCFSの1つまたは複数の一部などの反応物中のタグを有さない分子から、標的を物理的に分離することを可能にする。
一例において、捕獲部分は、NPPF、5CFS、または3CFSに共有結合で付着している。このような付着の例としては、アミンおよびカルボキシル結合(例えば、NPPF、5CFS、または3CFSに付着したアミン基、例えば5CFSの3’末端(例えば、図3を参照)であり、これは、捕獲部分、例えば磁気ビーズ(例えば、Dynabead)上のカルボキシル基(例えば、カルボン酸(carboxcylic acid))に結合することができる)、および炭素−炭素結合が挙げられる。一例において、NPPF、5CFS、または3CFSは、アミンを含み、捕獲部分は、1級脂肪族アミン、芳香族アミン、クロロメチル、アミド、ヒドラジド、アルデヒド、ヒドロキシル、チオール、またはエポキシを含み、それにより核酸分子が捕獲部分に付着することが可能になる。他の例示的な付着は、Integrated DNA Technologiesによって提供される(例えばwww.idtdna.com/pages/docs/default−source/technical−reports/strategies−for−attaching−oligonucleotides−to_v6−3−14−14.pdf?sfvrsn=2を参照)。このような結合と共に使用できる捕獲部分の例としては、これらに限定されないが、ビーズ(例えば、磁気ビーズまたはポリスチレンビーズ)、アガロース、セファロースなど、加えてプレート(例えば、マルチウェル)、スライド(例えば、ガラス、一部の例ではシランでコーティングされたガラス)が挙げられる。一部の例において、捕獲部分へのNPPF、5CFS、または3CFSの共有結合による付着を使用して、ハイブリダイゼーションステップ中に標的を捕獲し、少なくともライゲートするステップにわたり標的を捕獲されたままにする。
別の例において、捕獲部分は、NPPF、5CFS、または3CFSに非共有結合で付着している。このような付着の例としては、例えばアビジン−ビオチン、ストレプトアビジン−ビオチン、ニュートラビジン−ビオチン、ジゴキシゲニン/抗ジゴキシゲニン(またはあらゆるタンパク質/抗体の組合せ、例えばプロテインAもしくはプロテインGおよびそれらの抗体など)、グルタチオン、およびハプテン/タンパク質などの化学基または標識が挙げられる。したがって、捕獲部分に非共有結合で付着した、標的およびそのハイブリダイズしたNPPF、5CFS、または3CFSを含有する反応混合物は、相補的結合分子(捕獲部分に相補的)を含有する適切な固体支持体と共に、捕獲部分の固体支持体への結合を可能にする条件下でインキュベートされる。次いで未結合の材料は、単に洗い落とすかまたは除去することができる。例えば、捕獲部分は、ビオチンを含んでいてもよい。このような例において、反応混合物は、アビジン、ニュートラビジンまたはストレプトアビジンを含む(例えばそれらでコーティングされた)固体支持体(例えばビーズまたはマルチウェルプレートなど)と共にインキュベートされる。ビオチンタグを含有する標的複合体は、アビジン、ニュートラビジンまたはストレプトアビジンに結合し、それにより反応混合物中のタグを有さない分子を除去すること(例えば、洗い落とすこと)が可能になる。別の例において、捕獲部分は、アミンを含んでいてもよい。このような例において、反応混合物は、カルボキシル基(例えば、カルボン酸)を含む(例えば、それでコーティングされた)固体支持体(例えばビーズまたはマルチウェルプレートなど)と共にインキュベートされる。アミン基を有する標的複合体は、カルボキシル基に結合し、それにより反応混合物中のタグを有さない分子を除去することが可能になる。別の例において、捕獲部分は、ジゴキシゲニンまたはハプテンを含んでいてもよい。このような例において、反応混合物は、それぞれ抗ジゴキシゲニン抗体または抗ハプテン抗体を含む(例えば、それらでコーティングされた)固体支持体(例えばビーズまたはマルチウェルプレートなど)と共にインキュベートされる。ジゴキシゲニン(またはハプテン)との標的複合体は、抗ジゴキシゲニン(または抗ハプテン)抗体に結合し、それにより反応混合物中のタグを有さない分子を除去することが可能になる。
一部の例において、捕獲部分は、固体支持体および化学基の両方を含む(例えば、カルボキシル基末端ビーズ)。
足場の存在は、反応混合物からの標的(例えば、図2AのNPPF/標的二重鎖214)の捕獲または回収を可能にする。例えば、反応物を遠心分離し、洗浄することができ、それにより標的の濃縮および収集が可能になる。または標的が結合する足場を容器の底部に沈降させ、洗浄することができる。別の例において、足場は磁性物質であり、それにより磁石を使用したその収集(および標的の収集)が可能になる。一部の例において、標的は、ろ過を使用することによって(例えば、ビーズを捕獲するためのフィルターを使用することによって)回収される。標的を固着させた後、反応混合物の残りを除去することができる(例えば、洗浄によって)。次いでそれに続く方法のステップに好適な適切な試薬を標的に添加することができる。一部の例において、標的は、標的複合体を変性させることなく捕獲される。捕獲に続いて、固体支持体または足場に付着した(または容器と会合した、例えば容器中で会合した)標的複合体を、固体支持体から放出させることができる(またはそれから除去することができる)。代替として、標的複合体は、反応中に添加される次のステップのために、固体支持体および試薬(regent)に付着させた(または容器と会合した、例えば容器中で会合した)ままにすることができる。
一部の例において、捕獲は、室温で(例えば15〜35℃、例えば20〜30℃または25〜30℃など、少なくとも10分、例えば10〜120分、10〜30分、30から60分、60〜90分、30分、または60分など)実行される。一部の例において、捕獲の後、1つまたは複数の洗浄ステップが、例えばSSC−T緩衝液(1×SSC、0.02%Tween(登録商標)−20界面活性剤)などを用いて実行される。
このような付着と共に使用できる固体支持体の例としては、これらに限定されないが、ビーズ(例えば、磁気ビーズまたはポリスチレンビーズ)、アガロース、セファロース、など、加えてプレート(例えば、マルチウェル)、およびスライド(例えば、ガラス、一部の例ではシランでコーティングされたガラス)が挙げられる。一部の例において、捕獲部分へのNPPF、5CFS、または3CFSの非共有結合による付着を使用して、ハイブリダイゼーションステップ後(ただしライゲーション前)に標的を捕獲し、少なくともライゲートするステップにわたり標的を捕獲されたままにする。
捕獲部分は、5CFSまたは3CFS(またはNPPF)に(例えば、スペーサー、例えば炭素スペーサーなどを介して)直接的または間接的に付着またはコンジュゲートさせることができる。捕獲部分は、5CFSまたは3CFS(またはNPPF)の内部ヌクレオチドに付着させることができる。一例において、捕獲部分は、5CFSの3’末端ヌクレオチドに(またはそれに近接して、例えば3’末端に近接しているが3’末端にはないビオチン−dTを使用して)付着している。一例において、捕獲部分は、3CFSの5’−ヌクレオチドに(またはそれに近接して、例えば5’末端に近接しているが5’末端にはないビオチン−dTを使用して)付着している。一部の例において、捕獲部分は、5CFSの5’末端ヌクレオチドまたは3CFSの3’末端ヌクレオチドに付着していない。一部の例において、捕獲部分は、例えば炭素スペーサー(例えば約6から60個の炭素原子、例えば約6、7、8、9、10、11、12、24、30、36、42、48、54、または60個の炭素原子)、ホスホロチオエート結合を有する塩基、ビオチン−アビジン、またはそれらの組合せを使用することによって、5CFSまたは3CFSに間接的に付着している。
開示された方法およびキットと共に使用できる固体支持体としては、検出試薬によるアクセスおよび好適な表面親和性をもたらし捕獲試薬(例えば、オリゴヌクレオチド)を固着させるものが挙げられる。使用できる例示的な固体支持体または足場としては、ビーズまたは粒子(例えばアガロース、セファロース(または他のマトリックス/樹脂)、ラテックス粒子、ポリスチレンビーズ、超常磁性ビーズ、または磁気ビーズなど)、マルチウェルプレート(例えば、96−、384−、または1536−ウェルマイクロタイタープレート)、反応トレイのウェルの壁、試験管、遠沈管、膜、および微粒子(例えばラテックス粒子など)が挙げられる。固体支持体は、あらゆる好適な材料、例えばガラス、プラスチック、膜、金属、ラテックス、寒天、アガロースなどから作製することができる。一部の例において、固体支持体は、アガロースビーズまたは磁気ビーズである。一部の例において、ビーズまたは粒子は、少なくとも1μm、少なくとも2μm、少なくとも3μm、少なくとも4μm、少なくとも10μm、または少なくとも50μm、例えば50μmから140μm、1μmから2μm、1μmから3μm、1μmから4μm、1μmから5μm、または1μmから10μmである。
D.CFSおよび標的のライゲーションならびに任意選択の重合
ハイブリダイズしていない材料を除去し、NPPF/標的二重鎖を回収した後、標的配列(これは、DNAまたはRNAであり得る)をCFSに(例えば、5CFS、3CFS、または両方に)ライゲートし、それによってライゲートした標的が生成される。したがって、標的と各CFSとの間の「ギャップ」(例えば、図3および4を参照)、は、リガーゼの使用によって「閉じられる」。一部の例において、ポリメラーゼステップは、例えばヌクレアーゼによって除去された可能性があるCFSまたは標的のヌクレオチドを置き換えるために含まれる。例えばヌクレアーゼは、CFSおよび/または標的の5’および/または3’末端から数個のヌクレオチド(例えば1、2、3または4ヌクレオチド)を除去することができる。ポリメラーゼは、リガーゼと共に含まれていてもよいし、または重合は、ライゲートするステップの前に実行してもよい。
リガーゼは、ホスホジエステル結合の形成を触媒することによって核酸分子を一緒に合体させることを容易にする酵素である。例としては、DNAリガーゼ(例えば、EC 6.5.1.1)およびRNAリガーゼ(例えば、EC 6.5.1.3)が挙げられる。例えばT4 DNAリガーゼ、T4 RNAリガーゼ1、T4 RNAリガーゼ2(例えばトランケートされた形態など)、またはTaqリガーゼなどのあらゆるリガーゼを使用することができる。使用されるリガーゼは、標的配列に最も近いCFS上に存在するヌクレオチド(リボヌクレオチドまたはデオキシリボヌクレオチド)、加えて標的配列のタイプ(例えば、DNAまたはRNA)によって決めることができる。例えば、RNAは、RNAにライゲートし、DNAは、DNAにライゲートし、RNA3’末端は、DNA5’末端にライゲートする。一部の例において、CFSは、リガーゼが確実に適した基質を有するように、リン酸または他の5’末端の改変を含む。例えば、CFS(例えば、図2Aの210)は、3’末端に1つまたはそれより多くのRNA塩基を含むDNA分子であってもよい。例えば、CFS(例えば、図2Aの208)は、5’末端に1つまたはそれより多くのDNA塩基を含むRNA分子であってもよい。一部の例において、リガーゼの組合せが使用される。一部の例において、標的がDNAおよびRNA分子の両方を含む場合、別個のライゲーション(任意選択で重合を含む)が使用され、一方で他の例において、標的がDNAおよびRNA分子の両方を含む場合、単一のライゲーション(任意選択で重合を含む)が使用される。以下に一部の非限定的な例を示す。
T4 DNAリガーゼは、ATP依存性酵素であって、これは、二重鎖DNAまたはRNAにおいて、並列させた5’ホスホリル(例えばヌクレアーゼ消化後に、1つは5CFS上に存在し、1つは標的DNAまたはRNA上に存在し、例えば、図3および4を参照)と、3’−ヒドロキシル末端(例えば1つは3CFS上に存在し、1つは標的DNAまたはRNA上に存在し、例えば、図3および4を参照)との間でホスホジエステル結合の形成を触媒する。T4 DNAリガーゼはまた、二重鎖DNA、RNA、またはDNA/RNAハイブリッド中の一本鎖ニックを修復することもできる。T4 DNAリガーゼはまた、二重鎖DNAまたはRNAの平滑末端および付着末端の断片の両方を合体させることもできる。
Taq DNAリガーゼは、並列させた5’リン酸(例えばヌクレアーゼ消化後に、1つは5CFS上に存在し、1つは標的DNAまたはRNA上に存在し、例えば、図3および4を参照)と、相補的標的DNAにハイブリダイズした2つの隣接するオリゴヌクレオチドの3’ヒドロキシル末端(例えば1つは3CFS上に存在し、1つは標的DNA上に存在し、例えば、図3および4を参照)との間のホスホジエステル結合の形成を触媒する。ライゲーションは、オリゴヌクレオチドが相補的標的DNAに完全に対合し、それらの間にギャップがないときに起こる。Taq DNAリガーゼは、高温(45℃〜65℃)で活性である。
T4 RNAリガーゼ1(ssRNAリガーゼ)は、5’ホスホリル末端を有する核酸ドナー(例えばヌクレアーゼ消化後に、1つは5CFS上に存在し、1つは標的DNAまたはRNA上に存在し、例えば、図3および4を参照)の、3’ヒドロキシル末端を有する核酸アクセプター(例えば1つは3CFS上に存在し、1つは標的DNAまたはRNA上に存在し、例えば、図3および4を参照)への、ATPからAMPおよびPPiへの加水分解による3’から5’のホスホジエステル結合の形成を介したライゲーションを触媒する。基質は、一本鎖RNAおよびDNAに加えて、ジヌクレオシドピロリン酸を含む。
T4 RNAリガーゼ2はまた、T4Rnl−2としても公知であり、分子間および分子内両方のRNA鎖を合体させる活性を有する。これは、5’リン酸(例えばヌクレアーゼ消化後に、1つは標的DNAまたはRNA上に存在し、例えば、図3および4を参照)の、3’ヒドロキシル(例えば1つは3CFS上に存在し、例えば、図3および4を参照)へのライゲーションを触媒する。T4 RNAリガーゼ2はまた、RNAの3’ヒドロキシルをDNAの5’リン酸にライゲートすることもできる。一部の例において、T4 RNAリガーゼ2のトランケートされた形態が使用される(例えば、アミノ酸1〜249)。
一部の例において、リガーゼを、緩衝液(例えば必須の補因子、例えばNAD+またはATPなど、緩衝剤、およびカチオンを含有する緩衝液など)で希釈し、NPPF/標的二重鎖を含有する混合物に添加し、約4℃〜60℃(リガーゼに応じて)(例えば少なくとも4℃、少なくとも20℃、少なくとも25℃、少なくとも30℃、少なくとも37℃、少なくとも50℃、または少なくとも60℃、例えば4から37℃、4から25℃、または20から25℃)で、少なくとも15分、少なくとも30分、少なくとも1時間、少なくとも2時間、少なくとも4時間、少なくとも6時間、少なくとも12時間、または少なくとも16時間インキュベートして、CFSを標的核酸分子にライゲートさせる(この場合、CFSおよび標的はすでに、NPPFにハイブリダイズしている)。一例において、T4 DNAリガーゼのための緩衝液は、50mMトリス−HCl、pH7.5、10mMのMgCl2、10mMジチオスレイトール、1mMのATPを含む。
ポリメラーゼは、例えば核酸分子の末端に1つまたは複数のヌクレオチドを付加することによって核酸分子の鎖または核酸ポリマーを合成することができる酵素である。例としては、DNAポリメラーゼ(EC2.7.7.7)およびRNAポリメラーゼ(EC2.7.7.6)が挙げられる。DNAポリメラーゼは、DNA分子をその3’末端で伸長させる、すなわち、その3’末端にヌクレオチドを付加するのに使用することができる。一例において、例えばT4またはT7 DNAポリメラーゼまたはエキソヌクレアーゼ欠損熱安定性ポリメラーゼなどのDNAポリメラーゼは、dNTPの存在下で使用される。RNAポリメラーゼは、RNA分子をその3’末端で伸長させる、すなわち、その3’末端にリボヌクレオチドを付加するのに使用することができる。一例において、例えばE.coliのRNAポリメラーゼなどのRNAポリメラーゼは、rNTPを添加して使用される。RNAポリメラーゼが使用される場合、本方法は、逆転写ステップ(例えば、ライゲートした標的をPCR増幅するときに)をさらに含んでいてもよい。一部の例において、例えば標的核酸分子がDNAおよびRNAの両方を含む場合、DNAポリメラーゼおよびRNAポリメラーゼの両方が使用される。
一部の例において、重合反応は、ライゲーション反応の前に実行される。例えば捕獲された標的は、ポリメラーゼおよびdNTPおよび/またはrNPTと共に、約4℃〜60℃(例えば少なくとも4℃、少なくとも20℃、少なくとも25℃、少なくとも30℃、少なくとも37℃、少なくとも50℃、または少なくとも60℃、例えば4℃から37℃、4℃から25℃、または室温(20から25℃))で、少なくとも15分、少なくとも30分、少なくとも1時間、少なくとも2時間、少なくとも4時間、少なくとも6時間、少なくとも12時間、または少なくとも16時間インキュベートすることができる。一例において、ポリメラーゼは、T4 DNAポリメラーゼであり、インキュベーション条件は、37℃で1時間である。一例において、ポリメラーゼは、T4 DNAポリメラーゼであり、インキュベーションは、室温(例えば20〜25℃など)で30分実行される。
一部の例において、ポリメラーゼは、例えばdNTPおよび/またはrNPTと共にライゲーション反応物に添加され、約4℃〜60℃(リガーゼに応じて)(例えば少なくとも4℃、少なくとも16℃、少なくとも20℃、少なくとも25℃、少なくとも30℃、少なくとも37℃、少なくとも50℃、または少なくとも60℃、例えば4から37℃、4から25℃、または20から25℃)で、少なくとも15分、少なくとも30分、少なくとも1時間、少なくとも2時間、少なくとも4時間、少なくとも6時間、少なくとも12時間、または少なくとも16時間インキュベートされる。一例において、重合/ライゲーション反応物は、室温(例えば20から25℃など)で少なくとも15分、少なくとも30分、または少なくとも1時間、例えば30〜60分インキュベートされる。
E.ライゲートした標的からのNPPFの分離
CFSを標的にライゲートし、ライゲートした標的を形成した後、ライゲートした標的からNPPFを分離する(例えば、変性させる)。したがって、二本鎖NPPF/標的複合体は、2つの一本鎖核酸分子、ssNPPFおよびssのライゲートした標的に分離することができる。一部の例において、DNアーゼでNPPFを分解することによってNPPFをライゲートした標的から分離し(例えば、NPPFがDNAである場合、標的はRNAであり、CFSはRNAである)、それによってライゲートした標的が残る。一部の例において、RNアーゼでNPPFを分解することによってNPPFをライゲートした標的から分離し(例えば、NPPFがRNAである場合、標的はDNAであり、CFSはDNAである)、それによってライゲートした標的が残る。このステップはまた、物理的な分離を介してライゲートしていない核酸分子(例えば、ライゲートしていないCFS)を除去することもできる。
一例において、反応物は、例えば洗浄緩衝液の存在下で、ライゲートした標的からNPPFを解離させる条件下で加熱され、それによりssNPPFおよびssのライゲートした標的の混成集団が生じる。例えば、反応物は、水溶液中で加熱することができる。一例において、反応物は、水中で少なくとも約50℃(例えば50から100℃、例えば50℃)に加熱され、少なくとも10分インキュベートされる。一部の例において、反応物は、3回の約50℃での水による10分の洗浄に供される。一例において、反応物は、約50℃で10分、水中の0.02%Tween(登録商標)非イオン性界面活性剤で3回洗浄される(界面活性剤は、ビーズが凝集しないようにするために添加することができる)。別の例において、反応物は、100%ホルムアミド溶液中で、少なくとも90℃、例えば約98℃に少なくとも10分加熱される。一部の例において、溶液の添加および加熱ステップを繰り返し(例えば1から5回)、それに続き、NPPFおよびライゲートしていない種を実質的に除去し、それらをssのライゲートした産物から洗い落とすために洗浄を行う。一部の例において、反応物は、室温で、50%ホルムアミド/0.02%Tween−20(登録商標)非イオン性界面活性剤で洗浄される。
別の例において、変性は、pHを塩基(例えばKOHまたはNaOHなど)で変更することによって実行され、それによりライゲートした標的からNPPFを解離させ、ssNPPFおよびssのライゲートした標的の混成集団が生じる。例えば、NaOHを50mMから2M(例えば100mMなど)の最終濃度に添加し、室温で少なくとも10分インキュベートすることができる。一部の例において、NaOHの添加およびインキュベーションを繰り返す(例えば1から5回など)。塩基での洗浄後、反応物を、水性緩衝液、例えばトリス−HClなどに再懸濁してもよいし、または反応物を、等量から通常の量の適切な緩衝化溶液の酸溶液で中和してもよい。
一部の例において、試料は、DNアーゼと共に、例えば、試料1つ当たり少なくとも1ユニットのDNアーゼI(例えば少なくとも5ユニット、少なくとも10ユニット、もしくは少なくとも20ユニット、例えば1から10ユニット、1から20ユニット、または5、6、7、8、9もしくは10ユニット)の濃度で、少なくとも10分、少なくとも30分、少なくとも60分、または少なくとも120分、例えば10分、30分、60分、90分、または2時間、37℃でインキュベートされる。
一部の例において、試料は、RNアーゼ、例えばRNアーゼHなどと共に、例えば、試料1つ当たり少なくとも1ユニットのRNアーゼH(例えば少なくとも5ユニット、少なくとも10ユニット、少なくとも20ユニット、または少なくとも50ユニット、例えば1から10ユニット、1から20ユニット、または1から50ユニット、例えば5、6、7、8、9、10、20、30、40もしくは50ユニット)の濃度で、少なくとも10分、少なくとも30分、少なくとも60分、または少なくとも120分、例えば10分、30分、60分、90分、または2時間、37℃でインキュベートされる。
F.ライゲートした標的の捕獲
ssのライゲートした標的は、セクションII.Cで上述したものに類似の方法を使用して、例えばCFS上の捕獲部分(標的にライゲートされている)を使用することによって回収することができる。一部の例において、捕獲の後、試料を、SSC(例えばSSC−Tなど)を含む緩衝液で洗浄し、それに続いて、よりストリンジェントな洗浄(例えば、50〜60℃の水、50mMのNaOH、またはホルムアミド)、またはTween(登録商標)−20界面活性剤(例えば、0.02%Tween(登録商標)−20界面活性剤)を含む洗浄を行うことができる。次いで得られたssのライゲートした標的をシーケンシングすることができる。一部の例において、シーケンシングの前に、ssのライゲートした標的を増幅し、それによってライゲートした標的アンプリコンが生成される。
G.ライゲートした標的の任意選択の増幅
得られた捕獲されたライゲートした標的分子は、シーケンシングの前に、例えばポリメラーゼ連鎖反応(PCR)または酵素による増幅の他の形態またはライゲーションベースの増幅方法などの方法を使用して増幅することができる。標的がRNAである場合、またはrNTPと共にRNAポリメラーゼが使用された場合(上記のセクションDを参照)、逆転写ステップを含めることができる。
一部の例において、30サイクル以下の増幅が実行され、例えば25サイクル以下の増幅、20サイクル以下の増幅、15サイクル以下の増幅、10サイクル以下の増幅、8サイクル以下の増幅、または5サイクル以下の増幅、例えば2から30サイクル、5から30サイクル、8から30サイクル、8から25サイクル、2から25サイクル、5から25サイクル、5から20サイクル、5から15サイクル、または5から10サイクルの増幅が実行される。
使用することができる核酸増幅方法としては、核酸分子、例えばライゲートした標的またはそれらの一部などのコピー数の増加をもたらす方法が挙げられる。得られた産物は、増幅産物またはアンプリコンと呼ばれる。一般的に、このような方法は、増幅させる材料(例えば、ライゲートした標的)を、オリゴヌクレオチドプライマーの一方または対と、プライマーの増幅させる核酸分子へのハイブリダイゼーションを可能にする条件下で接触させることを含む。プライマーを好適な条件下で伸長させ、テンプレートから解離させ、次いで再アニールさせ、伸長させ、解離させて、核酸分子のコピー数を増幅する。
使用することができるin vitroでの増幅方法の例としては、これらに限定されないが、PCR、逆転写PCR(RT−PCR)、定量リアルタイムPCR、定量リアルタイム逆転写酵素PCR、等温増幅方法、鎖置換増幅;無転写等温増幅;修復連鎖反応増幅;およびNASBA(商標)RNA無転写増幅が挙げられる。一例において、ライゲーションベースの増幅方法が使用され、この場合、プライマーはCFSの少なくとも一部に特異的にハイブリダイズする。ライゲーションは、酵素によるものでもよいし、または酵素によらないものでもよい。一例において、ヘリカーゼ依存性増幅が使用される。
ライゲートした標的の増幅中に、実験タグおよび/またはシーケンシングアダプターを、例えばプライマーおよび伸長構築物の一部として、取り込むことができる(図5を参照)。しかしながら、このようなタグ/アダプターの付加は任意選択である。例えば、増幅プライマーは、5CFSまたは3CFSの全てまたは一部に相補的な第1の部分を含んでおり、望ましい実験タグおよび/またはシーケンシングアダプターに相補的な第2の部分を含んでいてもよい。当業者は、実験タグおよび/またはシーケンシングアダプターの異なる組合せを、ライゲートした標的の末端のいずれかに付加できることを理解するであろう。一例において、ライゲートした標的は、5CFSの全てまたは一部に相補的な第1の部分、および望ましいシーケンシングアダプターに相補的な(またはそれを含む)第2の部分を含む第1の増幅プライマーを使用して増幅され、第2の増幅プライマーは、3CFSの全てまたは一部に相補的な第1の部分、および望ましい実験タグに相補的な(またはそれを含む)第2の部分を含む(例えば、図5を参照)。一例において、2つの異なるシーケンシングアダプターおよび2つの異なる実験タグが使用される。一部の例において、2つの異なるシーケンシングアダプターおよび1つの実験タグが使用される。別の例において、ライゲートした標的は、5CFSに相補的な第1の部分の全てまたは一部、ならびに望ましいシーケンシングアダプターおよび望ましい実験タグに相補的な(またはそれを含む)第2の部分を含む第1の増幅プライマーを使用して増幅され、第2の増幅プライマーは、3CFSの全てまたは一部に相補的な第1の部分、および望ましい実験タグに相補的な(またはそれを含む)第2の部分を含む。
増幅はまた、生成したライゲートした標的アンプリコンに検出可能な標識を導入したり(例えば追加の標識付けが望ましい場合)、または検出もしくはクエンチを許容する他の分子を導入したりするのにも使用することができる。例えば、増幅プライマーは、増幅中にライゲートした標的に取り込まれる、検出可能な標識、ハプテン、またはクエンチャーを含んでいてもよい。このような標識、ハプテン、またはクエンチャーは、ライゲートした標的アンプリコンのいずれかの末端(または両方の末端)に、またはその間のどこにでも導入することができる。
一部の例において、得られたライゲートした標的アンプリコンは、シーケンシングの前に精製される。例えば、増幅反応混合物は、シーケンシングの前に、当技術分野において公知のもの(例えば、ゲルでの精製、ビオチン/アビジン捕獲および放出、キャピラリー電気泳動、サイズ排除精製、または常磁性ビーズ(固相の可逆的な固着)への結合およびそれからの放出)を使用して精製することができる。一例において、ライゲートした標的アンプリコンは、ビオチン化され(または別のハプテンを含み)、アビジンまたは抗ハプテンでコーティングされたビーズまたは表面上に捕獲され、洗浄され、次いでシーケンシングのために放出させる。同様に、ライゲートした標的アンプリコンは、相補的オリゴヌクレオチド(例えば表面に結合したものなど)上に捕獲され、洗浄され、次いでシーケンシングのために放出させることができる。開示された方法は、ゲノムまたはトランスクリプトームのほとんどをなくし、ライゲートした標的を残すことから、アンプリコンの捕獲は特に特異的である必要はない。他の方法が、必要に応じて増幅した産物を精製するのに使用することができる。
増幅した産物はまた、最後の増幅ステップの後に、一本鎖オリゴヌクレオチドを加水分解するヌクレアーゼ(例えばエキソヌクレアーゼIなど)を使用する方法によって二本鎖化されたままで精製することもでき、このヌクレアーゼは順に、引き続き例えばシーケンシングなどの次のステップを行う前に不活性化することができる。
1.CFSと結合するプライマー
CFS(5CFS、3CFS)に特異的に結合するかまたはハイブリダイズする増幅プライマーは、例えばPCR増幅などの増幅を開始させるのに使用することができる。したがって、プライマーは、核酸ハイブリダイゼーションによってCFS中の相補的配列にアニールして、プライマーとライゲートした標的のCFSとのハイブリッドを形成することができ、次いでプライマーがポリメラーゼ酵素により相補鎖に沿って伸長する。加えて、増幅プライマーは、得られたライゲートした標的アンプリコンに、核酸マーカー(例えば1つまたは複数の実験タグおよび/またはシーケンシングアダプターなど)および/または検出可能な標識を導入するのに使用することができる。プライマーは、少なくとも12ヌクレオチドの長さ(例えば約15、20、25、30、50、60、61、62、63、64、65、66、67、68、69、70、75または80ヌクレオチドまたはそれを超える長さ、例えば15から25nt、50から80nt、60〜70ntまたは62〜66nt)の例えばDNAオリゴヌクレオチドなどの短い核酸分子である。例えば、このようなプライマーは、CFSに相補的な部分(例えば、CFSに相補的な、少なくとも10、少なくとも15、少なくとも20、または少なくとも25ntなど)を有していてもよい。一部の例において、プライマーは、検出可能な標識、例えばフルオロフォアまたはビオチンなどを含み、これは、ライゲートした標的アンプリコンに取り込まれる。
例えば、増幅プライマーは、CFSに相補的な領域を有することに加えて、得られたライゲートした標的アンプリコンへの実験タグ、シーケンシングアダプター、検出可能な標識、またはそれらの組合せの付加をもたらす核酸配列を有する第2の領域を含んでいてもよい。実験タグおよび/またはシーケンシングアダプターは、ライゲートした標的の5’および/または3’末端に導入することができる。一部の例において、2つまたはそれより多くの実験タグおよび/またはシーケンシングアダプターは、例えば2つまたはそれより多くの実験タグおよび/またはシーケンシングアダプターの付加をもたらす核酸配列を有する単一のプライマーを使用して、ライゲートした標的アンプリコンの単一の末端または両方の末端に付加される。実験タグは、例えば1つの試料または配列を別のものから区別するのに使用することができる。配列アダプターは、特定のシーケンシングプラットフォームによって、得られたライゲートした標的アンプリコンの捕獲を許容する。
2.実験タグの付加
実験タグは、例えば患者、試料、細胞型、時間経過のタイムポイント、または処理によって独立して認識される1つまたは数々の反応のための識別子として役立つ短い配列または改変された塩基である。実験タグは、CFSの一部であってもよい。別の例において、実験タグは、後で、例えばライゲートした標的の増幅中に付加され、それにより実験タグを含有するライゲートした標的アンプリコンが生じる。CFS中の万能な配列の存在は、万能なプライマーの使用を許容し、このようなプライマーは、例えば増幅中、ライゲートした標的上に他の配列を導入することができる。例えばネステッド増幅、または二段階増幅などの増幅にも、実験的タグを使用することができる。
実験タグ、例えば一方の試料を他方から識別する実験タグなどは、特定の標的配列を同定するのに使用することができる。したがって、実験タグは、実験または患者を互いに区別するのに使用することができる。一例において、実験タグは、ライゲートした標的アンプリコンの5’および/または3’末端の最初の3、5、10、20、または30ヌクレオチドである。一部の例において、実験タグは、シーケンシングプライマー部位に近接して設置される。Illumina(登録商標)シーケンシングの場合、実験タグは、リード1およびリード2のプライマー部位のすぐ隣にある。IonTorrent(登録商標)シーケンシングの場合、実験タグは、一般的に、最初の数個の塩基リードである。特定の例において、実験タグは、少なくとも3ヌクレオチドの長さ、例えば少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも40、または少なくとも50ヌクレオチドの長さ、例えば3〜50、3〜20、12〜50、6〜8、6〜12、または12〜30ヌクレオチド、例えば、3、5、6、7、8、9、10、11、12、20、21、22、23、24、25、26、27、28、29または30ヌクレオチドの長さである。
一例において、実験タグは、一方の試料を他方から識別するのに使用される。例えば、このような配列は、検出された特定の配列を、特定の試料、患者、または実験(例えば特定の反応ウェル、日または反応条件のセットなど)と相関させるためのバーコードとして機能することができる。これは、シーケンシングされる特定のライゲートした標的を、例えば特定の患者または試料または実験と関連付けることを許容する。このようなタグを使用することで、例えば1回のシーケンシング試行または検出アレイで複数のライゲートした標的アンプリコンをタグ付けし、次いで(例えば異なる実験または患者から)合わせることができるため、試料1つ当たりのコストを低減して試料のスループットを増加させる方法が提供される。これは、同じ機器チャネルまたはシーケンシングの消耗品(例えばフローセルまたは半導体チップなど)中での単一の試行に、異なる実験または患者の試料を合わせる能力をもたらす。例えば、このようなタグは、100または1,000回の異なる実験を、単一のフローセルまたはチップ中での単一の試行でシーケンシングすることを許容する。加えて、本方法が、完了した増幅反応物をゲルで精製するステップ(または実際の分離を必要としない他の精製または浄化方法)を含む場合、検出またはシーケンシング試行ごとに試行する必要があるゲル(または浄化または精製反応または加工)は、1回のみである。次いでシーケンシングしたライゲートした標的アンプリコンは、例えば実験タグによってソートすることができる。
一例において、実験タグは、特定の標的配列を同定するのに使用される。このケースにおいて、特定の標的配列に対応させるのに実験的タグを使用することによって、ライゲートした標的全体の代わりにライゲートした標的の末端をシーケンシングすれば十分であることから、必要となるシーケンシングの時間または量を少なくすることができる。例えば、このような実験タグがライゲートした標的アンプリコンの3’末端に存在する場合、標的配列を同定するのにライゲートした標的アンプリコン配列そのもの全体をシーケンシングしなくてもよい。その代わりに、実験タグを含有するライゲートした標的アンプリコンの3’末端のみをシーケンシングすればよい。これは、シーケンシングする必要がある材料がより少ないため、シーケンシングの時間および資源を顕著に低減することができる。
3.シーケンシングアダプターの付加
シーケンシングアダプターは、生成されたときに、CFSの一部であってもよいが、必ずしもそうでなくてもよい。別の例において、シーケンシングアダプターは、後で、例えばライゲートした標的の増幅中に付加され、それによりシーケンシングアダプターを含有するライゲートした標的アンプリコンが生じる。CFS中の万能な配列の存在は、万能なプライマーの使用を許容し、このようなプライマーは、例えば増幅中に、ライゲートした標的上に他の配列を導入することができる。
シーケンシングアダプターは、ライゲートした標的(またはそのアンプリコン)に特定のシーケンシングプラットフォームに必要な配列を付加するのに使用することができる。例えば、一部のシーケンシングプラットフォーム(例えば454ブランドのもの(Roche)、Ion TorrentブランドのものおよびIlluminaブランドのものなど)は、シーケンシングされる核酸分子が、その5’および/または3’末端に例えばシーケンシングされる分子を捕獲するための特定の配列を含むことを必要とする。例えば、適切なシーケンシングアダプターがシーケンシングチップまたはビーズ上の相補的配列によって認識され、ライゲートした標的(またはそのアンプリコン)がシーケンシングアダプターの存在によって捕獲される。
一例において、ポリA(またはポリT)、例えば少なくとも10ヌクレオチドの長さのポリAまたはポリTなどが、PCR増幅中にライゲートした標的に付加される。具体的な例において、ポリA(またはポリT)がライゲートした標的の3’末端に付加される。一部の例において、この付加された配列は、その3’末端でターミナルデオキシヌクレオチジルトランスフェラーゼ(TdT)を使用してポリアデニル化される。
特定の例において、付加されたシーケンシングアダプターは、少なくとも12ヌクレオチド(nt)の長さ、例えば少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも40、少なくとも50、少なくとも60または少なくとも70ntの長さ、例えば12〜50、20〜35、50〜70、20〜70、または12〜30ntの長さである。
H.ライゲートした標的またはライゲートした標的アンプリコンのシーケンシング
ライゲートした標的またはライゲートした標的アンプリコンは、例えば、ライゲートした標的全体もしくはライゲートした標的アンプリコン、またはそれらの一部(例えば、標的核酸分子の同定を許容するか、または特定の突然変異の存在または非存在の決定を許容するのに十分な量)をシーケンシングすることによってシーケンシングされる。本開示は、特定のシーケンシング方法に限定されない。ライゲートした標的またはライゲートした標的アンプリコンは、現在公知の、または将来的な任意のシーケンサーでの任意の方法によるシーケンシングのために設計できることが理解されるであろう。ライゲートした標的そのものは、使用されるシーケンシング方法も使用される酵素も限定しない。他のシーケンシング方法が開発されているかまたは今後開発され、当業者であれば、生成されたライゲートした標的またはライゲートした標的アンプリコンが、これらのシステムでのシーケンシングにも好適であることを理解することができる。一部の例において、単一の反応で、複数の異なるライゲートした標的またはライゲートした標的アンプリコンがシーケンシングされる。したがって、複数のライゲートした標的は、並行して、例えば同時または同時発生的にシーケンシングすることができる。
得られたライゲートした標的またはライゲートした標的アンプリコンの配列、例えばDNAで構成される配列などを決定するのに使用できる例示的なシーケンシング方法としては、これらに限定されないが、鎖終結方法、色素終結シーケンシング、およびパイロシーケンシング(例えばBiotage(低スループットシーケンシングの場合)および454 Life Sciences(ハイスループットシーケンシングの場合)によって商品化された方法など)が挙げられる。一部の例において、ライゲートした標的またはライゲートした標的アンプリコンは、Illumina(登録商標)(例えば、HiSeq)、Ion Torrent(登録商標)、454(登録商標)、Helicos、PacBio(登録商標)、Solid(登録商標)(Applied Vioasystems)または他の任意の市販のシーケンシングシステムを使用してシーケンシングされる。一例において、シーケンシング方法は、架橋PCR(例えば、Illumina(登録商標))を使用する。一例において、Helicos(登録商標)またはPacBio(登録商標)単一分子シーケンシング方法が使用される。一例において、次世代シーケンス(NGS)、例えば、Illumina、Roche、またはThermo Fisher Scientificからのもの、例えば、Thermo Fisher ScientificからのSOLiD/Ion Torrent PGM、Illumina(登録商標)からのゲノムアナライザー/HiSeq2000/MiSeq、RocheからのGS FLX Titanium/GS Junior、またはQiagen GeneReader(商標)システムなどが使用される。特定のプラットフォームでのシーケンシングのために、シーケンシングアダプター(例えばPCRを使用して導入された、例えばライゲートした標的またはライゲートした標的アンプリコン上に存在するポリAまたはポリTテールなど)は、ライゲートした標的またはライゲートした標的アンプリコンの捕獲に使用することができる。一例において、ナノポアタイプのシーケンサーが使用される。
454(登録商標)またはIllumina(登録商標)によるシーケンシングは、典型的には、開示された方法のための、核酸のランダムな断片化、それに続くin vitroにおける共通のアダプター配列ライゲーションによって達成される核酸調製を含むが、シーケンシングされる核酸のランダムな断片化のステップは、行わなくてもよく、さらに、in vitroにおけるアダプター配列のライゲーションは、ライゲートした標的またはライゲートした標的アンプリコン、例えばライゲートした標的またはライゲートした標的アンプリコン中に存在する実験タグなどに対してなすことができる。454(登録商標)シーケンシングの場合、シーケンシングプライマーは、シーケンシングチップ/ビーズアンプリコン上での増幅の後にライゲートした標的にハイブリダイズする。
I.対照
一部の実施形態では、本方法は、1つまたは複数の陽性および/または陰性対照の使用を含む。一部の例において、対照は、実際の実験NPPFおよび対応するCFSと同じ反応条件に晒される。タグ付けを使用することによって、実際の異なる試料を対照として使用するが、シーケンシングのために加工して、同じシーケンシングレーンで試験試料として泳動することが許容される。
一部の例において、対照は、試料が接触する、複数のNPPF中に含まれる「陽性対照」NPPFおよび対応するCFSである。一部の例において、この陽性対照は、例えば各試料の溶解した細胞の数、DNAもしくはRNAの回収率、またはハイブリダイゼーション効率などの可変値に対する内部正規化対照である。一例において、標的RNAを測定する場合、DNAが、細胞の数に対する対照として測定される。一部の例において、陽性対照は、試料中に存在することがわかっているDNAまたはRNAに特異的な、1つまたは複数のNPPFおよび対応するCFS(例えば、試験される種中に存在する可能性が高い核酸配列、例えば1つまたは複数の基底レベルのまたは構成的なハウスキーピング遺伝子、または繰り返しのDNAエレメントなど)を含む。例示的な陽性対照標的としては、これらに限定されないが、構造遺伝子(例えば、アクチン、チューブリン、またはその他)またはDNA結合タンパク質(例えば、転写調節因子、またはその他)、加えてハウスキーピング遺伝子が挙げられる。一部の例において、陽性対照標的としては、グリセルアルデヒド−3−リン酸デヒドロゲナーゼ(GAPDH)、ペプチジルプロリルイソメラーゼ(peptidylproylyl isomerase)A(PPIA)、大きいリボソームタンパク質(RPLP0)、リボソームタンパク質L19(RPL19)、SDHA(コハク酸デヒドロゲナーゼ)、HPRT1(ヒポキサンチンホスホリボシルトランスフェラーゼ1)、HBS1L(HBS1様タンパク質)、β−アクチン(ACTB)、5−アミノレブリン酸シンターゼ1(ALAS1)、β−2ミクログロブリン(B2M)、アルファヘモグロビン安定化タンパク質(AHSP)、リボソームタンパク質S13(RPS13)、リボソームタンパク質S20(RPS20)、リボソームタンパク質L27(RPL27)、リボソームタンパク質L37(RPL37)、リボソームタンパク質38(RPL38)、オルニチンデカルボキシラーゼアンチザイム1(OAZ1)、ポリメラーゼ(RNA)II(DNA依存性)ポリペプチドA、220kDa(POLR2A)、チオレドキシン様1(TXNL1)、yes関連タンパク質1(YAP1)、エステラーゼD(ESD)、プロテアソーム(プロソーム(prosome)、マクロペイン(macropain))26Sサブユニット、ATPアーゼ1(PSMC1)、真核生物翻訳開始因子3、サブユニットA(EIF3A)、または18S rRNAに特異的な、1つまたは複数のNPPFおよび対応するCFSが挙げられる。一部の例において、陽性対照標的は、繰り返しのDNAエレメント、例えばHSAT1、ACRO1、およびLTR3などである。一部の例において、陽性対照標的は、単一コピーのゲノムDNA配列である(一倍体ゲノムと仮定して)。例えば、対応する陽性対照NPPFおよび対応するCFSは、ハイブリダイゼーションの前またはその間に、複数の試験NPPFおよび対応するCFSと共に試料に添加することができる。
一部の例において、陽性対照としては、1つまたは複数のNPPFおよび対応するCFSであって、その相補物が、ハイブリダイゼーションの前またはその間に、複数のNPPFおよび対応するCFSと共に、試料に添加されたスパイクインされた(例えば、添加された)標的核酸分子(例えば、1つまたは複数のin vitroで転写された核酸、関連のない試料からから単離された核酸、または合成核酸、例えばDNAもしくはRNAオリゴヌクレオチドなど)であるものが挙げられる。一例において、陽性対照NPPFおよびスパイクインは、単一のヌクレオチドミスマッチを有する。一例において、複数のNPPFおよびスパイクインが添加され、スパイクインは、インプットの「ラダー」を形成し、最終的なシーケンシングアウトプットにおけるアッセイのダイナミックレンジを示す公知の濃度範囲(例えば1pM、10pM、および100pMなど)で添加される。
一部の例において、「陰性対照」としては、例えばハイブリダイゼーションの特異性に関する対照としての、その相補物が試料に存在しないことがわかっている1つまたは複数のNPPFおよび対応するCFS、例えば、試験される種以外の種からの核酸配列、例えばヒト核酸が分析される場合、植物核酸配列(例えば、Arabidopsis thalianaのAP2様エチレン応答性転写因子(ANT))、または天然に認められない核酸配列などが挙げられる。
一部の例において、対照は、本方法における特定のステップが適切に作動するかどうかを決定するのに使用される。一部の例において、陽性または陰性対照は、最後のシーケンシング結果で評価される。一例において、対照は、標的捕獲後、ただしそのシーケンシング前に(例えば、図2Aにおけるステップ4と5の間に)分析を含む。1つのこのような例において、この分析は、アッセイ中におけるヌクレアーゼの有効性を評価するための陰性対照プローブに対するTaqmanプローブの使用を含む。全ての陰性対照プローブは、ヌクレアーゼステップによって除去されるはずであり、それゆえに陰性対照プローブの量が多い場合、それは、ヌクレアーゼ保護が適切に実行されなかったこと、および試料が損なわれた可能性があることを指し示す場合がある。別のこのような例において、陰性対照プローブのためのTaqmanアッセイは、捕獲された標的全体の量の同時測定による定量化(すなわち、SYBRベースのqPCR方法を使用すること)と組み合わされる。
一例において、分析される試料は、開示された方法を実行する前に増幅条件(例えば、qPCRまたはqRT−PCR)に晒され、試料が十分な量の(および品質の)核酸分子を有するかどうかを決定する。例えば、目的の標的領域、例えばKRASまたはBRAFなど、ハウスキーパーRNA遺伝子、例えばGAPDHなど、または繰り返しのDNAエレメント、例えばLTR3などを増幅するプライマーを使用してqPCRを実行し、試料中の評価可能な核酸を決定することができる。一例において、所与のNPPFの標的部位より小さい核酸断片は、ヌクレアーゼ消化中にNPPFを保護しないため、それらは評価されないことから、利用可能な核酸が評価されるほど十分に大きいかどうかを決定するために、プライマーが標的領域のサイズに近い領域が増幅されるようにプライマーを設計する。一例において、許容できる試料の量および品質の範囲は、例えば特定の試料タイプ(例えば、肺または黒色腫の試料)または様式(例えば、ホルマリン固定された組織または細胞株)を使用して実験的に決定される。
III.フランキング配列を有するヌクレアーゼ保護プローブ(NPPF)
開示された方法は、1つまたは複数の標的核酸分子を、例えば同時または同時発生的に直接シーケンシングすることを許容する。標的核酸に基づいて、NPPFは、開示された方法で使用するために、本明細書に記載の基準を当業者の知見と合わせて使用して設計することができる。一部の例において、開示された方法は、特定の標的核酸分子を検出するための1つまたは複数の適切なNPPFの生成を含む。NPPFは、様々な条件(公知の、または経験的に決定された)下で、このような標的が試料中に存在する場合、標的核酸またはその一部に特異的に結合する(または特異的に結合することが可能であり、例えば特異的にハイブリダイズすることが可能である)。
図1Aは、標的核酸配列に特異的に結合するかまたはハイブリダイズする配列を含む領域102を有する例示的なNPPF100、加えてそれぞれNPPFの5’および3’末端におけるフランキング配列104、106を示し、フランキング配列は、それらの相補的配列(本明細書ではCFSと称される)に結合またはハイブリダイズする。2つのフランキング配列が示されるが、一部の例において、NPPFは、1つのみのフランキング配列を有し、例えば5’末端に1つまたは3’末端に1つのフランキング配列を有する。一部の例において、NPPFは、2つのフランキング配列を含み、5’末端に一方および3’末端に他方のフランキング配列を含む。一部の例において、5’末端におけるフランキング配列は、3’末端におけるフランキング配列とは異なる。図1Bは、2つの別個の核酸分子128、130で構成されるNPPF120の実施形態を示す。一例において、NPPFは、各フランキング配列104、106に対して100nt、25ntであり、標的核酸配列に特異的に結合するかまたはハイブリダイズする領域102に対して50ntである。
NPPF(加えてNPPFに結合するCFS)は、任意の核酸分子、例えばDNAまたはRNA分子などであってもよく、天然にはない塩基を含んでいてもよい。したがって、NPPF(加えてNPPFに結合するCFS)は、天然(例えばリボヌクレオチド(RNA)、またはデオキシリボヌクレオチド(DNA)など)または非天然ヌクレオチド(例えばロックド核酸(LNA、例えば、米国特許第6,794,499号を参照)、ペプチド核酸(PNA)など)などで構成されていてもよい。NPPFは、一本鎖であってもよいし、または二本鎖であってもよい。一例において、NPPFは、ssDNAであり、CFSは、RNAである(例えば、標的は、RNAである)。一例において、NPPFは、ssRNAであり、CFSは、DNAである(例えば、標的は、DNAである)。一部の例において、NPPF(加えてNPPFに結合するCFS)は、1つまたは複数の合成塩基または代替塩基(例えばイノシンなど)を含む。改変されたヌクレオチド、非天然ヌクレオチド、合成または代替ヌクレオチドは、NPPFにおいて、1つまたは複数の位置で(例えば1、2、3、4、5つ、またはそれより多くの位置で)使用することができる。例えば、NPPFおよび/またはCFSは、改変された塩基、および/または改変されたリン酸骨格を含有する1つまたは複数のヌクレオチドを含んでいてもよい。一部の例において、NPPFにおける1つまたは複数の改変されたまたは非天然ヌクレオチドの使用は、改変された核酸を含まない同じ長さおよび組成を有するNPPFのTmと比べてNPPFのTmを増加させることができる。当業者は、望ましいTmを有するプローブを得るために、このような改変されたヌクレオチドを含むプローブを設計することができる。一例において、NPPFは、例えば一本鎖(ssDNA)または分岐状DNA(bDNA)などのDNAまたはRNAで構成される。一例において、NPPFは、アプタマーである。
NPPFは、1つまたは複数の標的核酸分子に相補的な領域を含む。同じ反応で使用されるNPPFは、類似のTmを有するように設計することができる。一例において、反応物中に、単一の標的核酸配列に特異的な少なくとも1つのNPPFが存在する。このような例において、検出またはシーケンシングされる2、3、4、5、6、7、8、9または10個の異なる標的核酸配列がある場合、本方法は、それに対応して、少なくとも2、3、4、5、6、7、8、9または10個の異なるNPPFを使用することができる(この場合、各NPPFは、特定の標的に対応するか、特定の標的にハイブリダイズするのに十分な相補性を有する)。したがって、一部の例において、本方法は、少なくとも2つのNPPFを使用し、この場合、各NPPFは異なる標的核酸分子に特異的である。しかしながら、特定の標的核酸分子、例えば単一の標的核酸配列の多くの様々な領域などに対して、数種の異なるNPPFを生成できることが理解されるであろう。一例において、NPPFは、トランスクリプトーム中の単一の遺伝子にのみ認められる配列に相補的な領域を含む。
しかしながら、一部の例において、反応物中に、例えば野生型配列などの2つまたはそれより多くの標的核酸配列、および特定の遺伝子に関する1つまたは複数の突然変異配列に特異的な単一のNPPFが存在する(例えば、図10を参照)。したがって、一部の例において、2、3、4、5、6、7、8、9または10個の異なる標的遺伝子(例えばBRAF、KRASおよびEGFRなど)があり、それぞれ2つまたはそれより多くの標的核酸配列が検出またはシーケンシングされる場合、本方法は、それに対応して、少なくとも2、3、4、5、6、7、8、9または10個の異なるNPPFを使用することができる(この場合、各NPPFは、特定の遺伝子に対応するが、遺伝子配列の複数のバリエーションを検出することができる)。
これらのタイプのNPPFの組合せを単一の反応で使用することができ、このような組合せは、例えば(1)それぞれ単一の標的核酸配列に対する特異性(例えば相補性)を有する1つまたは複数のNPPF(例えば、単一の標的核酸分子に十分ハイブリダイズすることのみ可能である)、および(2)それぞれ単一の標的遺伝子に対する特異性(例えば相補性)を有するが、その遺伝子における複数のバリエーションを検出する能力を有する1つまたは複数のNPPF(例えば、標的遺伝子の2つまたはそれより多くのバリエーション、例えば野生型配列およびその少なくとも1つのバリエーション、例えば野生型遺伝子配列の2、3、4、5、6、7、8、9または10個の異なるバリエーションに十分にハイブリダイズすることができる)などである。一部の例において、反応物は、(1)それぞれ単一の標的核酸配列に対する特異性(例えば相補性)を有する、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、または少なくとも30個の異なるNPPF、および(2)それぞれ単一の標的遺伝子に対する特異性(例えば相補性)を有するが、その遺伝子における複数のバリエーションを検出する能力を有する、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、または少なくとも30個の異なるNPPFを含む。
したがって、単一の試料を、1つまたは複数のNPPFと接触させることができる。NPPFのセットは、それぞれ(1)異なる標的配列および/または同じ標的遺伝子の異なる部分に特異的な、または(2)単一の標的遺伝子であるが、遺伝子配列のバリエーションを検出する能力を有するものに特異的な、2つまたはそれより多くのNPPFの集合体である。NPPFのセットは、少なくとも、最大で、または正確に、2、3、4、5、6、7、8、9、10、12、15、20、25、30、50、100、500、1000、2000、3000、5000または10,000個の異なるNPPFを含んでいてもよい。一部の例において、標的が過剰になるように、このようなNPPFに対して、例えば100倍、500倍、1000倍、10,000倍、100,000倍または106倍過剰になるように、試料を十分な量のNPPFと接触させる。一部の例において、NPPFのセットが使用される場合、そのセットの各NPPFは、試料中のそのそれぞれの標的(または標的の一部)に対して過剰に提供することができる。過剰なNPPFは、特定の標的に結合するNPPFの量の定量を容易にすることができる。一部の方法の実施形態は、複数の試料(例えば、少なくとも、最大で、または正確に10、25、50、75、100、500、1000、2000、3000、5000または10,000個の異なる試料)を、同じNPPFまたはNPPFのセットと同時または同時発生的に接触させることを含む。
特定の標的または試料(例えば固定または架橋された試料など)と共に使用するためのNPPFの適切なサイズを経験的に決定する方法は、慣例的である。具体的な実施形態において、NPPFは、最大500ヌクレオチドの長さ、例えば最大400、最大250、最大100、または最大75ヌクレオチドの長さであってもよく、例えば、20〜500、20〜250、25〜200、25〜100、25〜75、または25〜50ヌクレオチドの範囲内の長さであってもよい。1つの非限定的な例において、NPPFは、少なくとも35ヌクレオチドの長さ、例えば少なくとも40、少なくとも45、少なくとも50、少なくとも75、少なくとも100、少なくとも150、または少なくとも200ヌクレオチドの長さ、例えば50から200、50から150、50から100、75から200、40から80、35から150、または36、72、75、もしくは100ヌクレオチドの長さである。特定のNPPFの実施形態は、望ましい機能性に応じてそれより長くてもよいし、またはそれより短くてもよい。一部の例において、NPPFは、固定および/または架橋された試料に浸透するのに適切なサイズにされる(例えば、十分に小さい)。固定または架橋された試料は、固定または架橋の程度において変化する可能性があるため、当業者は、例えば、すでにわかっている固定された標的濃度を有する試料を使用した一連の実験を試行し、標的シグナル強度に対するNPPFサイズを比較することによって、特定の試料の条件またはタイプごとの適切なNPPFサイズを決定することができる。一部の例において、試料(それゆえに少なくともある比率の標的)が固定または架橋されており、NPPFは、シグナル強度が高いままであり、NPPFサイズに応じて実質的に変化しない程度に十分小さい。
NPPF−標的およびNPPF−CFSハイブリダイゼーションの特異性に影響を与える要因としては、NPPFおよびCFSの長さ、融解温度、自己相補性、および繰り返しのまたは固有ではない配列の存在が挙げられる。例えば、Sambrookら、Molecular Cloning:A Laboratory Manual、第3版、Cold Spring Harbor Press、2001年;Ausubelら、Current Protocols in Molecular Biology、Greene Publishing Associates、1992年(および2000年までの別冊);Ausubelら、Short Protocols in Molecular Biology:A Compendium of Methods from Current Protocols in Molecular Biology、第4版、Wiley & Sons、1999年を参照されたい。特定の程度のハイブリダイゼーションをもたらす条件(ストリンジェンシー)は、ハイブリダイゼーション方法の性質およびハイブリダイズする核酸配列の組成および長さに応じて様々となる。一般的に、ハイブリダイゼーションの温度およびハイブリダイゼーション緩衝液のイオン強度(例えばNa+濃度など)が、ハイブリダイゼーションのストリンジェンシーを決定する。一部の例において、開示された方法で利用されるNPPFは、少なくとも約37℃、少なくとも約42℃、少なくとも約45℃、少なくとも約50℃、少なくとも約55℃、少なくとも約60℃、少なくとも約65℃、少なくとも約70℃、少なくとも約75℃、少なくとも約80℃、例えば約42℃〜80℃(例えば、約37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、または80℃)のTmを有する。1つの非限定的な例において、開示された方法で利用されるNPPFは、約42℃のTmを有する。プローブのTmを計算する方法は当業者に公知である(例えば、Sambrookら、Molecular Cloning:A Laboratory Manual、第3版、Cold Spring Harbor Press、2001年、10章を参照)。一部の例において、特定の反応のためのNPPFは、試料中の複数の標的核酸分子の同時の検出またはシーケンシングを容易にするために、それぞれ同じまたは類似のTm、例えば互いに±約10℃、例えば互いに±10℃、9℃、8℃、7℃、6℃、5℃、4℃、3℃、2℃、または1℃であるTmを有するように選択される。
A.標的にハイブリダイズする領域
NPPF配列102(または122)の標的核酸配列に特異的にハイブリダイズする部分は、配列において、シーケンシングされる標的核酸配列に相補的である。この相補性は、NPPのみが単一の標的核酸配列にハイブリダイズするように設計することができ、または複数の標的核酸配列、例えば野生型遺伝子およびそのバリエーションなどにハイブリダイズすることができるように設計することができる。例えば、図10で示されるように、単一のNPPF(配列番号1)を、野生型BRAF配列だけでなく、V600E/K/R/E2/D突然変異をコードする突然変異配列にもハイブリダイズするように設計し、単一のNPPF(配列番号8)を、野生型KRAS配列だけでなく、G12/D/V/A/C/S/RおよびG12D突然変異をコードする突然変異配列にもハイブリダイズするように設計し、さらに、単一のNPPF(配列番号17)を、野生型KRAS配列だけでなく、Q61E/R/L/H/C/T突然変異をコードする突然変異配列にもハイブリダイズするように設計した。図10は、NPPFの配列、および標的配列を示す(したがって、BRAFおよびアミノ酸V600に突然変異をもたらす突然変異(赤色のヌクレオチド)に特異的な配列番号1に示されるNPPFは、配列番号2〜7の相補配列にハイブリダイズし、KRASならびにアミノ酸G12およびG13に突然変異をもたらす突然変異(赤色のヌクレオチド)に特異的な配列番号8に示されるNPPFは、配列番号9〜16の相補配列にハイブリダイズし、KRASおよびアミノ酸Q61に突然変異をもたらす突然変異(赤色のヌクレオチド)に特異的な配列番号17に示されるNPPFは、配列番号18〜23の相補配列にハイブリダイズする)。
当業者は、配列102(または122)は、必ずしも標的核酸全体に相補的でなくてもよいことを理解するであろう(例えば、標的が100,000ヌクレオチドの遺伝子である場合、配列102(または122)は、特定の標的核酸分子に相補的なその一部であってもよく、例えば少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも40、少なくとも50、少なくとも100個、またはそれより多くの連続したヌクレオチドであってもよい)。プローブの特異性は長さに応じて増加する。したがって、例えば、25個の連続したヌクレオチドを含む、標的核酸配列に特異的に結合する配列102(または122)は、15ヌクレオチドのみの対応する配列より高い特異性で標的配列にアニールする。したがって、本明細書で開示されたNPPFは、特定の標的核酸分子(例えば、標的DNAまたは標的RNAに相補的な、約6から50、6から60、10から40、10から60、15から30、18から23、19から22、または20から25個の連続したヌクレオチド)に相補的な、少なくとも6、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも100個、またはそれより多くの連続したヌクレオチドを含む標的核酸配列に特異的に結合する配列102(または122)を有していてもよい。
本開示の方法を実施するのに使用されるNPPFの一部であり得る標的核酸配列に特異的に結合する配列102(または122)の特定の長さとしては、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50個の連続した、標的核酸分子に相補的なヌクレオチドが挙げられる。標的核酸分子がmiRNA(またはsiRNA)である一部の例において、標的核酸配列に特異的に結合する配列102(または122)の長さは、miRNA(またはsiRNA)の長さに適合させるために、例えば20〜30ヌクレオチドの長さなど(例えば20、21、22、23、24、25、26、27、28、29、または30ヌクレオチドなど)のより短い長さであってもよい。しかしながら、当業者は、標的に特異的に結合する配列102(または122)は、必ずしも標的核酸分子に100%相補的でなくてもよいことを理解するであろう。一部の例において、標的に相補的なNPPFの領域と標的核酸とは、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%の相補性を有するが、ヌクレアーゼでの消化後に何らかのミスマッチが残る可能性がある。一部の例において、例えば点突然変異の検出が望ましい場合、2つのNPPFを使用することができ、その場合、1つのNPPFの配列102(または122)は、野生型配列に特異的であり、第2のNPPFの配列102(または122)は、突然変異配列に特異的である(それにより定量的な測定が可能になる)。反応条件およびそれに対応する使用されるヌクレアーゼの選択性に応じて、例えばヌクレアーゼ消化を助けるために、1つより多くのミスマッチ(例えば少なくとも2つの隣接するミスマッチなど)が存在していてもよい。一部の例において、NPPFは、1つまたは複数の位置(例えば1、2、3、4、5つ、またはそれより多くの位置)に縮重を有し、例えば、標的に特異的に結合する配列102(または122)中の特定された位置におけるヌクレオチドの混合物(例えば2、3、または4ヌクレオチドなど)である。他の例において、点突然変異の検出が望ましい場合、単一のNPPFを使用することができ、その場合、NPPFの配列102(または122)は、野生型配列および突然変異配列の両方へのハイブリダイゼーションが可能になるようなものである(例えば、図10を参照)。一部の例において、NPPFは、例えば突然変異を含有する領域を同定するために、1つまたは複数のランダム塩基を含む。
一部の例において、NPPFの配列102(または122)は、少なくとも1つのdUTP(例えば少なくとも2、少なくとも3、少なくとも4、または少なくとも5つのdUTP、例えば1、2、3、4、5、6、7、8、9、10または11個のdUTP)を含む。一部の例において、dTTPの全てがdUTPで置き換えられている。このような塩基の存在は、後続のステップ(例えば、ライゲートした標的からのNPPFの変性の後、ただしシーケンシングの前)において、ウラシルDNAデグリコシラーゼ(UDG)で一本鎖NPPFを分解または破壊することを可能にする。
一例において、標的核酸分子の全てまたは一部に相補的なNPPFの配列102(または122)は、少なくとも1つのヌクレオチドミスマッチを含む。すなわち、少なくとも1つのヌクレオチドは、標的核酸分子中のその対応するヌクレオチドに相補的ではなく、したがってこの位置で塩基対を形成しない。例えば、図10で示されるように、配列番号1は、12位に「A」の代わりに「G」を含有し、配列番号8は、15位に「A」の代わりに「G」を含有し、配列番号17は、13位に「C」の代わりに「T」を含有する。一部の例において、フランキング配列中に、ミスマッチは存在しない。一部の例において、フランキング配列の2塩基以内に、ミスマッチは存在しない(したがってNPPFの標的核酸分子の全てまたは一部に相補的な領域の5’末端または3’末端の2塩基以内に存在しない)。一部の例において、ミスマッチは、NPPFの3’または5’末端から少なくとも2塩基離れている。一部の例において、ミスマッチの存在は、標的核酸分子からNPPFを区別することを可能にする。
B.フランキング配列
フランキング配列104、106(または124、126)の配列は、CFSが特異的にハイブリダイズできる相補的配列を提供する。したがって、各フランキング配列104、106(または124、126)は、CFSの少なくとも一部に相補的である(例えば、5’−フランキング配列は、5CFSに相補的であり、3’−フランキング配列は、3CFSに相補的である)。フランキング配列は、他の状況で試料中に認められる(例えば、ヒトゲノム中に認められない)配列に類似していない。したがって、フランキング配列は、他の状況で試料中に存在するが核酸分子中に認められない連続したヌクレオチドの配列を含む。例えば、標的核酸がヒト配列である場合、フランキング配列の配列は、標的(例えばヒト)ゲノム中に認められる配列に類似していない。これは、標的ゲノム中に存在する可能性がある非標的配列のNPPFへの非特異的な結合(または交差反応性)の低減に役立つ。ゲノムに対するその類似性について配列を分析する方法は、公知である。
NPPFは、1または2つのフランキング配列(例えば、5’末端に1つ、3’末端に1つ、または両方)を含んでいてもよく、フランキング配列は、同一であってもよいし、または異なっていてもよい。具体的な例において、各フランキング配列は、他のいかなるNPPF配列(例えば、配列102、122または他のフランキング配列)にも、または試料のいかなる構成要素にも特異的に結合しない。一部の例において、2つのフランキング配列がある場合、各フランキング配列104、106(または124、126)の配列は、異なる。2つの異なるフランキング配列(例えば同じNPPF上の2つの異なるフランキング配列、および/またはNPPFのセット中の他のNPPFのフランキング配列)がある場合、一部の例において、各フランキング配列104、106(または124、126)は、類似の融解温度(Tm)、例えば互いにTm±約10℃または±5℃、例えば±4℃、3℃、2℃、または1℃を有する。
一部の例において、少なくとも一方のフランキング配列は、少なくとも1つのdUTP(例えば、フランキング配列中、少なくとも2、少なくとも3、少なくとも4、または少なくとも5つのdUTP、例えばフランキング配列1つ当たり1、2、3、4、5、6、7、8、9、10または11個のdUTP)を含む。このような塩基の存在は、後続のステップ(例えば、ライゲートした標的からのNPPFの変性の後、ただしシーケンシングの前)において、ウラシルDNAデグリコシラーゼ(UDG)で一本鎖NPPFを分解または破壊することを可能にする。一部の例において、NPPFは、それぞれ少なくとも1つのdUTPを有する2つのフランキング配列を含む。一部の例において、NPPFは、2つのフランキング配列を含むが、1つのみのフランキング配列が、少なくとも1つのdUTPを有する。一部の例において、NPPFは、少なくとも1つのdUTPを有する単一のフランキング配列を含む。一部の例において、dUTPの配置は、標的核酸分子の領域に相補的な配列に近接しており、例えば、標的核酸分子の領域に相補的な配列から1、2、3、4、5塩基離れている(例えば、標的核酸分子の領域に相補的な配列の1、2、3、4、5塩基以内である)。一部の例において、dUTPの配置は、標的核酸分子の領域に相補的な配列から少なくとも2塩基(例えば少なくとも3、少なくとも4、または少なくとも5塩基)離れている。例えば、5’末端フランキング配列104(または124)中の少なくとも1つのdUTPは、5’末端フランキング配列104(または124)の3’末端から1、2、3、4、または5塩基であってもよい。例えば、3’末端フランキング配列106(または126)中の少なくとも1つのdUTPは、3’末端フランキング配列106(または126)の5’末端から1、2、3、4、または5塩基であってもよい。
一例において、NPPFのフランキング配列104、106(または124、126)部分は、少なくとも1つのヌクレオチドミスマッチを含む。すなわち、少なくとも1ヌクレオチドは、CFS中のその対応するヌクレオチドに相補的ではなく、したがってこの位置で塩基対を形成しない。
特定の例において、NPPFのフランキング配列104、106(または124、126)部分は、少なくとも12ヌクレオチドの長さ、または少なくとも25ヌクレオチドの長さ、例えば少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも40、または少なくとも50ヌクレオチドの長さ、例えば12から50、12から25、または12から30ヌクレオチド、例えば、20、21、22、23、24、25、26、27、28、29または30ヌクレオチドの長さであり、この場合、この連続したヌクレオチドは、試験される試料中に存在する核酸分子中に認められない。フランキング配列に相補的な配列(CFS)を有する分子をフランキング配列にハイブリダイズすることによって、フランキング配列は、ヌクレアーゼによる分解から保護される。
IV.相補的フランキング配列(CFS)
各CFS(例えば、図2Aの208または210)は、NPPFのその対応するフランキング配列に相補的である。例えば、NPPFが5’−フランキング配列を含む場合、5CFSが本方法に使用される。NPPFが3’−フランキング配列を含む場合、3CFSが本方法に使用される。5’−および3’−フランキング配列が互いに異なる場合、5CFSおよび3CFSは、互いに異なる。当業者は、CFSおよびNPPFのフランキング配列は、NPPFとその標的および対応するCFSとのハイブリダイゼーションが起こり得る限り、必ずしも100%相補的でなくてもよいことを理解するであろう。一部の例において、NPPFおよびCFSのフランキング配列は、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、または100%の相補性を共有する。一部の例において、CFSは、NPPFのその対応するフランキング配列と同じ長さである。例えば、フランキング配列が25ntの場合、CFSは25ntであり得る。
一部の例において、CFSは、標的ゲノムで認められる配列に類似していない。例えば、標的核酸がヒト配列である場合、CFSの配列(および対応するフランキング配列)は、標的ゲノムで認められる配列に類似していない。これは、CFS(およびNPPF)への結合から標的ゲノム中に存在する可能性がある非標的配列の結合を低減するのに役立つ。ゲノムに対するその類似性に関して配列を分析する方法は当技術分野において周知である。
CFSは、増幅プライマーの少なくとも一部に相補的な万能な増幅ポイントを提供することができる。したがってCFSは、異なる標的核酸分子ごとにライゲートした標的を増幅するのに同じ増幅プライマーを使用することを許容する。したがって、CFSの配列の少なくとも一部は、増幅プライマーの少なくとも一部に相補的である。図5で示されるように、これは、プライマーをCFSにハイブリダイズさせ、CFSがライゲートされている標的核酸分子を増幅することを可能にする。CFSは異なる標的核酸分子間で同一であってもよいことから、これは、任意の数のCFSがライゲートされている異なる標的を増幅するのに同じプライマーを使用することを許容する。したがって、5CFSに相補的な配列を含む増幅プライマー、および3CFSに相補的な配列を含む増幅プライマーはどちらも、標的配列が異なっているとしても、複数のライゲートした標的を増幅するのに単一の反応で使用することができる。
一部の例において、CFSは、実験タグ配列および/またはシーケンシングアダプター配列を含まない。一部の例において、CFSは、実験タグ配列および/またはシーケンシングアダプター配列を含むかまたはそれらからなる。他の例において、ライゲートした標的(少なくとも1つのCFSを含む)を増幅するのに使用されるプライマーは、実験タグ配列および/またはシーケンシングアダプター配列(例えば一部のシーケンシングプラットフォームに必要なポリAまたはポリT配列など)を含み、したがってライゲートした標的の増幅中に、実験タグおよび/またはシーケンシングアダプターをライゲートした標的アンプリコンに取り込むことが許容される。実験的タグおよびシーケンシングアダプターは、セクションII、Gで上述されている。1つより多くの実験タグ(例えば少なくとも2、少なくとも3、少なくとも4、または少なくとも5つの異なる実験タグ)、例えばライゲートした標的、ライゲートした標的アンプリコン、または試料を固有に同定するのに使用されるタグなどを含めることができることが理解されるであろう。
図6AおよびBで例示されているように、本方法は、単一のCFSを使用することができる。図6Aおよび6Bは、5’末端にCFS(5CFS)を示すが、その代わりに3’末端にあってもよいことが理解されるであろう。図6Aは、反応物中の標的の全てが同じCFS F1にライゲートされる例(したがって反応物中のNPPFが同じフランキング配列を有する例)を示す。F1特異的プライマーを用いた増幅は、各ライゲートした標的に同じ5’−または3’−タグ(例えば、シーケンシングアダプターまたは実験的タグ)を付加するのに使用することができる。例えば、同じシーケンシングアダプターは、ライゲートした標的の全てに付加することができ、それにより、同じシーケンシングプラットフォームで標的をシーケンシングすることが許容される。図6Bは、反応物中の各標的が異なるCFS F1、F2、およびF3にライゲートされる例(したがって反応物中のNPPFまたはNPPFの各部分集団が異なるフランキング配列を有する例)を示す。別の例において、T1−F1、T2−F2、およびT3−F3特異的プライマーを用いた増幅は、それぞれの異なるライゲートした標的に異なる実験的タグを付加するのに使用することができる。
図6C〜6Fで例示されているように、標的は、一部の例において、2つのCFSに、一方は標的の5’末端で、他方は3’末端でライゲートすることができる(したがって使用されるNPPFは、2つのフランキング配列を有する)。図6Cは、反応物中の標的の全てが両方の末端で同じCFS、F1にライゲートされる例を示す。図6Dは、5’末端上のCFSの全てが同じ(例えば、F1)であり、3’末端上のCFSの全てが同じ(例えば、F(a))であるが、5’末端および3’末端のCFSが異なる例を示す。このような例において、これは、標的の一方の末端に同じ実験タグを含め、標的の他方の側に同じシーケンシングアダプターを含めることを許容する。図6Eは、一方の末端上のCFSの全てが同じであるが(例えば、5’末端上のF1)、他方の末端上のCFSの全てが互いに異なる例(例えば、F(a)、F(b)、およびF(c))を示す。このような例において、これは、ライゲートした標的の全てにシーケンシングアダプターを使用することを許容する。他方の末端上のフランキング配列、F(a)、F(b)およびF(c)は、例えば各標的を差次的に標識する(例えば異なる実験タグを使用して)のに使用することができる。図6Fは、CFSの全てが、それらの位置に関わりなく異なる例(例えば、F(a)、F(b)、F(c)、F1、F2、およびF3)を示す。この例において、各CFSは、異なる実験タグにつき、または異なる実験タグおよび異なるシーケンシングアダプターの組合せにつき使用することができる。
V.試料
試料は、1つまたは複数の標的を含む任意の集合体であり、例えば生体試料または生物学的検体であり、例えば対象(例えばヒトまたは他の哺乳類対象、例えば獣医学的な対象、例えば腫瘍または感染を有することがわかっているかまたはその疑いのある対象)から得られたものである。試料は、当業者に周知の方法を使用して収集または入手することができる。開示された方法で使用される試料としては、核酸(例えばゲノムDNA、cDNA、ウイルスDNAまたはRNA、rRNA、tRNA、mRNA、miRNA、オリゴヌクレオチド、核酸断片、改変された核酸、合成核酸など)を含む任意の検体を挙げることができる。一例において、試料は、RNAを含む。一部の例において、シーケンシングされる標的核酸分子は、試料中で架橋されているか(例えば架橋されたDNA、mRNA、miRNA、またはvRNAなど)、または試料中で可溶性である。一部の例において、試料は、固定された試料、例えば標的分子の架橋を引き起こす薬剤を含む試料(したがって、一部の例において、標的核酸分子が固定されていてもよい)などである。一部の例において、試料中の標的核酸は、標的核酸分子を検出またはシーケンシングする前に、抽出されていないか、可溶化されていないか、または両方である。一部の例において、試料は、ex situの生体試料である。
一部の例において、開示された方法は、試料の分析の前に試料を得ることを含む。一部の例において、開示された方法は、特定の疾患または腫瘍を有する対象を選択すること、次いで一部の例において、1つまたは複数の標的DNAまたはRNAをさらに選択して、対象の特定の疾患または腫瘍に基づき検出すること、例えば、対象につき、または1つまたは複数の療法の選択につき、診断または予後を決定することを含む。一部の例において、分析される試料中の核酸分子は、まず試料から単離されるか、抽出されるか、濃縮されるか、またはそれらの組合せが行われる。
一部の例において、試料中のRNAは、本明細書で提供される方法を実行する前に逆転写される。
一部の例において、試料、例えばex situの試料などは、溶解している。ある特定の例における溶解緩衝液は、RNAを分解する酵素を不活性化することができるが、ハイブリダイゼーション希釈緩衝液への限界希釈の後、ヌクレアーゼ活性を許容し、ストリンジェントな特異性でのハイブリダイゼーションを促進する。希釈緩衝液を添加して、溶解および他の緩衝液の阻害活性、例えば他の酵素(例えば、ポリメラーゼ)に対する阻害活性を中和することができる。代替として、溶解緩衝液および他の緩衝液の組成を、例えばポリメラーゼまたはリガーゼに容認される組成に変えてもよい。
一部の例において、本方法は、複数の試料を同時または同時発生的に分析することを含む。例えば、本方法は、少なくとも2つの異なる試料(例えば異なる対象、例えば患者からの)を同時または同時発生的に分析することができる。1つのこのような例において、本方法は、さらに、少なくとも2つの異なる試料(例えば少なくとも5、少なくとも10、少なくとも100、少なくとも500、少なくとも1000、または少なくとも10,000個の異なる試料)中の少なくとも2つの異なる標的核酸分子(例えば2、3、4、5、6、7、8、9または10個の異なる標的)を同時または同時発生的に検出またはシーケンシングすることができる。
例示的な試料としては、これらに限定されないが、細胞、細胞溶解産物、血液塗抹標本、細胞遠心分離調製物、フローソーティングされたまたはそれ以外の方法で選択された細胞集団、細胞学的な塗抹標本、染色体調製物、体液(例えば、血液およびその画分、例えば白血球、血清または血漿など;唾液;痰;尿;脊髄液;胃液;汗;精液など)、口腔細胞、組織、細胞もしくは臓器の抽出物、組織生検(例えば、腫瘍またはリンパ節生検)、液体生検、細針吸引物、気管支洗浄物(brocoscopic lavage)、パンチ生検、循環腫瘍細胞、骨髄、羊水穿刺試料、病理解剖材料、新鮮な組織、凍結した組織、固定された組織、固定およびワックス(例えば、パラフィン)包埋組織、骨髄、ならびに/または組織切片(例えば、クライオスタット組織切片および/またはパラフィン包埋組織切片)が挙げられる。また生体試料は、例えば細胞培養試料または上清などの実験調査試料であってもよい。
例示的な試料は、正常な細胞もしくは組織から、または新生細胞もしくは組織から得ることができる。新形成は、1つまたは複数の細胞が、分化の損失、成長速度の増加、周囲組織の浸潤を伴う特徴的な退形成を受け、そのような細胞が転移可能な状態であり得る生物学的な状態である。特定の例において、生体試料としては、腫瘍試料、例えば新生細胞を含有する試料などが挙げられる。
例示的な新生細胞または組織は、例えば、肺がん(例えば、非小細胞肺がん、例えば肺扁平上皮癌など)、乳癌(例えば小葉および管癌)、副腎皮質がん、エナメル上皮腫、乳頭部がん、膀胱がん、骨がん、子宮頸がん、胆管腫、結腸直腸がん、子宮内膜がん、食道がん、胃がん、神経膠腫、顆粒細胞腫、頭頸部がん、肝細胞がん、胞状奇胎(hydatiform mole)、リンパ腫、黒色腫、中皮腫、骨髄腫、神経芽細胞腫、口腔がん、骨軟骨腫、骨肉腫、卵巣がん、膵臓がん、毛基質細胞腫、前立腺がん、腎細胞がん、唾液腺腫瘍、軟部組織腫瘍、スピッツ母斑、扁平上皮がん、奇形様のがん、および甲状腺がんなどの固形腫瘍に含まれるもの、またはそれから単離されたものであり得る。例示的な新生細胞としてはまた、例えば、白血病、例えば、急性白血病(例えば急性リンパ性白血病、急性骨髄性白血病、急性骨髄性白血病および骨髄芽球性、前骨髄球性、骨髄単球性、単球および赤白血病など)、慢性白血病(例えば慢性骨髄性(顆粒球)白血病、慢性骨髄性白血病、および慢性リンパ球性白血病など)、真性多血症、リンパ腫、ホジキン病、非ホジキンリンパ腫(低悪性度および高悪性度の形態)、多発性骨髄腫、ワルデンシュトレームマクログロブリン血症、重鎖病、骨髄異形成症候群、および脊髄形成異常などの血液がんに含まれるもの、またはそれから単離されたものも挙げることができる。
例えば、細胞性物質を含有する腫瘍からの試料は、腫瘍の全てまたは一部の外科的切除、腫瘍からの穿刺吸引物の収集、加えて他の方法により得ることができる。一部の例において、組織または細胞試料を基板に適用し、分析して、1つまたは複数の標的DNAまたはRNAの存在を決定する。開示された方法において有用な固体支持体は、生体試料を有していればよく、任意選択で、試料中の構成要素(例えば、タンパク質および/または核酸配列)を都合よく検出することを許容する。例示的な支持体としては、顕微鏡スライド(例えば、ガラス顕微鏡スライドまたはプラスチック顕微鏡スライド)、カバーガラス(例えば、ガラスカバーガラスまたはプラスチックカバーガラス)、組織培養皿、マルチウェルプレート、膜(例えば、ニトロセルロースまたはポリフッ化ビニリデン(PVDF))またはBIACORE(商標)チップが挙げられる。
開示された方法は、高感度で特異的であり、限られた数の細胞しか含有しない試料中の標的核酸分子であってもシーケンシングを可能にする。少数の細胞、例えば250,000個未満の細胞(例えば100,000個未満、50,000個未満、10,000個未満、1,000個未満、500個未満、200個未満、100個未満の細胞、または10個未満の細胞)などを含む試料としては、これらに限定されないが、FFPE試料、細針吸引物(例えば肺、前立腺、リンパ液、乳房、または肝臓からのものなど)、パンチ生検、針生検、(例えば、FACS)ソートされた細胞または循環腫瘍細胞の小集団、肺吸引物、少数のレーザー捕獲された、フローソーティングされた、もしくは肉眼での解剖で得られた細胞または循環腫瘍細胞、エキソゾームおよび他の細胞内粒子、または体液(例えば血漿、血清、脊髄液、唾液、および乳房吸引物など)が挙げられる。例えば、1000個もの少ない細胞でも(例えば1000個またはそれより多くの細胞、例えば1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、50,000個、またはそれより多くの細胞を含む試料など)、標的DNAまたは標的RNAをシーケンシングすることができる(したがって検出することができる)。一部の例において、約1000から100,000個の細胞、例えば約1000から50,000、1000から15,000、1000から10,000、1000から5000、3000から50,000、6000から30,000、または10,000から50,000個の細胞で、標的DNAまたは標的RNAの発現を検出することができる。一部の例において、約100から250,000個の細胞、例えば約100から100,000、100から50,000、100から10,000、100から5000、100から500、100から200、または100から150個の細胞で、標的DNAまたは標的RNAの発現を検出することができる。他の例において、約1から1000個の細胞(例えば、約1から500個の細胞、約1から250個の細胞、約1から100個の細胞、約1から50個の細胞、約1から25個の細胞、または約1個の細胞など)で、標的DNAまたは標的RNAをシーケンシングすることができる。
試料は、試料を標的特異的な試薬(例えばNPPFおよび対応するCFSなど)と接触させる前に(またはそれと同時発生的に)多数の方法で処理することができる。1つの比較的簡単な処理は、緩衝液、例えば溶解緩衝液中での試料の懸濁であり、それにより、単一の溶液中に試料の全ての構成要素が維持される。一部の例において、試料は、試料から標的(例えば、DNAまたはmRNA)を単離(例えば、抽出)するために部分的または完全に処理される。標的(例えばDNAまたはRNAなど)が、試料中の他の非標的の生物学的構成要素から分離されて精製される場合、それは単離または抽出されている。精製は、試料中にも認められる1つまたは複数の無関係な構成要素(例えば、細胞器官、タンパク質)から標的を分離することを指す。混成の検体または試料から単離、抽出または精製される構成要素は、典型的には、未精製または未抽出の試料と比較して、少なくとも50%、少なくとも60%、少なくとも75%、少なくとも90%、もしくは少なくとも98%、またはさらに少なくとも99%に富化される。
試料からの生物学的な構成要素の単離は、時間がかかり、例えば分解および/もしくは不良な効率または単離に使用されるプロセスの不完全さによって単離されている構成要素を損失するリスクを有する。さらに、例えば固定された組織などの一部の試料を用いる場合、標的(例えばDNAまたはRNA(例えば、mRNAまたはmiRNA)など)は、高い忠実度で単離することが困難なことで知られている(例えば、新鮮なまたは凍結した組織と比較して)。これはなぜなら、少なくともある程度の比率の標的が固定された試料中の他の構成要素に架橋され、それゆえに容易に単離または可溶化できず、可溶性および不溶性画分が分離されるときに失われる可能性があるためと考えられる。加えて、非常に短いDNAおよびRNA断片は、沈殿またはマトリックス結合ステップ中に失われる可能性があり、測定バイアスが生じる。したがって、一部の例において、開示された標的核酸をシーケンシングする方法は、試料を1つまたは複数のNPPFおよび対応するCFSと接触させる前に試料から標的核酸分子を精製、抽出または単離することを必要としないかまたは含まず、および/または試料をNPPFおよび対応するCFSと接触させる前に、試料の全ての構成要素を保持する溶液、例えば溶解緩衝液中に試料を懸濁することのみを含む。したがって、一部の例において、本方法は、核酸分子の分析の前に、試料から核酸分子を単離することを含まない。
一部の例において、試料中の細胞を、水溶液中で(例えば溶解緩衝液を使用して)溶解させるかまたは透過化する。水溶液または溶解緩衝液は、界面活性剤(例えばドデシル硫酸ナトリウムなど)および1つまたは複数のカオトロピック剤(例えばホルムアミド、グアニジニウムHCl、グアニジンイソチオシアネート、または尿素など)を含む。溶液はまた、緩衝液(例えばSSC)を含有していてもよい。一部の例において、溶解緩衝液は、約8%から60%のホルムアミド(v/v)、約0.01%から0.1%のSDS、および約0.5〜6×SSC(例えば、約3×SSC)を含む。緩衝液は、任意選択で、tRNA(例えば、約0.001から約2mg/ml);リボヌクレアーゼ;DNアーゼ;プロテイナーゼK;タンパク質、マトリックス、炭水化物、脂質、もしくはオリゴヌクレオチドの1種を分解する酵素(例えばコラゲナーゼまたはリパーゼ)、またはそれらの組合せを含んでいてもよい。溶解緩衝液はまた、pHインジケーター、例えばフェノールレッドなどを含んでいてもよい。細胞を、水溶液(任意選択で油で覆われた)中で、十分な期間(例えば約1分から約60分、例えば約5分から約20分、または約10分)、十分な温度(例えば約22℃から約110℃、例えば、約80℃から約105℃、約37℃から約105℃、または約90℃から約100℃)でインキュベートして、細胞を溶解または透過化する。一部の例において、溶解は、約50℃、65℃、95℃、または105℃で実行される。一部の例において、溶解ステップは、試料を約95℃で約5〜15分インキュベートして、試料中の、ゲノムDNAではなくRNAを変性させることを含む。他の例において、溶解ステップは、試料を約105℃で約5〜15分インキュベートして、試料中のRNAおよびゲノムDNAの両方を変性させることを含む。一例において、溶解緩衝液中に、プロテイナーゼKが含まれる。
一部の例において、粗細胞溶解物は、さらなる精製を行わずに直接使用される。細胞は、NPPFおよび対応するCFSの1つまたは複数の存在または非存在で溶解してもよい。NPPFおよび対応するCFSの非存在下で細胞を溶解する場合、それに続き、1つまたは複数のNPPFおよび対応するCFSを粗溶解産物に添加することができる。他の例において、核酸(例えばDNAおよび/またはRNAなど)は、溶解産物を1つまたは複数のNPPFおよび対応するCFSと接触させる前に、細胞溶解産物から単離される。
他の例において、組織試料は、組織を媒体に固着および包埋させることによって調製されるか、または例えば細胞を固体支持体上に塗抹または遠心分離することによって、固体支持体(例えばスライドガラスなど)上に単分子層として調製される細胞懸濁液を含む。さらなる例において、新鮮な凍結した(例えば、固着していない)組織または組織切片は、本明細書で開示された方法で使用することができる。特定の例において、FFPE組織切片が開示された方法で使用される。
一部の例において、包埋媒体が使用される。包埋媒体は、組織および/または細胞を包埋して今後の分析のためにそれらを保存することを助ける不活性材料である。包埋はまた、組織試料を薄い切片にスライスすることも可能にする。包埋媒体としては、パラフィン、セロイジン、OCT(商標)コンパウンド、寒天、プラスチック、またはアクリル系樹脂が挙げられる。多くの包埋媒体は疎水性であるため、不活性材料は、主として親水性試薬を利用する分析前に、除去する必要がある場合がある。脱パラフィンまたは脱ろうという用語は、生体試料から任意のタイプの包埋媒体を部分的または完全に除去することを指す。例えば、パラフィン包埋組織切片は、有機溶媒、例えばトルエン、キシレン、リモネン、または他の好適な溶媒などに通過させることによって脱ろうされる。他の例において、パラフィン包埋組織切片は、直接(例えば、脱ろうステップを行わずに)利用される。
組織は、灌流などの任意の好適なプロセスによって、または固定剤中の浸漬によって固着することができる。固定剤は、架橋剤(例えばアルデヒド、例えばホルムアルデヒド、パラホルムアルデヒド、およびグルタルアルデヒドなど、加えて非アルデヒド架橋剤)、酸化剤(例えば、金属イオンおよび錯体、例えば四酸化オスミウムおよびクロム酸など)、タンパク質変性剤(例えば、酢酸、メタノール、およびエタノール)、未知のメカニズムの固定剤(例えば、塩化第二水銀、アセトン、およびピクリン酸)、試薬の組合せ(例えば、カルノア固定剤、メタカルン(methacarn)、ブアン液、B5固定剤、ロスマン液、およびジェンダー液)、マイクロ波、および種々の固定剤(例えば、排除体積固定および蒸気固定)として分類することができる。また固定剤中に、例えば緩衝液、界面活性剤、タンニン酸、フェノール、金属塩(例えば塩化亜鉛、硫酸亜鉛、およびリチウム塩など)、およびランタンなどの添加剤が含まれていてもよい。
組織または細胞試料の調製において最も一般的に使用される固定剤は、ホルムアルデヒドであり、これは、一般的にはホルマリン溶液(緩衝溶液中4%ホルムアルデヒド、10%緩衝ホルマリンと称される)の形態である。一例において、固定剤は、10%中性緩衝ホルマリンであり、したがって一部の例において、試料は、ホルマリン固定されている。
一部の例において、試料は、環境試料(例えば土壌、空気、空気フィルター、もしくは水試料、または表面から得られた試料(例えば綿棒などでのふき取りによる)など)であるか、または例えば存在する可能性がある病原体を検出するための食品試料(例えば野菜、果実、乳製品または肉類を含有する試料など)である。
VI.標的核酸
標的核酸分子(例えば標的DNAまたはRNAなど)は、開示された方法を用いてその検出、量、および/または配列が決定されること(例えば定量的または定性的な方式で)が意図される核酸分子である。一例において、標的は、核酸分子、例えば目的のDNAまたはRNAの定義された領域または特定の部分である。標的核酸配列が標的DNAまたは標的RNAである例において、このような標的は、その特異的な配列または機能によって;その遺伝子またはタンパク質の名称によって;または他の核酸のなかからそれを固有に同定する他の任意の手段によって定義することができる。
一部の例において、標的核酸配列(例えば、DNAまたはRNA)の変更は、疾患または状態に「関連する」。すなわち、標的核酸配列のシーケンシングは、疾患または状態に関する試料のステータスを推論するのに使用することができる。例えば、標的核酸配列は、第1の形態が疾患または状態の非存在と相関し、第2の(または異なる)形態が疾患または状態の存在と相関するように、2つの(またはそれより多くの)区別可能な形態で存在していてもよい。2つの異なる形態は、例えばヌクレオチド多形または突然変異などによって定性的に区別可能であり、および/または2つの異なる形態は、例えば試料中に存在する標的核酸配列のコピー数などによって定量的に区別可能である。
標的は、真核生物、原核生物、ウイルス、真菌、細菌、寄生虫、または他の生物由来かどうかにかかわらず、一本鎖、二本鎖または他の複数鎖の核酸分子(例えば、DNA(例えば、ゲノム、ミトコンドリア、または合成)、RNA(例えばmRNA、miRNA、tRNA、siRNA、長い非コード(nc)RNA、生物学的に発生するアンチセンスRNA、Piwi相互作用RNA(piRNA)、または低分子核小体RNA(snoRNA)など)を含む。ゲノムDNA標的は、ゲノムの1つまたは数々の部分、例えばコード領域(例えば、遺伝子またはエクソン)、非コード領域(生物学的機能が公知かまたは未知かにかかわらず、例えば、エンハンサー、プロモーター、調節領域、テロメア、または「ナンセンス」DNA)などを含んでいてもよい。一部の実施形態では、標的は、天然に存在する可能性がある突然変異(例えば、生殖細胞または体細胞突然変異)、またはそれ以外の方法で誘発された突然変異(例えば、化学的に、または放射線誘発突然変異)を含有していてもよいし、またはその結果であってもよい。このような突然変異は、ゲノム再編成(例えば転座、挿入、欠失、または転位など)、単一ヌクレオチド多様性、および/またはゲノム増幅を含んでいてもよい(またはそれらに起因する)。一部の実施形態では、標的は、1つまたは複数の修飾されたまたは合成の単量体単位(例えば、ペプチド核酸(PNA)、ロックド核酸(LNA)、メチル化核酸、翻訳後修飾されたアミノ酸、架橋された核酸または架橋されたアミノ酸)を含有していてもよい。
NPPFが特異的に結合することができる標的核酸分子の部分も「標的」と称することができ、ここでも文脈に応じて、ただしより具体的に、標的部分、相補的領域(CR)、標的部位、保護された標的領域または保護された部位などと称する場合もある。その相補的領域に特異的に結合したNPPFは、複合体を形成し、この複合体は、全体および/または試料として標的と統合されたままであってもよいし、または全体および/または試料として標的から離れていてもよい(または分離されているかもしくは分離した状態になり得る)。一部の実施形態では、NPPF/CR複合体は、例えばヌクレアーゼ、例えばS1ヌクレアーゼなどの作用によって、全体および/または試料として標的から分離されている(または解離した状態になる)。
開示された方法を使用して、あらゆるタイプの標的核酸分子を分析することができる。一例において、標的は、リボ核酸(RNA)分子、例えばメッセンジャーRNA(mRNA)、リボソームRNA(rRNA)、トランスファーRNA(tRNA)、マイクロRNA(miRNA)、siRNA、アンチセンスRNA、またはウイルスRNA(vRNA)などである。別の例において、標的は、デオキシリボ核酸(DNA)分子、例えばゲノムDNA(gDNA)、ミトコンドリアDNA(mtDNA)、葉緑体DNA(cpDNA)、ウイルスDNA(vDNA)、cDNA、またはトランスフェクトされたDNAなどである。具体的な例において、標的は、アンチセンスヌクレオチドである。一部の例において、開示された方法を使用して、細胞または組織のトランスクリプトーム全体をシーケンシングすることができる。一例において、シーケンシングされる標的核酸分子は、試料中に、例えば約100,000回未満、約10,000回未満、約5,000回未満、約100回未満、10回未満、または1回のみしか出現しないまれな核酸分子であり、試料中に、例えば1から10,000、1から5,000、1から100、または1から10回しか出現しない核酸分子である。
複数の標的は、同じ試料またはアッセイで、または複数の試料またはアッセイであっても、例えば同時または同時発生的にシーケンシングすることができる。同様に、単一の標的も、複数の試料中で、例えば同時または同時発生的にシーケンシングすることができる。一例において、標的核酸分子は、miRNAおよびmRNAである。したがって、このような例において、本方法は、miRNAに特異的な少なくとも1つのNPPFおよびmRNAに特異的な少なくとも1つのNPPFの使用を含む。一例において、標的核酸分子は、2つの異なるDNA分子である。したがって、このような例において、本方法は、第1の標的DNAに特異的な少なくとも1つのNPPFおよび第2の標的DNAに特異的な少なくとも1つのNPPFの使用を含む。一例において、標的核酸分子は、2つの異なるRNA分子である。したがって、このような例において、本方法は、第1の標的RNAに特異的な少なくとも1つのNPPFおよび第2の標的RNAに特異的な少なくとも1つのNPPFの使用を含む。
一部の例において、開示された方法は、DNAまたはRNA単一ヌクレオチド多形(SNP)またはバリアント(sNPV)、スプライスジャンクション、メチル化DNA、遺伝子融合または他の突然変異、タンパク質に結合したDNAまたはRNA、さらにはcDNAのシーケンシング、加えて発現のレベル(例えばDNAまたはRNA発現、例えばcDNA発現、mRNA発現、miRNA発現、rRNA発現、siRNA発現、またはtRNA発現など)を許容する。ヌクレアーゼ保護プローブがハイブリダイズするように設計することができる任意の核酸分子は、開示された方法によって定量化および同定することができる。
一例において、標的試料の処理のときにメチル化塩基がNPPF中の塩基に相補的な異なる塩基に変換されるように、メチル化が生じた、または生じていない部位に塩基ミスマッチを含むNPPFを使用することによって、DNAメチル化が検出される。したがって、一部の例において、本方法は、試料を重亜硫酸塩で処理することを含む。
当業者は、標的は、天然の塩基もしくは天然にはない塩基、またはそれらの組合せを含んでいてもよいことを理解するであろう。
具体的な非限定的な例において、新生物(例えば、がん)に関連する標的核酸(例えば標的DNAまたは標的RNAなど)が選択される。新生細胞、特にがん細胞、例えばB細胞およびT細胞性白血病、リンパ腫、乳がん、結腸がん、神経系がんなどにおいて、多数の染色体異常(転座および他の再編成、倍加または欠失など)または突然変異が同定されている。
一部の例において、標的核酸分子としては、野生型および/または突然変異した:デルタアミノレブリン酸シンターゼ1(ALAS1)(例えば、GenBank受託番号NM_000688.5またはOMIM125290)、60Sリボソームタンパク質L38(RPL38)(例えば、GenBank受託番号NM_000999.3またはOMIM604182)、癌原遺伝子B−Raf(BRAF)(例えば、GenBank受託番号NM_004333.4またはOMIM164757)(例えば野生型BRAFまたはV600E、V600K、V600R、V600E2、および/またはV600D突然変異など、例えば、図10を参照)、フォークヘッドボックスタンパク質L2(FOXL2)(例えば、GenBank受託番号NM_023067.3またはOMIM605597)(例えば野生型FOXL2またはnt820 snp C→Gなど);上皮増殖因子受容体(EGFR)(例えば、GenBank受託番号NM_005228.3またはOMIM131550)(例えば野生型EGFR、および/またはT790M、L858R、D761Y、G719A、G719S、およびG719C突然変異の1つもしくは複数、または図9に示される他の突然変異);GNAS(例えば、GenBank受託番号NM_000516.5またはOMIM139320);またはKRAS(例えば、GenBank受託番号NM_004985.4またはOMIM190070)(例えば野生型KRAS、D761Y突然変異、G12突然変異、例えばG12D、G12V、G12A、G12C、G12S、G12Rの1つまたは複数、G13突然変異、例えばG13D、および/またはQ61突然変異、例えばQ61E、Q61R、Q61L、Q61H−C、および/またはQ61H−Tの1つまたは複数、例えば、図10を参照);(図7A、7B、8も参照)が挙げられる。
一部の例において、標的核酸分子としては、GAPDH(例えば、GenBank受託番号NM_002046)、PPIA(例えば、GenBank受託番号NM_021130)、RPLP0(例えば、GenBank受託番号NM_001002またはNM_053275)、RPL19(例えば、GenBank受託番号NM_000981)、ZEB1(例えば、GenBank受託番号NM_030751)、Zeb2(例えば、GenBank受託番号NM_001171653またはNM_014795)、CDH1(例えば、GenBank受託番号NM_004360)、CDH2(例えば、GenBank受託番号NM_007664)、VIM(例えば、GenBank受託番号NM_003380)、ACTA2(例えば、GenBank受託番号NM_001141945またはNM_001613)、CTNNB1(例えば、GenBank受託番号NM_001904、NM_001098209、またはNM_001098210)、KRT8(例えば、GenBank受託番号NM_002273)、SNAI1(例えば、GenBank受託番号NM_005985)、SNAI2(例えば、GenBank受託番号NM_003068)、TWIST1(例えば、GenBank受託番号NM_000474)、CD44(例えば、GenBank受託番号NM_000610、NM_001001389、NM_00100390、NM_001202555、NM_001001391、NM_001202556、NM_001001392、NM_001202557)、CD24(例えば、GenBank受託番号NM_013230)、FN1(例えば、GenBank受託番号NM_212474、NM_212476、NM_212478、NM_002026、NM_212482、NM_054034)、IL6(例えば、GenBank受託番号NM_000600)、MYC(例えば、GenBank受託番号NM_002467)、VEGFA(例えば、GenBank受託番号NM_001025366、NM_001171623、NM_003376、NM_001171624、NM_001204384、NM_001204385、NM_001025367、NM_001171625、NM_001025368、NM_001171626、NM_001033756、NM_001171627、NM_001025370、NM_001171628、NM_001171622、NM_001171630)、HIF1A(例えば、GenBank受託番号NM_001530、NM_181054)、EPAS1(例えば、GenBank受託番号NM_001430)、ESR2(例えば、GenBank受託番号NM_001040276、NM_001040275、NM_001214902、NM_001437、NM_001214903)、PRKCE(例えば、GenBank受託番号NM_005400)、EZH2(例えば、GenBank受託番号NM_001203248、NM_152998、NM_001203247、NM_004456、NM_001203249)、DAB2IP(例えば、GenBank受託番号NM_032552、NM_138709)、B2M(例えば、GenBank受託番号NM_004048)、およびSDHA(例えば、GenBank受託番号NM_004168)が挙げられる。
一部の例において、標的miRNAとしては、hsa−miR−205(MIR205、例えば、GenBank受託番号NR_029622)、hsa−miR−324(MIR324、例えば、GenBank受託番号NR_029896)、hsa−miR−301a(MIR301A、例えば、GenBank受託番号NR_029842)、hsa−miR−106b(MIR106B、例えば、GenBank受託番号NR_029831)、hsa−miR−877(MIR877、例えば、GenBank受託番号NR_030615)、hsa−miR−339(MIR339、例えば、GenBank受託番号NR_029898)、hsa−miR−10b(MIR10B、例えば、GenBank受託番号NR_029609)、hsa−miR−185(MIR185、例えば、GenBank受託番号NR_029706)、hsa−miR−27b(MIR27B、例えば、GenBank受託番号NR_029665)、hsa−miR−492(MIR492、例えば、GenBank受託番号NR_030171)、hsa−miR−146a(MIR146A、例えば、GenBank受託番号NR_029701)、hsa−miR−200a(MIR200A、例えば、GenBank受託番号NR_029834)、hsa−miR−30c(例えば、GenBank受託番号NR_029833、NR_029598)、hsa−miR−29c(MIR29C、例えば、GenBank受託番号NR_029832)、hsa−miR−191(MIR191、例えば、GenBank受託番号NR_029690)、またはhsa−miR−655(MIR655、例えば、GenBank受託番号NR_030391)が挙げられる。
一例において、標的は、病原体の核酸、例えばウイルスRNAまたはDNAなどである。例示的な病原体としては、これらに限定されないが、ウイルス、細菌、真菌、寄生虫、および原生動物が挙げられる。一例において、標的は、ウイルスRNAである。ウイルスは、プラス鎖RNAウイルスおよびマイナス鎖RNAウイルスを含む。例示的なプラス鎖RNAウイルスとしては、これらに限定されないが、ピコルナウイルス(例えばAphthoviridae[例えば口蹄疫ウイルス(FMDV)])、Cardioviridaeなど;Enteroviridae(例えばコクサッキーウイルス、エコーウイルス、エンテロウイルス、およびポリオウイルスなど);Rhinoviridae(ライノウイルス));Hepataviridae(A型肝炎ウイルス);トガウイルス(その例としては、風疹;アルファウイルス(例えば西部ウマ脳炎ウイルス、東部ウマ脳炎ウイルス、およびベネズエラウマ脳炎ウイルスなど)が挙げられる);フラビウイルス(その例としては、デング熱ウイルス、西ナイルウイルス、および日本脳炎ウイルスが挙げられる);およびコロナウイルス(その例としては、SARSコロナウイルス、例えばUrbani株などが挙げられる)が挙げられる。例示的なマイナス鎖RNAウイルスとしては、これらに限定されないが、オルトミクソウイルス(Orthomyxyovirus)(例えばインフルエンザウイルスなど)、ラブドウイルス(例えば狂犬病ウイルスなど)、およびパラミクソウイルス(その例としては、麻疹ウイルス、呼吸器系合胞体ウイルス、およびパラインフルエンザウイルスが挙げられる)が挙げられる。一例において、標的は、DNAウイルスからのウイルスDNA、例えばヘルペスウイルス(例えば水痘帯状疱疹ウイルスなど、例えばOka株;サイトメガロウイルス;および単純疱疹ウイルス(HSV)1型および2型)、アデノウイルス(例えばアデノウイルス1型およびアデノウイルス41型など)、ポックスウイルス(例えばワクシニアウイルスなど)、およびパルボウイルス(例えばパルボウイルスB19など)である。別の例において、標的は、レトロウイルスの核酸であり、例えばヒト免疫不全ウイルス1型(HIV−1)、例えばサブタイプC、HIV−2など;ウマ伝染性貧血ウイルス;ネコ免疫不全ウイルス(FIV);ネコ白血病ウイルス(FeLV);サル免疫不全ウイルス(SIV);およびトリ肉腫ウイルス由来のものである。一例において、標的核酸は、細菌の核酸である。一例において、細菌の核酸は、グラム陰性細菌、例えばEscherichia coli(K−12およびO157:H7)、Shigella dysenteriae、およびVibrio choleraeなどに由来するものである。別の例において、細菌の核酸は、グラム陽性菌、例えばBacillus anthracis、Staphylococcus aureus、肺炎球菌、淋菌、および連鎖球菌性髄膜炎(streptococcal meningitis)に由来するものである。一例において、標的核酸は、原生動物、線虫、または真菌由来の核酸である。例示的な原生動物としては、これらに限定されないが、Plasmodium、Leishmania、Acanthamoeba、Giardia、Entamoeba、Cryptosporidium、Isospora、Balantidium、Trichomonas、Trypanosoma、Naegleria、およびToxoplasmaが挙げられる。例示的な真菌としては、これらに限定されないが、Coccidiodes immitisおよびBlastomyces dermatitidisが挙げられる。
当業者は、本明細書で開示された方法を利用して検出することができる追加の標的DNAもしくはRNAおよび/または追加の標的miRNAを確認することができる。
VII.アッセイアウトプット
一部の実施形態では、開示された方法は、試料中の1つまたは複数の標的核酸分子の配列を決定することを含み、検出された配列の定量化を含んでいてもよい。本方法の結果は、使用者(例えば科学者、臨床医または他の医療従事者、実験技師、または患者など)に、試験結果に関する情報を提供する感知できるアウトプットの形態で提供することができる。一部の例において、アウトプットは、紙でのアウトプット(例えば、文書のアウトプットまたは印刷されたアウトプット)、スクリーン上の表示、グラフィックのアウトプット(例えば、グラフ、チャート、または他の図表)、または可聴のアウトプットであり得る。一例において、アウトプットは、試料中のシーケンシングされた標的核酸(または検出されなかった配列)の存在または量の定性的または定量的な指標(例えば正規化した量など)を含む表またはグラフである。他の例において、実施形態において、アウトプットは、試料中の1つまたは複数の標的核酸分子の配列であり、このような報告は、標的分子中の特定の突然変異の存在を指し示す。
アウトプットは、定量的情報(例えば、特定の標的核酸分子の量、または対照試料もしくは値と比べた特定の標的核酸分子の量)を提供することができ、または定性的情報(例えば、特定の標的核酸分子の存在または非存在の決定)を提供することができる。追加の例において、アウトプットは、試料中の標的核酸分子の相対量に関する定性的情報を提供することができ、例えば、対照と比べて増加したのか、もしくは減少したのか、または対照と比べて変化がないのかが同定される。
本明細書で論じられるように、ライゲートした標的またはライゲートした標的アンプリコンは、例えば特定の患者、試料、実験、または標的配列を同定するのに使用できる1つまたは複数の実験タグを含んでいてもよい。このようなタグの使用は、シーケンシングされたライゲートした標的またはライゲートした標的アンプリコンを「ソートする」またはさらに計数することを許容し、したがって複数の異なる試料(例えば異なる患者からの)、複数の異なる標的(例えば少なくとも2つの異なる核酸標的)、またはそれらの組合せを単一の反応で分析することを許容する。一例において、このような分析に、IlluminaおよびBowtieソフトウェアを使用することができる。
一例において、ライゲートした標的またはライゲートした標的アンプリコンは、それぞれの異なる標的核酸分子に固有な実験タグを含む。このようなタグの使用は、ライゲートした標的またはライゲートした標的アンプリコン全体をシーケンシングせずに、単にこのタグをシーケンシングまたは検出することによって、ライゲートした標的またはライゲートした標的アンプリコンを同定することを可能にする。加えて、複数の核酸標的を分析しようとする場合、各標的に対して固有な実験タグを使用することは、それぞれの検出またはシーケンシングされた実験タグをソートし、必要に応じて計数することができるため、分析を簡易化する。これは、ライゲートした標的またはライゲートした標的アンプリコンが、試料中の標的に対しておよその化学量論的な比率で存在するため、試料中に存在していた標的核酸の半定量化または定量化を許容する。例えば試料中で複数の標的核酸が検出またはシーケンシングされる場合、本方法は、単に実験的タグを検出またはシーケンシングし、次いでソーティングすることによって、各標的配列および検出またはシーケンシングされたコピー数を示す表またはグラフの作成を許容する。
別の例において、ライゲートした標的またはライゲートした標的アンプリコンは、それぞれの異なる試料に固有な実験タグ(例えば各患者試料につき固有なタグなど)を含む。このようなタグの使用は、特定の検出されたライゲートした標的またはライゲートした標的アンプリコンを特定の試料と関連付けることを可能にする。したがって、同じ反応で(例えば同じウェルまたは同じシーケンシング反応で)複数の試料が分析される場合、各試料に対して固有な実験タグを使用することは、それぞれの検出またはシーケンシングされたライゲートした標的またはライゲートした標的アンプリコンを特定の試料と関連付けることができるため、分析を簡易化する。例えば試料中の標的核酸が検出またはシーケンシングされる場合、本方法は、各試料の分析結果を示す表またはグラフの作成を許容する。
当業者は、それぞれのライゲートした標的またはライゲートした標的アンプリコンは、複数の実験タグ(例えば少なくとも2、3、4、5、6、7、8、9または10個の実験タグ)、例えば標的配列を示すタグ、および試料を示す別のタグなどを含んでいてもよいことを理解するであろう。各タグが検出またはシーケンシングされたら、適切なソフトウェアを使用して、例えばグラフまたは表などの任意の望ましいフォーマットでデータをソーティングすることができる。例えば、これは、複数の試料中で複数の標的配列を同時または同時発生的に分析することを許容する。
一部の例において、シーケンシングされたライゲートした標的またはライゲートした標的アンプリコンは、各標的核酸配列につき公知の配列のデータベースと比較される。一部の例において、このような比較は、突然変異、例えばSNPなどの検出を許容する。
VIII.キット
また、1つまたは複数の標的核酸分子を直接シーケンシングするのに使用することができるキットも本明細書で開示される。
キットは、1つまたは複数の核酸標的に特異的にハイブリダイズする1つまたは複数のNPPFを含む。キットはまた、対応するCFSも含む。例えば、NPPFが5’−フランキング配列を含む場合、キットは、5’−フランキング配列に相補的な5CFSを含んでいてもよい。NPPFが3’−フランキング配列を含む場合、キットは、3’−フランキング配列に相補的な3CFSを含んでいてもよい。一部の例において、NPPFおよびCFSは、同じバイアルまたはコンテナー中である。一部の例において、キットは、5CFSおよび3CFSの両方を含み、CFSの一方は、捕獲部分を含む。一部の例において、キットは、単一の標的核酸分子に特異的な複数のNPPFおよび対応するCFS、例えば、標的核酸分子に特異的にハイブリダイズすることができる、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、または少なくとも20個の異なるNPPF(例えば2、3、4、5、6、7、8、9、10、12、15または20個の異なるNPPF)を含む。一部の例において、キットは、複数の異なる標的核酸分子に特異的な複数のNPPFおよび対応するCFS、例えば、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも10、少なくとも20、少なくとも50、少なくとも75、または少なくとも100個の異なる標的核酸分子(例えば2、3、4、5、6、7、8、9、10、12、15、20、40、50、75、100、200、または500個の異なる標的核酸分子)を含む。一部の実施形態では、開示されたキットは、より多くの対照核酸分子、例えば陽性対照(例えば、ハウスキーパー)または陰性対照(例えば、ANT)などに特異的な、少なくとも1つのNPPFおよび対応するCFSを含む。
一部の例において、キットは、標的核酸分子、例えばライゲートした標的核酸分子などの増幅を許容する核酸プローブまたはプライマーを(例えば別個のバイアルまたはコンテナー中に)含む。一部の例において、このようなプローブまたはプライマーの少なくとも一部は、キット中のCFSに相補的であり、したがってプローブまたはプライマーとCFSとのハイブリダイゼーションが可能になる。一部の例において、このようなプローブまたはプライマーは、シーケンシングアダプター配列および/または実験的タグ配列(またはそれらに対する相補性を有する配列)を含む。
一部の例において、キットは加えて、緩衝液(例えば溶解緩衝液、血漿溶解緩衝液;ハイブリダイゼーション緩衝液、洗浄緩衝液、増幅緩衝液、変性緩衝液、ライゲーション緩衝液、溶出緩衝液;および/またはシーケンシング緩衝液など)を含有するコンテナー;一本鎖核酸に特異的なヌクレアーゼ(例えばS1ヌクレアーゼなど)を含有するコンテナー;エタノール(例えば80%エタノールなど)を含有するコンテナー;変性油を含有するコンテナー;プロテイナーゼKを含有するコンテナー;リガーゼおよびポリメラーゼ(例えば緩衝液中)を含有するコンテナー;DNアーゼ(例えばDNアーゼIなど)を含有するコンテナー;RNアーゼ(例えばRNアーゼHなど)を含有するコンテナー;アンプリコン(例えば、CFSを含むライゲートした標的アンプリコン)に特異的に結合できるビーズを含有するコンテナー;およびPCRのための試薬(例えばPCR緩衝液、ポリメラーゼ、dNTP、逆転写酵素、UDGの2つまたはそれより多く)を含有するコンテナーの1つまたは複数(そのうちの、例えば少なくとも2、少なくとも3、少なくとも4、または少なくとも5つ)を含む。一部の例において、キットは、対照試料、例えば特定の核酸分子を含むまたは含まないことがわかっている試料などをさらに含む。一部の例において、キットは、対照NPPFまたは陽性対照のためのスパイクイン標的をさらに含む。
一部の例において、キットは、NPPF、CFS、緩衝液およびS1酵素を含む消化溶液、洗浄緩衝液、リガーゼ(および任意選択でポリメラーゼ)および緩衝液を含むライゲーション溶液、PCRマスターミックス(これは、ポリメラーゼ、緩衝液、dNTP、UDG(任意選択の)逆転写酵素、プライマーを含んでいてもよい)、浄化用ビーズ溶液、80%エタノール、溶出溶液、溶解緩衝液、変性油、プロテイナーゼK、および任意選択で血漿溶解緩衝液を含む(例えば別個のバイアル中に)。一部の例において、このようなキットはさらに、DNアーゼ(例えばDNアーゼIなど)、RNアーゼ(例えばRNアーゼHなど)、または両方を含む。
キットは、指導用教材をさらに含んでいてもよい。指導用教材は、文書であってもよいし、電子的形態であってもよいし、または視覚的なものであってもよい(例えばビデオファイルなど)。
(実施例1)
単一塩基分解能を用いて核酸標的を検出するよう設計された複数のcNPPFの同時シーケンシング
この実施例は、cNPPF(即ち、ライゲートした標的)を生成およびシーケンシングするのに使用する方法について記載する。24個のNPPFのセットを生成した。NPPFはそれぞれ、24個全てのプローブに関して、70.3℃のメジアンTmを有する50ヌクレオチドの長さの特定の標的核酸分子に特異的である領域、ならびに両方の末端上のフランキング配列を含んでいた。
全てのNPPFに関して、それらの標的に関わらず、5’−および3’−フランキング配列は、互いに異なっていたが、各5’CFSおよび各3’CFSは、各NPPF上で同じであった。5’−フランキング配列(5’TCCCTACACGACGCTCTTCCGAUCT3’、配列番号24)は、Tm 62.8℃を有する25ヌクレオチドであり、3’−フランキング配列(5’GAUCGGAAGAGCACACGTCTGAACT3’、配列番号25)は、Tm 60.5℃を有する25ヌクレオチドであった。NPPFはそれぞれ、フランキング配列中に2個のdUTP塩基を用いて設計された。これらのdUTP塩基は、配列番号24および配列番号25において「U」と称する(上記で下線を付した)。
上述のNPPFを使用して、プローブの7個に相当する標的材料の混合物に関して、ハイブリダイゼーションを実行した。標的材料インプットを用量設定して、ライゲーションの効率に関する情報を提供した。標的は、それらの5’末端でリン酸化された。
種々のNPPFをプールして、溶液中の標的の希釈系列に、ならびにNPPF上のフランキング領域に相補的なCFSにハイブリダイズさせた。3’CFSは、内部ビオチン部分を保有し、5’末端でリン酸化された。ハイブリダイゼーションは、95℃で5分間の初期変性の後に、50℃で実行した。
ハイブリダイゼーション後、緩衝液中のS1酵素の添加によって、ハイブリダイズされた混合物に関してS1消化を実行した。S1反応物は、50℃で1時間インキュベートした。
ハイブリダイズされていない標的DNA、NPPF、およびCFSのS1媒介性消化後、反応物を室温に冷却した。続いて、4μg/μlの濃度のDynabeads MyOne C1ストレプトアビジン常磁性ビーズ(ThermoFisher Scientific)10μlを反応物に添加した。ビーズを室温で30分間、混合物とともにインキュベートして、3’CFS上のビオチン部分を、ビーズ上のストレプトアビジンによって捕獲させた。
ビーズを、1×SSC−T緩衝液(0.05% Tweenを有する1×SSC緩衝液)50μl中で、室温にて3回洗浄した。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、続いてビーズを1×SSC−T中に再懸濁することによって、洗浄を実行した。このマイルドな緩衝液中での洗浄は、ハイブリダイズされた構造がインタクトなままであることを可能にする。
ビーズを、T4 DNAリガーゼ200ユニットを含有するライゲーション混合物20μl中に再懸濁した。ライゲーションは、室温で1時間続行した。ライゲーション反応後、ビーズを、dH2O 50μlを用いて50℃で洗浄した。反応管をスタンドマグネット上に配置させることおよびビーズを収集させること、続いて洗浄緩衝液をビーズに添加することおよび管を50℃で10分間インキュベートすることによって、洗浄を実行した。総計3回の洗浄のため、これを2回繰り返した。これらの洗浄は、二本鎖産物を変性して、NPPFを洗い流して、ビーズ上にライゲートした標的−CFS複合体を残す。洗浄後、最終的にビーズを収集して、dH2O 20μl中に再懸濁した。
次に、試料中で使用される元の標的のライゲートしたcNPPFを含有する上述の反応物の一部を、PCRプライマーとともにインキュベートした。一方のプライマーは、5’−フランキング配列に相補的である配列を含み、第2のプライマーは、3’−フランキング配列に相補的である配列を含んでいた。プライマーはともに、実験タグの、得られたアンプリコンへの組込みを可能にする配列を含み、その結果、これらのプライマーを使用して増幅した単一試料中のcNPPFはそれぞれ、同じ2個のヌクレオチド実験タグを有した。
第1のプライマー(5’AATGATACGGCGACCACCGAGATCTACACxxxxxxxxACACTCTTTCCCTACACGACGCTCTTCCG3’、配列番号26)は66塩基の長さであり、8ヌクレオチド実験的タグ(上記配列において「xxxxxxxx」と称する)を保有した。これらの塩基の22個が、5’−フランキング配列に対して同一であった。これらの22個の塩基は、Tm 60.9℃を有した。第2のプライマー(5’CAAGCAGAAGACGGCATACGAGATxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCG3’、配列番号27)は60塩基の長さであり、6ヌクレオチド実験的タグ(上記配列において「xxxxxx」と称する)を保有した。第2のプライマーの最初の22ヌクレオチドが、3’−フランキング領域に正確に相補的であり、Tm 約59.5℃を有した。
上記の「xxxxxxxx」または「xxxxxx」と称した実験的タグは、下記配列の1つであった:
反応物をそれぞれ、別々のPCR反応で増幅させて、それぞれを、実験的タグの種々の組合せを用いて増幅させ、そのため反応物はそれぞれ、プールされた反応のシーケンシング後に別々に同定することができた。全ての反応においてウラシルDNAデグリコシラーゼ(UDG)による処理が、増幅に先行した。UDGは、オリゴヌクレオチドまたは一本鎖DNAを含むウラシル含有DNAからの遊離ウラシルの放出を触媒する。UDGの機能は、先の酵素ステップおよび洗浄ステップ後に存在する任意の残りのNPPFを破壊することである。UDG処理に続いて、20サイクルのPCRを行った。
得られたアンプリコンを一緒にプールし、ビーズベース試料クリーンアップ(BeckmanCoulterからのAMPure XP)を使用してクリーンアップした。続いて、Illumina MiSeqプラットフォームを使用して、cNPPFおよび実験的タグを含有するアンプリコンをシーケンシングした。実験的タグは、幾つかの場所に配置させることができるが、この実施例では、それらは、指標−リードシーケンシングプライマーに相補的な領域のすぐ下流で、アンプリコンの両側に配置された。したがって、Illuminaシーケンシングは、3ステップで行い、配列の初期リードに続いて、2個の他のシーケンシングプライマーを使用した実験的タグの2回のより短いリードを行った(シーケンシングプライマーは全て、標準的なIlluminaキットに含まれていた)。本明細書中に記載し、また使用するシーケンシング方法は、Illuminaプラットフォーム上での多重性試料に関する標準的な方法である。
シーケンシングされた分子はそれぞれ、まず実験タグに基づいて、続いて各実験タグ群内でソートし、種々のタグそれぞれに関して同定される分子数を計数した。アンプリコンは、オープンソースソフトウェアbowtie(Langmeadら、Ultrafast and memory−efficient alignment of short DNA sequences to the human genome. Genome Biol 10:R25)を使用して予想配列と比較した。
図7A〜図7Bおよび図8は、ライゲートした標的およびCFSのシーケンシングからの結果を示す。グラフは、初期ハイブリダイゼーション反応物に添加される標的に相当する7個の特有のNPPFそれぞれに関して検出されるアンプリコンの数を表す。7個の標的のみが、反応物に添加された。これらは、シーケンシング反応においてシグナルを有すると予想されたが、他のシグナルは予想されず、他の17個のプローブは、標的が存在しない陰性対照であり、シグナルを発生するとは予測されなかった。結果を全ての配列に対して並べた(標的が、それらに関して含まれたとしても、または含まれなかったとしても)。図7Aは、添加した標的が、有意な検出可能なシグナルを生じたのに対して、他は、有意なシグナルを発生しなかったことを示す。生計数が示される。
インプット材料の用量設定をハイブリダイゼーションに添加して、したがって、標的シグナルは、希釈を表すはずである。図7Bは、標的インプットにおいて2倍の差を有する2個の反応間の変化を示し、それらは実際には、7個全ての場合で用量設定する。標的が添加されない陰性対照反応も示す(ANT)。全ての場合において、数は、生計数を表す。
これらの結果は、開示された方法が、単一塩基変化間を識別することができることを示す。24個のNPPFのうちの6個が、野生型(WT)/単一塩基突然変異対に関して設計された。ハイブリダイゼーションに添加された7個の標的のうち3個が、プローブのWTバージョンに適合した。図8は、WT/SNP対に関して同定される総計数を示す(生計数を示す)。野生型(WT)配列が同定されたが、SNP配列は同定されず、この方法が、単一塩基差を識別することが可能であることを実証した。
(実施例2)
例示的なNPPF設計
この実施例は、2個の異なるNPPF設計戦略を使用してcNPPFを生成およびシーケンシングするのに使用する方法について記載する。両方の混合物において、NPPFはそれぞれ、特定の標的核酸分子に特異的である50ヌクレオチド領域を含んでいた。
第1の混合物中では、特異的な別個のNPPFを、各対立遺伝子に関して生成し、当該対立遺伝子の各ヌクレオチドの差を測定した。例えば、BRAF V600E突然変異に関して、NPPFは、野生型(BRAF 1799に相当するヌクレオチドは、dTTPまたはTである)対立遺伝子に関して特異的に、また別のNPPFは、突然変異体対立遺伝子(ヌクレオチド1799は、dATPまたはAである)に関して特異的に生成された。NPPFそれぞれが、100%塩基相補性を伴って特異的な標的に関して設計されるように、24個のNPPFをこの様式で生成した。
第2の混合物中では、各対立遺伝子に関して、1個のNPPFが設計されたが、プローブは、突然変異体標的のみに100%相補的であるように設計された(例えば、BRAF V600Eに関して、BRAFの1799位に相当するヌクレオチドは、Aであった)。したがって、NPPFは、野生型対立遺伝子に、または未知の変化を保有し得る任意の他の対立遺伝子に100%相補的ではあるようには設計されなかった。12個のこのようなNPPFを生成した。
両方のミックス中の全てのNPPFに関して、5’−および3’−フランキング配列は、互いに異なっていたが、各5’フランキング配列および各3’フランキング配列は、各NPPF上で同じであった。5’フランキング配列(5’TCCCTACACGACGCTCTTCCGAUCT3’、配列番号24)は、Tm 62.8℃を有する25ヌクレオチドであり、3’フランキング配列(5’GAUCGGAAGAGCACACGTCTGAACT3’、配列番号25)は、Tm 60.5℃を有する25ヌクレオチドであった。NPPFはそれぞれ、フランキング配列中の2個のdUTP塩基を用いて設計された。これらのdUTP塩基は、上記配列において「U」と称する。
試験試料のセットは、12個の二本鎖DNAアンプリコンを利用して生成した。アンプリコンはそれぞれ、野生型または突然変異体NPPFに相補的な標的配列を保有した。アンプリコンはそれぞれ、さらなる非標的配列を含有した。野生型および突然変異体標的アンプリコン(それぞれ6個)を、希釈系列の比で一緒に混合して(アンプリコンの最終濃度は同じであったが、組成は異なっていた、表1を参照)、7個の異なる試料を形成した。
上述のNPPFの2個のセットをそれぞれ、NPPF上のフランキング領域に相補的なCFSと一緒に混合した。3’CFSは、内部ビオチン部分を保有し、5’CFSは、5’末端でリン酸化された。続いて、NPPFおよびCFSをアンプリコン試料にハイブリダイズさせた。各NPPFセットに関して、各試料を三重反復で試行した。NPPFの、それらの標的へのハイブリダイゼーションは、95℃で10分間の初期変性の後に、50℃にて溶液中で実行した。
ハイブリダイゼーション後、緩衝液中のS1酵素の添加によって、ハイブリダイズされた混合物に関してS1消化を実行した。S1反応物は、50℃で90分間インキュベートした。一本鎖核酸(ハイブリダイズされていないDNA、NPPF、およびCFSを含む)のS1媒介性消化後、反応物を室温に冷却して、4μg/μlの濃度のDynabeads MyOne C1ストレプトアビジン常磁性ビーズ(ThermoFisher Scientific)5μlに添加した。ビーズを室温で30分間、混合物とともにインキュベートして、3’CFS上のビオチン部分を、ビーズ上のストレプトアビジンによって捕獲させた。
ビーズを、1×SSC−T緩衝液(0.05% Tween(登録商標)界面活性剤を有する1×SSC緩衝液)150μl中で、室温にて3回洗浄した。このマイルドな緩衝液中での洗浄は、ハイブリダイズされた構造がインタクトなままであることを可能にする。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを1×SSC−T中に再懸濁することによって、洗浄を実行した。
洗浄したビーズを、dNTPを補充したT4 DNAリガーゼ緩衝液中にT4 DNAリガーゼ80ユニットおよびT4 DNAポリメラーゼ0.6ユニットを含有するライゲーション混合物(酵素および緩衝液は、New England Biolabsから)20μl中に再懸濁した。ライゲーションは、室温で1時間続行した。ライゲーション反応後、ビーズを、0.02%Tween(登録商標)−20界面活性剤150μlを用いて3回洗浄した。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを1×SSC−T中に再懸濁することおよび管を50℃で10分間インキュベートすることによって、洗浄を実行した。これらの洗浄は、二本鎖産物を変性して、NPPFを洗い流して、ビーズ上にライゲートした標的−CFS複合体を残す。ビーズを、増幅前に、0.02%Tween(登録商標)界面活性剤20μl中に再懸濁した。
次に、試料中で使用される元の標的のライゲートしたcNPPFを含有する上述の反応物の一部を、PCRプライマーとともにインキュベートした。一方のプライマーは、NPPFの5’−フランキング配列に対して同一である配列を含み、第2のプライマーは、NPPFの3’−フランキング配列に相補的である配列を含んでいた。また、プライマーはともに、実験タグの、得られたアンプリコンへ組込みを可能にする配列を含み、その結果、これらのプライマーを使用して増幅した単一試料中のcNPPFはそれぞれ、同じ2個のヌクレオチド実験タグを有した。
第1のプライマー(5’AATGATACGGCGACCACCGAGATCTACACxxxxxxxxACACTCTTTCCCTACACGACGCTCTTCCG3’、配列番号26)は66塩基の長さであり、8ヌクレオチド実験的タグ(上記配列において「xxxxxxxx」と称する)を保有した。これらの塩基の22個が、NPPFの5’フランキング配列に対して同一であった。これらの22個の塩基は、Tm 60.9℃を有した。
第2のプライマー(5’CAAGCAGAAGACGGCATACGAGATxxxxxxGTGACTGGAGTTCAGACGTGTGCTCTTCCG3’、配列番号27)は60塩基の長さであり、6ヌクレオチド実験タグ(上記配列において「xxxxxx」と称する)を保有した。第2のプライマーの最初の22ヌクレオチドが、NPPFの3’フランキング配列に正確に相補的であり、Tm 約59.5℃を有した。
上記の「xxxxxxxx」または「xxxxxx」と称した実験的タグは、表2に示す配列の1つであった。
反応物をそれぞれ、別々のPCR反応で増幅させて、それぞれを、実験的タグ(5’プライマー1個および3’プライマー1個)の種々の組合せを用いて増幅させ、そのため反応物はそれぞれ、プールされた反応物のシーケンシング後に別々に同定することができた。全ての反応においてウラシルDNAデグリコシラーゼ(UDG)による処理が、増幅に先行した。UDGは、オリゴヌクレオチドまたは一本鎖DNAを含むウラシル含有DNAからの遊離ウラシルの放出を触媒する。上述の反応において、UDGの機能は、先の酵素ステップおよび洗浄ステップ後に存在する任意の残りのNPPFを破壊することである。UDG処理に続いて、22サイクルのPCRを行った。
得られたPCR反応物を一緒にプールし、ビーズベース試料クリーンアップ(BeckmanCoulterからのAMPure XP)を使用してクリーンアップした。続いて、Illumina MiSeqプラットフォームを使用して、cNPPFおよび実験的タグを含有するアンプリコンをシーケンシングした。実験的タグは、幾つかの場所に配置させることができるが、この実施例では、それらは、指標−リードシーケンシングプライマーに相補的な領域のすぐ下流で、アンプリコンの両側に配置された。したがって、Illuminaシーケンシングは、3ステップで行い、配列の初期リードに続いて、2個の他のシーケンシングプライマーを使用した実験的タグの2回のより短いリードを行った(シーケンシングプライマーは全て、標準的なIlluminaキットに含まれていた)。本明細書中に記載し、また使用するシーケンシング方法は、Illuminaプラットフォーム上での多重性試料に関する標準的な方法である。
シーケンシングされた分子はそれぞれ、まず実験タグに基づいて、続いて各実験タグ群内でソートし、種々のタグそれぞれに関して同定される分子数を計数した。アンプリコンは、オープンソースソフトウェアbowtie(Langmeadら、Genome Biol 10:R25)を使用して予想配列と比較した。
図11A〜図11Bは、ライゲートした標的およびCFS(cNPPF)のシーケンシングからの結果を示す。グラフは、NPPFの2個のセット(野生型および突然変異体の両方に関して特異的なプローブ(「両方のプローブ」)、または両方に関して一方だけのプローブ(「1個のプローブ」)のいずれか)を使用して、8個の試料中で検出される野生型および突然変異体アンプリコンの相対パーセントを表す。三重反復試料から作成された生データを平均化して、数を作成し、続いて所定のNPPFに関するシグナルは全て、100%に等しいと設定し、野生型および突然変異体対立遺伝子の相対パーセントをその100%の比率として示す。パーセントを示すグラフおよび表をともに示す。2個の野生型/突然変異体アンプリコン試料希釈セット(KRASおよびBRAFに関して)を示す(それぞれ、図11Aおよび図11B)。
図11A〜図11Bに示すように、各試料混合物中の野生型および突然変異体アンプリコンの比は、2個のNPPF混合物のどちらを使用する場合でもほぼ同一である(正確な数に関しては、グラフの下の表を参照)。これにより、NPPFと標的との間の少数のヌクレオチドの差(例えば、1個、2個、3個、4個または5個のミスマッチ)を有するNPPFは、依然として標的にハイブリダイズし、標的をヌクレアーゼ消化から保護することが実証される。これは、プローブに正確に適合しない標的の意義ある損失を伴わずに行われる(両方のプローブセットにおける野生型のアンプリコンの検出を比較する)。これにより、NPPFは、既知の差異と予想されなかった領域内の突然変異、即ち新生突然変異の限られた発見の両方に使用することができることが実証される。これは、アッセイにおいてより柔軟性を可能にするだけでなく、それはまた、プローブ設計時間、構築費用を低減して、構成成分を単純化することによって系における頑強性を増加させる。
(実施例3)
特異的な領域を標的とし、突然変異ステータスがわかっている細胞株における当該領域内の核酸変異体を同定するように設計された複数のcNPPFの同時シーケンシング
この実施例は、KRAS突然変異ステータスがわかっている細胞株試料のセットにおけるゲノムKRAS突然変異ステータスを評価するのに使用する方法について記載する。さらに、この実施例は、プローブと標的とを区別して、標的領域内の未知の突然変異の同定を可能にするNPPF設計について記載する。
3個の市販されている細胞株を使用した。COLO−205(「KRAS WT」株)は、BRAF 1799T>A塩基変化(V600Eアミノ酸変化)を保有するが、KRASについて野生型である。NCI−H1155(「KRAS mut」株)は、KRAS 183A>T塩基変化(Q61H_T)を保有し、この突然変異体対立遺伝子にとってホモ接合性である。SW948(「KRASヘテロ接合性」)は、KRASのWT対立遺伝子および182A>C突然変異体対立遺伝子(Q61L)の両方を保有する。細胞株を溶解緩衝液中に希釈した。
19個のNPPFのセットを生成した。これらのNPPFの設計は、実施例2に基づき、そこでは、プローブ内のミスマッチが、プローブの、1個または複数の塩基が異なる標的用のハイブリダイゼーションスカフォールドとして機能を果たす能力を変化させないことが示された。NPPFはそれぞれ、19個全ての領域に関して、71.0℃のメジアンTmを有する50ヌクレオチドの長さの特定の標的核酸分子に特異的である領域、ならびに両方の末端上のフランキング配列を含んでいた。各プローブはまた、ゲノム標的配列に対して単一ミスマッチを含む。これらの場合において、ミスマッチは、NPPF内の保護配列の5’の3番目に配置された。C>TまたはA>Gのいずれかの変化をミスマッチとして使用した。
全てのNPPFに関して、それらの意図する標的に関わらず、5’−および3’−フランキング配列は、互いに異なっていたが、各5’フランキング配列および各3’フランキング配列は、各NPPF上で同じであった。5’−フランキング配列(5’TCCCTACACGACGCTCTTCCGAUCT3’、配列番号24)は、Tm 62.8℃を有する25ヌクレオチドであり、3’−フランキング配列(5’GAUCGGAAGAGCACACGTCTGAACT3’、配列番号25)は、Tm 60.5℃を有する25ヌクレオチドであった。NPPFはそれぞれ、総計4個のdUTP塩基を用いて設計された。2個のdUTP塩基は、フランキング配列に配置された。これらのdUTP塩基は、上記配列において「U」と称する。さらなる2個のdUTP塩基を、NPPFの標的特異的な領域内に配置した。これらのdUTP塩基の位置は、標的特異的な保護配列内のdTTP塩基の配置に依存して変動する。種々のNPPFを、NPPF上のフランキング領域に相補的なCFSを用いてプールした。5’CFSは、5’末端でリン酸化されて、3’CFSは、内部ビオチン部分を保有した。
細胞株溶解産物を三重反復で試行し、反復はそれぞれ、溶解緩衝液中に5000個の細胞を含有していた。溶解産物を、上述のNPPFおよびCFS混合物と混合して、ハイブリダイゼーションは、95℃で10分間の初期変性の後に、50℃で18時間実行した。
ハイブリダイゼーション後、緩衝液中のS1酵素の添加によって、ハイブリダイズされた混合物に関してS1消化を実行した。S1反応物は、50℃で90分間インキュベートした。S1媒介性消化後、反応物を室温に冷却した。その時点で、反応物を、緩衝液中の4μg/μlの濃度のDynabeads MyOne C1ストレプトアビジン常磁性ビーズ(ThermoFisher Scientific)5μlに添加した。ビーズを室温で30分間、混合物とともにインキュベートして、3’CFS上のビオチン部分を、ビーズ上のストレプトアビジンによって捕獲させた。
ビーズを、1×SSC−T緩衝液(0.05% Tween(登録商標)界面活性剤を有する1×SSC緩衝液)150μl中で、室温にて3回洗浄した。このマイルドな緩衝液中での洗浄は、ハイブリダイズされた構造がインタクトなままであることを可能にする。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを1×SSC−T中に再懸濁することによって、洗浄を実行した。
洗浄したビーズを、dNTPを補充したT4 DNAリガーゼ緩衝液中にT4 DNAリガーゼ80ユニットおよびT4 DNAポリメラーゼ0.6ユニットを含有するライゲーション混合物(酵素および緩衝液は、New England Biolabsから)20μl中に再懸濁した。ライゲーションは、室温で1時間続行した。ライゲーション反応後、ビーズを、50%ホルムアミド/0.02%Tween−20 150μlを用いて3回、および0.02%Tween(登録商標)−20界面活性剤150μl中で1回洗浄した。これらの洗浄は、二本鎖産物を変性して、NPPFを洗い流して、ビーズ上にライゲートした標的−CFS複合体を残す。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを洗浄緩衝液中に再懸濁することによって、洗浄を実行した。洗浄したビーズを、増幅前に、0.02%Tween(登録商標)界面活性剤20μl中に再懸濁した。
次に、試料中の標的のライゲートしたcNPPFを含有する上述の反応物の一部を、PCRプライマーとともにインキュベートした。これらのプライマーは、実施例2に記載するように設計された。使用した実験的タグを表3に示す。
反応物をそれぞれ、別々のPCR反応で増幅させて、それぞれを、実験的タグ(5’プライマー1個および3’プライマー1個)の種々の組合せを用いて増幅させ、そのため反応物はそれぞれ、プールされた反応物のシーケンシング後に別々に同定することができた。全ての反応においてウラシルDNAデグリコシラーゼ(UDG)による処理が、増幅に先行した。UDGは、オリゴヌクレオチドまたは一本鎖DNAを含むウラシル含有DNAからの遊離ウラシルの放出を触媒する。上述の反応において、UDGの機能は、先の酵素ステップおよび洗浄ステップ後に存在する任意の残りのNPPFを破壊することである。UDG処理に続いて、22サイクルのPCRを行った。
得られたアンプリコンを一緒にプールし、ビーズベース試料クリーンアップ(BeckmanCoulterからのAMPure XP)を使用してクリーンアップした。続いて、Illumina NextSeqプラットフォームを使用して、cNPPFおよび実験的タグを含有するアンプリコンをシーケンシングした。実験的タグは、幾つかの場所に配置させることができるが、この実施例では、それらは、指標−リードシーケンシングプライマーに相補的な領域のすぐ下流で、アンプリコンの両側に配置された。したがって、Illuminaシーケンシングは、3ステップで行い、配列の初期リードに続いて、2個の他のシーケンシングプライマーを使用した実験的タグの2回のより短いリードを行った(シーケンシングプライマーは全て、標準的なIlluminaキットに含まれていた)。本明細書中に記載し、また使用するシーケンシング方法は、Illuminaプラットフォーム上での多重性試料に関する標準的な方法である。
シーケンシングされた分子はそれぞれ、まず実験タグに基づいて、続いて各実験タグ群内でソートし、種々のタグそれぞれに関して同定される分子数を計数した。アンプリコンは、オープンソースソフトウェアbowtieを使用して予想配列と比較した。
図12は、反応物のシーケンシングからの結果を示す。グラフを得るために、三重反復試料からの生データを平均化して、Q61領域に関するシーケンシングした計数を全て、対立遺伝子によってグラフにした。プローブのみから得られた計数もまた示されるが、意義あるシグナルは検出されなかった(図12における「KRAS_Q61_プローブ」を参照)。
これらの結果により、評価した試料内の変異体または野生型対立遺伝子を検出するための単一プローブ設計の有効性が実証される−KRAS Q61領域における様々な突然変異が評価されたのに対して、単一NPPFが使用された。したがって、NPPFは、非特異的であるが、捕獲された標的(cNPPF)のシーケンシングからのアッセイの結果は、非常に特異的である。アッセイの特異性は、公知の細胞株内の特異的な予想KRAS対立遺伝子の正しい検出によって実証され、さらに、3個全ての細胞株の等価な細胞インプットに関して、検出される総KRASシグナルの量は、対立遺伝子のステータスに関わらず、細胞株間でほぼ等価であった。結果はシーケンシングによって作成されるため、標的領域における任意の予想外の突然変異(いずれも検出されなかった、図12を参照)を同定または発見することもできる。
特異性は、偽陽性または偽陰性シグナルによって負の影響を受ける。したがって、NPPF設計が、NPPFと標的領域との間で塩基ミスマッチを含むとしても、このミスマッチは、既知の目的の領域から離れて配置され、残留プローブの存在から(アッセイ内のまたはPCR設定区域における環境汚染からの)生じる任意の偽シグナルを、結果からスクリーニングで排除するのを可能にする。この実験において、検出可能なプローブ配列は存在しなかった(図12「KRAS_Q61_プローブ」を参照)。
(実施例4)
複数のcNPPFの同時シーケンシング;多重化反応における線形性、特異性および感度
この実施例は、cNPPFを生成およびシーケンシングするのに使用する方法について記載する。30個のNPPFのセットを生成した。NPPFはそれぞれ、特定の標的核酸分子に特異的である領域(50ヌクレオチドの長さ)、ならびに両方の末端上のフランキング配列を含んでいた。NPPFは、実施例3のように設計された。NPPFは、NPPF上のフランキング配列に相補的なCFSを用いてプールした。3’CFSは、内部ビオチン部分を保有し、5’CFSは、5’末端でリン酸化された。
標的配列を含有する23個の二本鎖DNAアンプリコンの混合物に関して、ハイブリダイゼーションを実行した。アンプリコンはそれぞれ、公知のヒト対立遺伝子の野生型または突然変異体コピーのいずれか、ならびにさらなる非標的配列を保有した。23個全てのアンプリコンを高濃度で一緒にプールして、続いてプールを溶解緩衝液中に希釈した。100fM〜100aMの範囲の7個の希釈物を生成した。次に、この希釈系列を使用して、上述のNPPFプールを使用した多重的なアッセイの再現性、線形性、感度、および特異性を試験した。NPPFおよびCFSを、アンプリコン試料と混合することによって、ハイブリダイゼーションを溶液中で実行した。ハイブリダイゼーションは、95℃で10分間の初期変性の後に、50℃で実行した。
ハイブリダイゼーション後、緩衝液中のS1酵素の添加によって、ハイブリダイズされた混合物に関してS1消化を実行した。S1反応物は、50℃で90分間インキュベートした。一本鎖核酸(ハイブリダイズされていないDNA、NPPF、およびCFSを含む)のS1媒介性消化後、反応物を室温に冷却して、4μg/μlの濃度のDynabeads MyOne C1ストレプトアビジン常磁性ビーズ(ThermoFisher Scientific)5μlに添加した。ビーズおよび試料混合物を室温で30分間インキュベートして、3’CFS上のビオチン部分を、ビーズ上のストレプトアビジンによって捕獲させた。このステップはまた、S1反応を停止させるのに機能を果たす。
ビーズを、1×SSC−T緩衝液(0.05% Tween(登録商標)界面活性剤を有する1×SSC緩衝液)150μl中で、室温にて3回洗浄した。このマイルドな緩衝液中での洗浄は、ハイブリダイズされた構造がインタクトなままであることを可能にする。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを1×SSC−T中に再懸濁することによって、洗浄を実行した。
洗浄したビーズを、T4 DNAリガーゼ80ユニットおよびT4 DNAポリメラーゼ0.6ユニットを含有するライゲーション混合物20μl中に再懸濁した。ライゲーションは、室温で75分間続行した。ライゲーション反応後、ビーズを、0.02%Tween(登録商標)−20界面活性剤中の50%ホルムアミド150μlを用いて3回で洗浄した後、dH2O中の0.02%Tween(登録商標)−20界面活性剤中で1回洗浄した。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いて洗浄緩衝液をビーズに添加することによって、洗浄を実行した。これらの洗浄は、二本鎖産物を変性して、NPPFを洗い流して、ビーズ上にライゲートした標的−CFS複合体を残す。洗浄したビーズを、増幅前に、dH2O中の0.02%Tween(登録商標)−20界面活性剤20μl中に再懸濁した。
次に、試料中で使用される元の標的のライゲートしたcNPPFを含有する上述の反応物の一部を、PCRプライマーとともにインキュベートした。これらのプライマーは、実施例2に記載するように設計された。使用した実験的タグを表4に示す。
反応物をそれぞれ、別々のPCR反応で増幅させて、それぞれを、実験的タグ(5’プライマー1個および3’プライマー1個)の種々の組合せを用いて増幅させ、そのため反応物はそれぞれ、プールされた反応物のシーケンシング後に別々に同定することができた。全ての反応においてウラシルDNAデグリコシラーゼ(UDG)による処理が、増幅に先行した。UDGは、オリゴヌクレオチドまたは一本鎖DNAを含むウラシル含有DNAからの遊離ウラシルの放出を触媒する。上述の反応において、UDGの機能は、先の酵素ステップおよび洗浄ステップ後に存在する任意の残りのNPPFを破壊することである。UDG処理に続いて、22サイクルのPCRを行った。
得られたPCR反応物を一緒にプールし、ビーズベース試料クリーンアップ(BeckmanCoulterからのAMPure XP)を使用してクリーンアップした。プールすることを実行して、その結果、用量設定試料を互いに関して分析することができた(即ち、より高い用量設定は、より低いものよりもシーケンシング試行に対してより多くのインプット材料を有する)。続いて、Illumina MiSeqプラットフォームを使用して、cNPPFおよび実験的タグを含有するアンプリコンをシーケンシングした。実験的タグは、幾つかの場所に配置させることができるが、この実施例では、それらは、指標−リードシーケンシングプライマーに相補的な領域のすぐ下流で、アンプリコンの両側に配置された。したがって、Illuminaシーケンシングは、3ステップで行い、配列の初期リードに続いて、2個の他のシーケンシングプライマーを使用した実験的タグの2回のより短いリードを行った(シーケンシングプライマーは全て、標準的なIlluminaキットに含まれていた)。本明細書中に記載し、また使用するシーケンシング方法は、Illuminaプラットフォーム上での多重性試料に関する標準的な方法である。
シーケンシングされた分子はそれぞれ、まず実験タグに基づいて、続いて各実験タグ群内でソートし、種々のタグそれぞれに関して同定される分子数を計数した。得られた配列は、オープンソースソフトウェアbowtieを使用して予想配列と比較した。
図13A〜図13Bおよび図14は、ライゲートした標的およびCFS(cNPPF)のシーケンシングからの結果を示す。これは、23個のアンプリコン標的を含有する多重化試料であった。反応物内のNPPFは、23個のアンプリコン標的のうち20個を検出するように設計され、20個全てが検出され、アッセイの、小さな変化を伴う標的の多重化検出を実行する能力を実証した。
さらに、アンプリコンをそれぞれ、3logスケールにわたって用量設定し、20個のアンプリコンそれぞれに関して、線形性を測定した。20個全てのアンプリコンに関するデータを図13Aにプロットし(生データ、三重反復の平均値、log10スケール)、20個全てのアンプリコンの線形性を示す。データは、非常に線形性であり、20個全てのアンプリコンに関する7個の用量設定点からのデータのメジアンR2は、0.998であった(範囲0.997〜0.99、線形スケール)。
図13Bは、1500〜1.5Mインプットコピーの範囲にわたる検出の再現性、線形性、感度、および特異性を実証する。より詳細に表示するために、2個のアンプリコンを選択し、それぞれ、第2の標的アンプリコンとは1個のみ塩基が異なるが、混合物内で特異的に識別された。生データを、これらの2個のアンプリコンに関して三重反復で平均化し、再現性は、誤差棒によって実証される(表示:平均値からの1個の標準偏差(log10スケールでプロットする))。データはまた、非常に線形であり、R2値はグラフ上に示され、0.998〜0.997である(線形スケール)。
図14におけるチャートは、アンプリコン標的の希釈系列にわたるアッセイの再現性を実証する。各インプット濃度でのアンプリコン標的の4個に関する平均値、標準偏差、および%CV(三重反復反応、生データ)を表に示す。これらの4個の標的は、20個の集団全体を非常に代表している。
(実施例5)
開示されたアッセイを使用したBRAF突然変異ステータスに関する臨床FFPE試料の評価
この実施例は、BRAF突然変異ステータスがわかっている市販の黒色腫のホルマリン固定されたパラフィン包埋(FFPE)試料のセットにおいてBRAFゲノム突然変異ステータスを評価するのに使用する方法について記載する。
FFPE試料を溶解緩衝液中に溶解して、試料1個につき2mm2を使用した。各試料を三重反復で試行した。実施例3に記載するNPPFおよびCFS混合物を試料に添加した。ハイブリダイゼーションは、95℃で10分間の初期変性の後に、50℃で一晩、溶液中で実行した。
ハイブリダイゼーション後、緩衝液中のS1酵素の添加によって、ハイブリダイズされた混合物に関してS1消化を実行した。S1反応物は、50℃で90分間インキュベートした。一本鎖核酸(ハイブリダイズされていないDNA、NPPF、およびCFSを含む)のS1媒介性消化後、反応物を室温に冷却した。その時点で、反応物を4μg/μlの濃度のDynabeads MyOne C1ストレプトアビジン常磁性ビーズ(ThermoFisher Scientific)5μlに添加した。ビーズおよび試料混合物を室温で30分間インキュベートして、3’CFS上のビオチン部分を、ビーズ上のストレプトアビジンによって捕獲させた。このステップはまた、S1反応を停止させるのに機能を果たす。
ビーズを、1×SSC−T緩衝液(0.05% Tweenを有する1×SSC緩衝液)150μl中で、室温にて3回洗浄した。このマイルドな緩衝液中での洗浄は、ハイブリダイズされた構造がインタクトなままであることを可能にする。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを1×SSC−T中に再懸濁することによって、洗浄を実行した。
洗浄したビーズを、T4 DNAリガーゼ80ユニットおよびT4 DNAポリメラーゼ0.6ユニットを含有するライゲーション混合物(酵素および緩衝液は、New England Biolabsから)20μl中に再懸濁した。ライゲーションは、室温で1時間続行した。ライゲーション反応後、ビーズを、0.02%Tween(登録商標)−20界面活性剤中の50%ホルムアミド150μlを用いて3回で洗浄した。反応管をスタンドマグネット上に配置させることおよびビーズを収集させること、上清を除去すること、続いてビーズを洗浄緩衝液中に再懸濁することによって、洗浄を実行した。これらの洗浄は、二本鎖産物を変性して、NPPFを洗い流して、ビーズ上にライゲートした標的−CFS複合体を残す。洗浄したビーズを、最後に収集して、dH2O中の0.02%Tween(登録商標)−20界面活性剤20μl中に再懸濁した。
次に、試料中の標的のライゲートしたcNPPFを含有する上述の反応物の一部を、PCRプライマーとともにインキュベートした。これらのプライマーは、実施例2に記載するように設計された。使用した実験的タグを表5に示す。
反応物をそれぞれ、別々のPCR反応で増幅させて、それぞれを、実験的タグ(5’プライマー1個および3’プライマー1個)の種々の組合せを用いて増幅させ、そのため反応物はそれぞれ、プールされた反応物のシーケンシング後に別々に同定することができた。全ての反応においてウラシルDNAデグリコシラーゼ(UDG)による処理が、増幅に先行した。UDGは、オリゴヌクレオチドまたは一本鎖DNAを含むウラシル含有DNAからの遊離ウラシルの放出を触媒する。上述の反応において、UDGの機能は、先の酵素ステップおよび洗浄ステップ後に存在する任意の残りのNPPFを破壊することである。UDG処理に続いて、22サイクルのPCRを行った。
得られたアンプリコンを一緒にプールし、ビーズベース試料クリーンアップ(BeckmanCoulterからのAMPure XP)を使用してクリーンアップした。続いて、Illumina MiSeqプラットフォームを使用して、cNPPFおよび実験的タグを含有するアンプリコンをシーケンシングした。実験的タグは、幾つかの場所に配置させることができるが、この実施例では、それらは、指標−リードシーケンシングプライマーに相補的な領域のすぐ下流で、アンプリコンの両側に配置された。したがって、Illuminaシーケンシングは、3ステップで行い、配列の初期リードに続いて、2個の他のシーケンシングプライマーを使用した実験的タグの2回のより短いリードを行った(シーケンシングプライマーは全て、標準的なIlluminaキットに含まれていた)。本明細書中に記載し、また使用するシーケンシング方法は、Illuminaプラットフォーム上での多重性試料に関する標準的な方法である。
シーケンシングされた分子はそれぞれ、まず実験タグに基づいて、続いて各実験タグ群内でソートし、種々のタグそれぞれに関して同定される分子数を計数した。アンプリコンは、オープンソースソフトウェアbowtieを使用して予想配列と比較した。
図15は、ライゲートした標的およびCFS(cNPPF)のシーケンシングからの結果を示す。グラフは、まず三重反復試料からの生計数を平均化することによって作成した。BRAF V600位置に着目した(野生型遺伝子座(「V600w」)、V600E突然変異(「V600E」)およびV600E2突然変異(「V600E2」)に関して、標的配列を図15に示す)。BRAF V600シグナル全て(野生型および突然変異体)から生成される計数の総数を合計して、各試料に関する野生型または突然変異体シグナルの比率を算出した。これらの比率を図15においてグラフに描いた。
データにより、これらの臨床FFPE試料内のBRAF V600E突然変異を正しく同定する能力が実証される。単一の試料のみが、V600E2突然変異を保有した(図15に示す配列)が、開示されたプローブ設計が、V600EとV600E2との間の区別を可能にした(E2突然変異ステータスは予想外であり、試料は、BRAF突然変異体試料と称されていたが、正確な突然変異については記載されておらず、供給業者に知られていなかった可能性がある)。これは、この実施例で使用するプローブ設計を使用して未知の突然変異を明らかにする能力を実証する(実施例3に記載)。さらに、これらの結果は、倹約量(2mm2)の固定組織を使用して作成され、NPPFアッセイの、少量の臨床的に意義のある試料を使用して機能する能力を実証した。
(実施例6)
NPPFアッセイを使用したRNAの評価
この実施例は、組織溶解産物または単離RNAのいずれかを含む試料において、開示された方法を使用してRNA発現レベル定量化を評価するのに使用する方法について記載する。
33個のNPPFのセットを生成した。これらのNPPFの設計は、実施例3に記載するものに倣う。NPPFはそれぞれ、50ヌクレオチドの長さの特定の標的核酸分子に特異的である領域を含んでいた。また、プローブはそれぞれ、標的配列に関して単一ミスマッチを含む。C>TまたはA>Gの変化のいずれかを、ミスマッチとして使用した。全てのNPPFに関して、5’−および3’−フランキング配列は、実施例3に記載する通りであった。
NPPFのセットを、NPPF上のフランキング領域に相補的なCFSとともにプールした。5’−CFSは、RNA−DNAハイブリッドオリゴヌクレオチドであり(最も5’の3個のヌクレオチドがRNA塩基であった)、5’末端でリン酸化された。3’−CFSは、RNA−DNAハイブリッドオリゴヌクレオチドであり(最も3’の3個のヌクレオチドがRNA塩基であった)、内部ビオチン部分を保有した。また、混合物中でNPPFの2個に関して標的として機能を果たす50塩基の長さで、5’末端でリン酸化された2個のDNAオリゴヌクレオチドが、NPPFおよびCFS混合物中に含まれた。これらは、DNAであり、RNAではないため、それらは、ヌクレオチド特異的な対照としてこの特定の実施例で使用される。
3個の試料型を利用した。試料型の1つは、50塩基の長さで、5’末端でリン酸化された既知の配列のRNAオリゴであった。第2の試料型は、全てが50塩基の長さを上回る既知の配列の6個のin vitroで転写されるRNA配列の混合物であった。第3の試料は、溶解緩衝液中で均質化された結腸がん組織試料であった。試料型はそれぞれ、溶解緩衝液中に希釈されて、用量設定系列で試行された。上述のNPPFおよびCFS混合物を試料に添加した。ハイブリダイゼーションは、95℃で10分間の初期変性の後に、50℃で一晩、溶液中で実行した。
ハイブリダイゼーション後、緩衝液中のS1酵素の添加によって、ハイブリダイズされた混合物に関してS1消化を実行した。S1反応物は、50℃で90分間インキュベートした。一本鎖核酸(ハイブリダイズされていない核酸、NPPF、およびCFSを含む)のS1媒介性消化後、反応物を室温に冷却した。反応物を4μg/μlの濃度のDynabeads MyOne C1ストレプトアビジン常磁性ビーズ(ThermoFisher Scientific)5μlに添加した。ビーズおよび試料混合物を室温で30分間インキュベートして、3’CFS上のビオチン部分を、ビーズ上のストレプトアビジンによって捕獲させた。このステップはまた、S1反応を停止させる。
ビーズを、1×SSC−T緩衝液(0.05% Tween−20を有する1×SSC緩衝液)150μl中で、室温にて3回洗浄した。このマイルドな緩衝液中での洗浄は、ハイブリダイズされた構造がインタクトなままであることを可能にする。反応管をスタンドマグネット上に配置させて、ビーズを収集させること、上清を除去すること、続いてビーズを1×SSC−T中に再懸濁することによって、洗浄を実行した。
洗浄したビーズを、T4 RNAリガーゼ2 2ユニットおよびE.coliのRNAポリメラーゼ0.5ユニットを含有するライゲーション混合物(ともに、New England Biolabsから)20μl中に再懸濁した。ライゲーションは、37℃で1時間続行した。ライゲーション反応後、ビーズを、0.02%Tween−20中の50%ホルムアミド150μlを用いて、50℃で3回で洗浄した。反応管をスタンドマグネット上に配置させることおよびビーズを収集させること、上清を除去すること、続いてビーズを洗浄緩衝液中に再懸濁することによって、洗浄を実行した。これらの洗浄は、二本鎖産物を変性して、NPPFを洗い流して、ビーズ上にライゲートした標的−CFS(cNPPF)複合体を残す。洗浄したビーズを、0.02%Tween−20 10μl中に収集して、逆転写ミックス10μlを添加した(逆転写酵素(New England Biolabs)200ユニット、緩衝液および最終濃度500nMになるようなプライマーを含有する)。逆転写は、45℃で2時間実行した。続いて、ビーズを、SSC−T 150μl中で1回洗浄し、0.05%Tween−20を有する10mM Tris pH8.0 20μl中に再懸濁した。
次に、試料中の標的のライゲートしたcNPPFを含有する上述の反応物の一部を、PCRプライマーとともにインキュベートした。これらのプライマーは、実施例2に記載するように設計された。使用した実験的タグを表6に示す。
反応物をそれぞれ、別々のPCR反応で増幅させて、それぞれを、実験的タグ(5’プライマー1個および3’プライマー1個)の種々の組合せを用いて増幅させ、反応物はそれぞれ、プールされた反応物のシーケンシング後に別々に同定することが可能となった。全ての反応においてウラシルDNAデグリコシラーゼ(UDG)による処理が、増幅に先行した。UDGは、オリゴヌクレオチドまたは一本鎖DNAを含むウラシル含有DNAからの遊離ウラシルの放出を触媒する。上述の反応において、UDGは、先の酵素ステップおよび洗浄ステップ後に存在する任意の残存NPPFを破壊した。UDG処理に続いて、24サイクルのPCRを行った。
得られたアンプリコンを試料型によってプールし、ビーズベース試料クリーンアップ(BeckmanCoulterからのAMPure XP)を使用してクリーンアップした。Illumina MiSeqプラットフォームを使用して、cNPPFおよび実験的タグを含有するアンプリコンをシーケンシングした。実験的タグは、幾つかの場所に配置させることができるが、この実施例では、それらは、指標−リードシーケンシングプライマーに相補的な領域のすぐ下流で、アンプリコンの両側に配置された。したがって、Illuminaシーケンシングは、3ステップで行い、配列の初期リードに続いて、2個の他のシーケンシングプライマーを使用した実験的タグの2回のより短いリードを行った(シーケンシングプライマーは全て、標準的なIlluminaキットに含まれていた)。本明細書中に記載し、また使用するシーケンシング方法は、Illuminaプラットフォーム上での多重性試料に関する標準的な方法である。
シーケンシングされた分子はそれぞれ、まず実験タグに基づいてソートした。このようにタグによってソートされるシーケンシングリードを、オープンソースソフトウェアbowtie(Langmeadら、Ultrafast and memory−efficient alignment of short DNA sequences to the human genome. Genome Biol 10:R25)を使用して予想配列と比較して、試料1個につき予想配列1個当たりのシーケンシングされた分子の数(「計数」)に関して、データ表を構築した。
図16A〜図16Dは、ライゲートした標的およびCFS(cNPPF)のシーケンシングからの結果を示す。生シーケンシング計数をプロットする。図16Aは、特異的なRNAオリゴヌクレオチドを含有する試料からの結果を示す。これらの結果により、開示された方法の、特異的なRNA標的を測定する能力が実証される。結果はまた、アッセイ内に相補的なNPPFを有するにも関わらず、アッセイに添加される2個のDNAオリゴヌクレオチド(グラフ上の「POS1」および「POS2」)が測定されなかったため、上記方法はRNAを正しく測定したが、DNAを測定しなかったことを実証する。これは、RNAがDNA鎖から離れて転写されるため重要である。この実施例内で使用する方法が、RNAに特異的でなかった場合、シーケンシングの結果は、RNAまたはDNA標的に起因したかどうかを同定することは困難である。結果はまた、偽またはバックグラウンドシグナルを伴わずに、試料中に存在する唯一の標的が測定されることを実証する(「BRAF_V600E_wt」は、きれいなバックグラウンドの例として示され、BRAF RNA標的は、使用する試料中に存在しなかった)。この特異的な実施例に関して、RNAのみを測定することによって、本明細書中に記載する方法が、RNAまたはDNAを特異的に測定するように標的とされ得ることが実証された。しかしながら、このことは、本明細書中に記載する方法のみが、所定の時間で、または所定のアッセイにおいて、核酸(即ち、RNAまたはDNA)の1個の型を測定するのに使用することができることを意味しない。DNAおよびRNAは、混合RNA−DNAアッセイが望ましい場合には、上記方法を使用して同時測定されてもよい。
図16Bは、インプット(用量設定系列)の範囲にわたる特異的なRNAオリゴヌクレオチドを含有する試料のセットからの結果を示す。試料インプットの5点用量設定からの生データが示され、結果に関するR2値は、0.9941である(線形スケール)。これにより、測定の良好な線形性が実証される。
図16Cは、組織溶解産物を含有する試料のセットからのデータを示す。3個のRNA標的は、4点試料インプット用量設定にわたって測定され、3個全てに関するR2値は、少なくとも0.93であり、生理学的試料におけるインプットの用量設定にわたって優れた線形性を実証する。
図16Dは、6個のin vitro転写物からなる試料からの結果を示す。6個全てが、6個の標的に関してプロットされる計数によって示されるように、正しくかつ特異的に測定される。図16Cおよび図16Dはともに、種々の試料型におけるRNA標的の多重化検出を実証する。
これらのデータは、本明細書中に開示された方法を使用して、RNA標的を特異的かつ定量的に測定する能力を実証する。
開示された本発明の原理が適用され得る多くの考え得る実施形態を鑑みて、例示した実施形態は本開示の単なる例であり、開示の範囲を限定すると解釈されるべきではないことが認識されるはずである。そうではなく、本発明の範囲は、以下の特許請求の範囲によって規定される。したがって、本発明者らは、これらの特許請求の範囲の範囲および精神内の範疇にある全てを、本発明者らの発明として特許請求する。