JP2024510206A - CAS-gRNAリボ核タンパク質を使用するゲノムライブラリー調製及び標的化エピジェネティックアッセイ - Google Patents

CAS-gRNAリボ核タンパク質を使用するゲノムライブラリー調製及び標的化エピジェネティックアッセイ Download PDF

Info

Publication number
JP2024510206A
JP2024510206A JP2023555515A JP2023555515A JP2024510206A JP 2024510206 A JP2024510206 A JP 2024510206A JP 2023555515 A JP2023555515 A JP 2023555515A JP 2023555515 A JP2023555515 A JP 2023555515A JP 2024510206 A JP2024510206 A JP 2024510206A
Authority
JP
Japan
Prior art keywords
cas
grna
base pairs
composition
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023555515A
Other languages
English (en)
Inventor
ケネディー アンドリュー
シュルツァバージャー サラ
ベル エマ
ミラー オリバー
シュナイダー キム
マスグレイブ‐ブラウン エステル
ゴームリー ニアル
スラッター アンドリュー
チェン フェング
Original Assignee
イルミナ インコーポレイテッド
イルミナ ケンブリッジ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イルミナ インコーポレイテッド, イルミナ ケンブリッジ リミテッド filed Critical イルミナ インコーポレイテッド
Publication of JP2024510206A publication Critical patent/JP2024510206A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Abstract

Cas-gRNA RNPを使用するゲノムライブラリー調製、及び標的化エピジェネティックアッセイが本明細書に提供される。いくつかの組成物は、第1の種から、実質的に一本鎖ポリヌクレオチドのみを、第2の種から、実質的に二本鎖ポリヌクレオチドのみを、第2の二本鎖ポリヌクレオチドの末端にライゲーションされ、かつ第1の二本鎖ポリヌクレオチドのいずれの末端にも実質的にライゲーションされていない増幅プライマーを含む。いくつかの組成物は、配列を有する標的ポリヌクレオチドの第1及び第2の分子を含み、第1の分子は第1の部分配列に第1の末端を有し、第2の分子は第2の部分配列に第1の末端を有し、第1の部分配列は第2の部分配列と部分的にのみ重複する。いくつかの例は、標的ポリヌクレオチドと、増幅アダプターがカップリングされたトランスポザーゼにカップリングしたCas-gRNA RNPを含む第1の融合タンパク質とを含む組成物を提供する。Cas-gRNA RNPは、標的ポリヌクレオチド中の部分配列にハイブリダイズされ得る。【選択図】図1K

Description

関連出願の相互参照
本出願は、それらの各々の全内容が参照により本明細書に組み込まれている、以下の出願の利益を主張する:
2021年3月9日に出願され、「Genomic library preparation and targeted epigenetic assays using Cas-gRNA ribonucleoproteins」と題する米国仮特許出願第63/158,492号;
2021年3月18日に出願され、「Genomic library preparation and targeted epigenetic assays using Cas-gRNA ribonucleoproteins」と題する米国仮特許出願第63/162,775号;
2021年3月19日に出願され、「Genomic library preparation and targeted epigenetic assays using Cas-gRNA ribonucleoproteins」と題する米国仮特許出願第63/163,381号;
2021年8月2日に出願され、「Genomic library preparation and targeted epigenetic assays using Cas-gRNA ribonucleoproteins」と題する米国仮特許出願第63/228,344号;
2021年9月22日に出願され、「Genomic library preparation and targeted epigenetic assays using Cas-gRNA ribonucleoproteins」と題する米国仮特許出願第63/246,879号;及び
2021年12月30日に出願され、「Genomic library preparation and targeting epigenetic assays using Cas-gRNA ribonucleoproteins」と題する米国仮特許出願第63/295,432号。
本出願は、ゲノムライブラリー調製及び標的化エピジェネティックアッセイのためにCas-gRNA RNPを使用する組成物及び方法に関する。
配列表に関する記述
本出願に関連する配列表は、紙のコピーの代わりにテキスト形式で提供され、参照により本明細書に組み込まれる。配列表を含むテキストファイルの名称は、8549102416_SL.txtである。テキストファイルは、約1.29KBであり、2022年3月3日に作成され、EFS-Webを介して電子的に提出されている。
Clustered regularly interspaced short palindromic repeats(CRISPR)は、多くの細菌及び古細菌においてバクテリオファージ及び接合性プラスミドから細胞を保護する干渉経路に関与している;例えば、Marraffini et al.,「CRISPR interference:RNA-directed adaptive immunity in bacteria and archaea」,Nat Rev Genet.11(3):181-190(2010)を参照されたい。CRISPR配列は、スペーサーと呼ばれる同様のサイズの固有の可変DNA配列だけ離間している短い反復配列のアレイを含み、これはファージ又はプラスミドDNAに由来することが多い。例えば、その全内容が参照により本明細書に組み込まれる、以下の参考文献を参照されたい:Barrangou et al.,「CRISPR provides acquired resistance against viruses in prokaryotes」,Science 315:1709-1712(2007);Bolotin et al.,「Clustered regularly interspersed short palindrome repeats(CRISPR)have spacers of extrachromosomal origin」,Microbiology 151:2551-1561(2005);及びMojica et al.,「Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements」,J Mol Evol.60:174-82(2005)。したがって、CRISPR配列は、過去の感染の適応的な遺伝性記録を提供し、CRISPR RNA(crRNA)-侵襲性ポリヌクレオチドを標的とする低分子RNAに転写され得る(例えば、上記で引用されたMarraffini et al.を参照されたい)。CRISPRは、CRISPRに関連するタンパク質をコードするCRISPR関連(Cas)遺伝子と関連することが多い。Casタンパク質は、crRNAによって標的化される侵入外来ポリヌクレオチドを破壊する機構を提供することができる。CRISPRは、Cas遺伝子と共に、細菌及び古細菌において侵入外来ポリヌクレオチドに対する獲得耐性を提供する適応免疫系を提供する(例えば、上記で引用されたBarrangou et al.を参照されたい)。
単一分子配列決定研究は、Cas9を用いた直接メチル化配列決定のためのCRISPR標的化方法を示唆している;例えば、その全内容が参照により本明細書に組み込まれる、Gilpatrick et al.,「Targeted nanopore sequencing with Cas9 for studies of methylation,structural variants and mutations」,https:/doi.org/10.1101/604173,1-14(2019)を参照されたい。しかしながら、DNAメチル化以外にも、標的DNA遺伝子座におけるエピジェネティック変化の高感度特性評価を可能にする方法に対する満たされていない必要性が存在する。クロマチンアクセシビリティ(ATAC-seqによる)及びDNA遺伝子座に関連するタンパク質(ChIP-seqによる)は、既存のハイブリッド捕捉技術で標的化することが困難なエピジェネティックエレメントの例である。一般に、DNA配列を濃縮するアッセイは、エピジェネティックな特徴と関連する。しかしながら、これらの配列は先験的に知られていないので、目的の特定のゲノム領域(例えば、ゲノム遺伝子座)に対するエピジェネティックアッセイの出力を効率的に濃縮するために適切なハイブリッド捕捉オリゴヌクレオチドを設計することは困難である。
ヒストン遺伝子調節因子を同定するための標的遺伝子座特異的タンパク質単離のために不活性化Cas(dCas9)を使用する従来の方法が提示されている:例えば、その全内容が参照により本明細書に組み込まれる、Tsui et al.,「dCas9-targeted locus-specific protein isolation method identifies histone gene regulators」,PNAS 115(2):E2734-E2741(2018)を参照されたい。そのような方法は、dCas9に基づく遺伝子座濃縮が、後に質量分析によってアッセイすることができるクロマチンを単離できることを実証した。しかしながら、この方法では、各実験において単一のクロマチン遺伝子座をアッセイすることしかできない。更に、この先行研究は、2つの別個の結果(すなわち、DNA遺伝子座の配列、及びDNA関連タンパク質を同定するための質量分析)を提供する。遺伝子座標的エピジェネティック分析のための改善された方法が必要とされている。
Cas-gRNAリボ核タンパク質(RNP)を使用するゲノムライブラリー調製、及び標的化エピジェネティックアッセイが本明細書に提供される。
本明細書のいくつかの例は、第1の種に由来する第1の二本鎖ポリヌクレオチドと第2の種に由来する第2の二本鎖ポリヌクレオチドとの混合物を処理する方法を提供する。方法は、第1の二本鎖ポリヌクレオチドの末端及び第2の二本鎖ポリヌクレオチドの任意の末端を保護することを含み得る。方法は、第1及び第2の二本鎖ポリヌクレオチドの末端を保護した後、第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成することを含み得る。方法は、第1の二本鎖ポリヌクレオチドを自由末端から保護末端に向かって分解することを含み得る。
いくつかの例では、第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成することは、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を、第1の二本鎖ポリヌクレオチド内に存在し、かつ第2の二本鎖ポリヌクレオチド内に存在しない配列にハイブリダイズさせることと、Cas-gRNA RNPで配列を切断することとを含む。いくつかの例では、配列は、哺乳動物特異的反復要素を含む。いくつかの例では、哺乳動物特異的反復要素は、ヒト特異的反復要素を含む。いくつかの例では、第2の種は、細菌、真菌、又はウイルスである。いくつかの例では、第1の二本鎖ヌクレオチドは、第1の種に由来する複数の染色体を含む。
いくつかの例では、第1及び第2の二本鎖ポリヌクレオチドの末端を保護することは、ヘアピンアダプターを末端にライゲーションすることを含む。いくつかの例では、第1及び第2の二本鎖ポリヌクレオチドの末端を保護することは、末端の5’脱リン酸化を含む。いくつかの例では、第1及び第2の二本鎖ポリヌクレオチドの末端を保護することは、末端に修飾塩基を付加することを含む。いくつかの例では、修飾塩基は、ホスホロチオエート結合を含む。いくつかの例では、修飾塩基は、ターミナルトランスフェラーゼを使用して付加される。
いくつかの例では、第1の二本鎖ポリヌクレオチドを分解することは、エキソヌクレアーゼを使用して行われる。
いくつかの例では、自由末端は3’末端を含む。いくつかの例では、第1の二本鎖ポリヌクレオチドを分解することは、エキソヌクレアーゼIIIを使用して行われる。いくつかの例では、自由末端は5’末端を含む。いくつかの例では、第1の二本鎖ポリヌクレオチドを分解することは、ラムダエキソヌクレアーゼを使用して行われる。
いくつかの例では、方法は、続いて、増幅アダプターを混合物中の任意の残りの二本鎖ポリヌクレオチドの末端にライゲーションすることを更に含む。いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。いくつかの例では、方法は、続いて、二本鎖ポリヌクレオチドを増幅し、配列決定することを更に含む。
いくつかの例では、第1の二本鎖ポリヌクレオチドは二本鎖DNAを含む。いくつかの例では、第2の二本鎖ポリヌクレオチドは二本鎖DNAを含む。いくつかの例では、第2の二本鎖ポリヌクレオチドは環状DNAを含む。
いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、第1の種に由来する第1の二本鎖ポリヌクレオチドを含み得る。第1の二本鎖ポリヌクレオチドの末端は保護されていてもよい。組成物は、第2の種に由来する第2の二本鎖ポリヌクレオチドを含み得る。第2の二本鎖ポリヌクレオチドの任意の末端は保護されていてもよい。組成物はまた、第1の二本鎖ポリヌクレオチド内に存在し、かつ第2の二本鎖ポリヌクレオチド内に存在しない配列にハイブリダイズしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。Cas-gRNA RNPは、第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成するように配列を切断するためのものであり得る。
いくつかの例では、配列は、哺乳動物特異的反復要素を含む。いくつかの例では、哺乳動物特異的反復要素は、ヒト反復要素を含む。いくつかの例では、第2の種は、細菌、真菌、又はウイルスである。
いくつかの例では、第1及び第2の二本鎖ポリヌクレオチドの末端は、ヘアピンアダプターを使用して保護されている。いくつかの例では、第1及び第2の二本鎖ポリヌクレオチドの末端は、5’脱リン酸化を使用して保護されている。いくつかの例では、第1及び第2の二本鎖ポリヌクレオチドの末端は、修飾塩基を使用して保護されている。いくつかの例では、修飾塩基は、ホスホロチオエート結合を含む。
いくつかの例では、自由末端は3’末端を含む。いくつかの例では、自由末端は5’末端を含む。
いくつかの例では、第1の二本鎖ポリヌクレオチドは二本鎖DNAを含む。いくつかの例では、第2の二本鎖ポリヌクレオチドは二本鎖DNAを含む。いくつかの例では、第2の二本鎖ポリヌクレオチドは環状DNAを含む。
いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、第1の種に由来する第1の二本鎖ポリヌクレオチドと第2の種に由来する第2の二本鎖ポリヌクレオチドとの混合物を処理する方法を提供する。方法は、混合物中の第1の二本鎖ポリヌクレオチドを選択的に一本鎖にすることを含み得る。方法は、続いて、増幅プライマーを混合物中の任意の残りの二本鎖ポリヌクレオチドに選択的にライゲーションすることを含み得る。方法は、続いて、増幅プライマーがライゲーションされた混合物中の任意の二本鎖ポリヌクレオチドを増幅することを含み得る。
本明細書のいくつかの例は、組成物を提供する。組成物は、第1の種から、実質的に一本鎖ポリヌクレオチドのみを含み得る。組成物は、第2の種から、実質的に二本鎖ポリヌクレオチドのみを含み得る。組成物は、第2の二本鎖ポリヌクレオチドの末端にライゲーションされ、かつ第1の二本鎖ポリヌクレオチドのいずれの末端にも実質的にライゲーションされない増幅プライマーを含み得る。
本明細書のいくつかの例は、全ゲノム(WG)の断片を生成する方法を提供する。方法は、WGの第1のサンプル内で、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)の第1のセットを、おおよそ第1の塩基対数だけ互いに離間しているWG内の第1の配列にハイブリダイズさせることを含み得る。方法は、WGの第1のサンプル内で、Cas-gRNA RNPの第2のセットを、おおよそ第2の塩基対数だけ互いに離間しているWG内の第2の配列にハイブリダイズさせることを更に含み得る。方法は、WGの第1のサンプル内で、第1のサンプル内のCas-gRNA RNPの第1及び第2のセットで第1及び第2の配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片の第1のセットを生成することを更に含み得る。
いくつかの例では、第1の塩基対数は、第2の塩基対数とおおよそ同じである。いくつかの例では、第1の塩基対数は約100~約2000であり、第2の塩基対数は約100~約2000である。いくつかの例では、第1の塩基対数は、約500~約700であり、第2の塩基対数は、約500~約700である。いくつかの例では、WG断片の第1のセットのWG断片内の塩基対数は、約20%未満だけ異なる。
いくつかの例では、方法は、WGの第2のサンプル内で、Cas-gRNA RNPの第1のセットをWG内の第1の配列にハイブリダイズさせることを更に含む。方法は、WGの第2のサンプル内で、Cas-gRNA RNPの第2のセットをWG内の第2の配列にハイブリダイズさせることを更に含み得る。方法は、WGの第2のサンプル内で、Cas-gRNA RNPの第3のセットを、おおよそ第3の塩基対数だけ互いに離間しているWG内の第3の配列にハイブリダイズさせることを更に含み得る。方法は、WGの第2のサンプル内で、第1、第2、及び第3の配列をCas-gRNA RNPの第1、第2、及び第3のセットでそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片の第2のセットを生成することを更に含み得る。
いくつかの例では、第3の塩基対数は、第1の塩基対数と異なる。いくつかの例では、第3の塩基対数は、第2の塩基対数と異なる。いくつかの例では、第3の塩基対数は、約100~約2000である。いくつかの例では、第3の塩基対数は、約200~約400である。いくつかの例では、WG断片の第2のセットのWG断片内のおおよその塩基対数は、WG断片の第1のセットのWG断片内のおおよその塩基対数と異なる。いくつかの例では、WG断片の第2のセットのWG断片内の塩基対数は、約20%未満だけ異なる。
いくつかの例では、方法は、WGの第3のサンプル内で、Cas-gRNA RNPの第1、第2、又は第3のセットを、WG内の第1、第2、又は第3の配列にそれぞれハイブリダイズさせることを更に含む。方法は、Cas-gRNA RNPの第1、第2、又は第3のセットで第1、第2、又は第3の配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片の第3のセットを生成することを更に含み得る。
いくつかの例では、WG断片の第3のセットのWG断片内のおおよその塩基対数は、WG断片の第1のセットのWG断片内のおおよその塩基対数と異なる。いくつかの例では、WG断片の第3のセットのWG断片内のおおよその塩基対数は、WG断片の第2のセットのWG断片内のおおよその塩基対数と異なる。いくつかの例では、WG断片の第3のセットのWG断片内の塩基対数は、約20%未満だけ異なる。
いくつかの例では、方法は、増幅アダプターをWG断片の第3のセットのWG断片の末端にライゲーションすることを更に含む。方法は、増幅アダプターがライゲーションされたWG断片の第3のセットのWG断片のアンプリコンを生成することを更に含み得る。方法は、WG断片の第3のセットのWG断片のアンプリコンを配列決定することを更に含み得る。いくつかの例では、WG断片の第2及び第3のセットのWG断片のアンプリコンは、配列決定のために一緒に混合される。いくつかの例では、WG断片の第1及び第3のセットのWG断片のアンプリコンは、増幅及び配列決定のために一緒に混合される。
いくつかの例では、WG断片の第3のセットのWG断片内の塩基対数は、約100~約1000である。いくつかの例では、WG断片の第3のセットのWG断片内の塩基対数は、約500~約700である。
いくつかの例では、Cas-gRNA RNPの第3のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。
いくつかの例では、方法は、増幅アダプターをWG断片の第2のセットのWG断片の末端にライゲーションすることを更に含む。方法は、増幅アダプターがライゲーションされたWG断片の第2のセットのWG断片のアンプリコンを生成することを更に含み得る。方法は、WG断片の第2のセットのWG断片のアンプリコンを配列決定することを更に含み得る。
いくつかの例では、WG断片の第1及び第2のセットのWG断片のアンプリコンは、増幅及び配列決定のために一緒に混合される。
いくつかの例では、WG断片の第2のセットのWG断片内の塩基対数は、約100~約1000である。いくつかの例では、WG断片の第2のセットのWG断片内の塩基対数は、約100~約200である。
いくつかの例では、方法は、増幅アダプターをWG断片の第1のセットのWG断片の末端にライゲーションすることを更に含む。方法は、増幅アダプターがライゲーションされたWG断片の第1のセットのWG断片のアンプリコンを生成することを更に含み得る。方法は、WG断片の第1のセットのWG断片のアンプリコンを配列決定することを更に含み得る。
いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。
いくつかの例では、WG断片の第1のセットのWG断片内の塩基対数は、約100~約1000である。いくつかの例では、WG断片の第1のセットのWG断片内の塩基対数は、約200~約400である。
いくつかの例では、Cas-gRNA RNPの第1のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。いくつかの例では、Cas-gRNA RNPの第2のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。
いくつかの例では、WGは二本鎖DNAを含む。いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、全ゲノム(WG)のサンプルを含み得る。組成物は、おおよそ第1の塩基対数だけ互いに離間しているWG内の第1の配列にハイブリダイズされたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)の第1のセットを含み得る。組成物は、おおよそ第2の塩基対数だけ互いに離間しているWG内の第2の配列にハイブリダイズされたCas-gRNA RNPの第2のセットを含み得る。Cas-gRNA RNPの第1及び第2のセットはそれぞれ、サンプル内の第1及び第2の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。
いくつかの例では、第1の塩基対数は、第2の塩基対数とおおよそ同じである。いくつかの例では、第1の塩基対数は約100~約2000であり、第2の塩基対数は約100~約2000である。いくつかの例では、第1の塩基対数は、約500~約700であり、第2の塩基対数は、約500~約700である。
いくつかの例では、WG断片内の塩基対数は、約20%未満だけ変動する。いくつかの例では、WG断片内の塩基対数は、約100塩基対~約1000塩基対である。いくつかの例では、WG断片内の塩基対数は、約200塩基対~約400塩基対である。
いくつかの例では、Cas-gRNA RNPの第1のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。いくつかの例では、Cas-gRNA RNPの第2のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。
いくつかの例では、WGは二本鎖DNAを含む。いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、全ゲノム(WG)のサンプルを含み得る。組成物は、おおよそ第1の塩基対数だけ互いに離間しているWG内の第1の配列にハイブリダイズされたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)の第1のセットを含み得る。組成物は、おおよそ第2の塩基対数だけ互いに離間しているWG内の第2の配列にハイブリダイズされたCas-gRNA RNPの第2のセットを含み得る。組成物は、おおよそ第3の塩基対数だけ互いに離間しているWG内の第3の配列にハイブリダイズされたCas-gRNA RNPの第3のセットを含み得る。Cas-gRNA RNPの第1、第2、及び第3のセットはそれぞれ、サンプル内の第1、第2、及び第3の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。
いくつかの例では、第1の塩基対数は、第2の塩基対数とおおよそ同じである。いくつかの例では、第1の塩基対数は、約100~約2000であり、第2の塩基対数は、約100~約2000であり、第3の塩基対数は、約100~約2000である。いくつかの例では、第1の塩基対数は、約500~約700であり、第2の塩基対数は、約500~約700であり、第3の塩基対数は、約200~約400である。いくつかの例では、第3の塩基対数は、第1の塩基対数と異なる。いくつかの例では、第3の塩基対数は、第2の塩基対数と異なる。
いくつかの例では、WG断片内の塩基対数は、約20%未満だけ変動する。いくつかの例では、WG断片内の塩基対数は、約100~約1000である。いくつかの例では、WG断片内の塩基対数は、約100~約200である。
いくつかの例では、Cas-gRNA RNPの第1のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。いくつかの例では、Cas-gRNA RNPの第2のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。いくつかの例では、Cas-gRNA RNPの第3のセットは、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む。
いくつかの例では、WGは二本鎖DNAを含む。いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、全ゲノム(WG)の断片を生成する方法を提供する。方法は、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)のセットを、おおよそ塩基対数だけ互いに離間しているWG内の配列にハイブリダイズさせることを含み得る。方法は、配列をCas-gRNA RNPのセットでそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片のセットを生成することを含み得る。
いくつかの例では、塩基対数は、約100~約1000である。いくつかの例では、塩基対数は、約500~約700、又は約200~約400、又は約100~約200である。
いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約20%未満だけ異なる。いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約100~約1000である。いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約100~約200、又は約200~約400、又は約500~約700である。
いくつかの例では、方法は、増幅アダプターをWG断片のセットのWG断片の末端にライゲーションすることを更に含む。方法は、増幅アダプターがライゲーションされたWG断片のセットのWG断片のアンプリコンを生成することを更に含み得る。方法は、WG断片のセットのWG断片のアンプリコンを配列決定することを更に含み得る。
いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。
いくつかの例では、WGは二本鎖DNAを含む。いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、全ゲノム(WG)のサンプルを含み得る。組成物は、おおよそ塩基対数だけ互いに離間しているWG内の配列にハイブリダイズされたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)のセットを含み得る。Cas-gRNA RNPのセットはそれぞれ、サンプル内の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。
いくつかの例では、塩基対数は、約100~約1000である。いくつかの例では、塩基対数は、約500~約700、又は約200~約400、又は約100~約200である。
いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約20%未満だけ異なる。いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約100~約1000である。いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約100~約200、又は約200~約400、又は約500~約700である。
いくつかの例では、WGは二本鎖DNAを含む。いくつかの例では、CasはCas9を含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、各々が互いにおおよそ同じ数の塩基対を有する少なくとも約1,000,000個のWG断片のセットを含み得る。
いくつかの例では、塩基対数は、約100~約200である。いくつかの例では、塩基対数は、約200~約400である。いくつかの例では、塩基対数は、約500~約700である。
いくつかの例では、WGは二本鎖DNAを含む。
いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約20%未満だけ異なる。いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約10%未満だけ異なる。いくつかの例では、WG断片のセットのWG断片内の塩基対数は、約5%未満だけ異なる。
そのような組成物は、上記のような方法に従って調製され得る。
本明細書のいくつかの例は、配列を有する標的ポリヌクレオチドの分子を切断する方法を提供する。方法は、流体中で、標的ポリヌクレオチドの第1及び第2の分子を、複数の第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と接触させることを含み得る。方法は、第1のCas-gRNA RNPのうちの1つを第1の分子中の第1の部分配列にハイブリダイズさせることを含み得る。方法は、第2のCas-gRNA RNPのうちの1つを第2の分子中の第2の部分配列にハイブリダイズさせることを含み得る。第2の部分配列は、第1の部分配列と部分的にのみ重複してもよい。方法は、第1のCas-gRNA RNPのうちの1つによって、第1の分子中の第2の部分配列への第2のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することを含み得る。方法は、第2のCas-gRNA RNPのうちの1つによって、第2の分子中の第1の部分配列への第1のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することを含み得る。方法は、第1の部分配列において第1の分子を切断することを含み得る。方法は、第2の部分配列において第2の分子を切断することを含み得る。
いくつかの例では、第1の分子における切断部は、標的ポリヌクレオチドの配列中で、第2の分子における切断部とは異なる位置にある。いくつかの例では、第1の分子における切断部は、標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ第2の分子における切断部からオフセットしている。
いくつかの例では、第1の分子は、第1のCas-gRNA RNPのうちの1つを使用して切断され、第2の分子は、第2のCas-gRNA RNPのうちの1つを使用して切断される。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。いくつかの例では、Casは、Cas9又はdCas9を含む。
いくつかの例では、方法は、流体中で、標的ポリヌクレオチドの第1及び第2の分子を複数の第3及び第4のCas-gRNA RNPと接触させることを更に含む。方法は、第3のCas-gRNA RNPのうちの1つを第1の分子中の第3の部分配列にハイブリダイズさせることを更に含み得る。方法は、第3のCas-gRNA RNPのうちの1つによって、第1の分子中の第4の部分配列への第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することを更に含み得る。第4の部分配列は、第3の部分配列と部分的にのみ重複してもよい。方法は、第3のCas-gRNA RNPのうちの1つを使用して第3の部分配列において第1の分子を切断して、第1の断片を生成することを含み得る。
いくつかの例では、方法は、流体中で、標的ポリヌクレオチドの第1及び第2の分子を複数の第3及び第4のCas-gRNA RNPと接触させることを更に含む。方法は、第4のCas-gRNA RNPのうちの1つを第1の分子中の第4の部分配列にハイブリダイズさせることを含み得る。方法は、第4のCas-gRNA RNPのうちの1つによって、第1の分子中の第3の部分配列への第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することを含み得る。方法は、第4のCas-gRNA RNPのうちの1つを使用して第4の部分配列において第1の分子を切断して、第1の断片を生成することを含み得る。
いくつかの例では、方法は、第3のCas-gRNA RNPのうちの1つを第2の分子中の第3の部分配列にハイブリダイズさせることを更に含む。方法は、第3のCas-gRNA RNPのうちの1つによって、第2の分子中の第4の部分配列への第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することを更に含み得る。方法は、第3のCas-gRNA RNPのうちの1つを使用して第3の部分配列において第2の分子を切断して、第2の断片を生成することを更に含み得る。
いくつかの例では、方法は、第4のCas-gRNA RNPのうちの1つを第2の分子中の第4の部分配列にハイブリダイズさせることを更に含む。方法は、第4のCas-gRNA RNPのうちの1つによって、第2の分子中の第3の部分配列への第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することを更に含み得る。方法は、第4のCas-gRNA RNPのうちの1つを使用して第4の部分配列で第2の分子を切断して、第2の断片を生成することを更に含み得る。
いくつかの例では、方法は、第1のCas-gRNA RNPのうちの1つ及び第3又は第4のCas-gRNA RNPのうちの1つが第1の分子にハイブリダイズしている間に、第1のCas-gRNA RNPのうちの1つと第3又は第4のCas-gRNA RNPのうちの1つとの間にない第1の分子の任意の部分を分解することを更に含む。
いくつかの例では、方法は、第2のCas-gRNA RNPのうちの1つ及び第3又は第4のCas-gRNA RNPのうちの1つが第2の分子にハイブリダイズしている間に、第2のCas-gRNA RNPのうちの1つと第3又は第4のCas-gRNA RNPのうちの1つとの間にない第2の分子の任意の部分を分解することを更に含む。いくつかの例では、分解は、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して行われる。
いくつかの例では、第1の分子は、第3又は第4のCas-gRNA RNPのうちの1つを使用して切断され、第2の分子は、第3又は第4のCas-gRNA RNPのうちの1つを使用して切断される。
いくつかの例では、第1及び第2の断片は、互いに異なる塩基対数を含む。いくつかの例では、第1の断片は、約100塩基対~約1000塩基対の長さを有し、第2の断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、第1の断片は、約500塩基対~約700塩基対の長さを有し、第2の断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、第1の断片は、約200塩基対~約400塩基対の長さを有し、第2の断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、第1の断片は、約100塩基対~約200塩基対の長さを有し、第2の断片は、約100塩基対~約200塩基対の長さを有する。
本明細書のいくつかの例は、標的ポリヌクレオチドを配列決定する方法を提供する。方法は、上記の方法を使用して、標的ポリヌクレオチドの第1及び第2の断片を生成することを含み得る。方法は、増幅アダプターを第1及び第2の断片の末端にライゲーションすることを更に含み得る。方法は、増幅アダプターがライゲーションされた第1及び第2の断片のアンプリコンをそれぞれ生成することを更に含み得る。方法は、第1及び第2の断片のアンプリコンを配列決定することを更に含み得る。
いくつかの例では、方法は、第1、第2、第3、及び第4の部分配列を使用することと、第1の断片のアンプリコンを第1の分子に由来するものとして同定することと、第2の断片のアンプリコンを第2の分子に由来するものとして同定することとを更に含む。
いくつかの例では、方法は、アンプリコンを生成する前に、固有の分子識別子(UMI)を第1及び第2の断片の末端にライゲーションすることを更に含む。方法は、UMIを使用することと、第1の断片のアンプリコンを第1の分子に由来するものとして同定することと、第2の断片のアンプリコンを第2の分子に由来するものとして同定することとを更に含み得る。いくつかの例では、UMIは、増幅アダプターと同じ操作で、第1及び第2の断片の末端にカップリングされ、ライゲーションされる。
本明細書のいくつかの例は、組成物を提供する。組成物は、配列を有する標的ポリヌクレオチドの第1及び第2の分子を含み得る。組成物は、複数の第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。第1のCas-gRNA RNPのうちの1つは、第1の分子中の第1の部分配列にハイブリダイズしてもよく、第1の分子中の第2の部分配列への第2のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよい。第2の部分配列は、第1の部分配列と部分的にのみ重複してもよい。第2のCas-gRNA RNPのうちの1つは、第2の分子中の第2の部分配列にハイブリダイズしてもよく、第2の分子中の第1の部分配列への第1のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよい。
いくつかの例では、第1の分子における切断部は、標的ポリヌクレオチドの配列中で、第2の分子における切断部とは異なる位置にある。いくつかの例では、第1の分子における切断部は、標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ第2の分子における切断部からオフセットしている。
いくつかの例では、第1のCas-gRNA RNPのうちの1つは、第1の分子を切断するためのものであり、第2のCas-gRNA RNPのうちの1つは、第2の分子を切断するためのものである。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。いくつかの例では、Casは、Cas9又はdCas9を含む。
いくつかの例では、組成物は、複数の第3及び第4のCas-gRNA RNPを更に含む。第3のCas-gRNA RNPのうちの1つは、第1の分子中の第3の部分配列にハイブリダイズしてもよく、第1の分子中の第4の部分配列への第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよく、第3の部分配列において第1の分子を切断して第1の断片を生成するためのものであってもよい。第4の部分配列は、第3の部分配列と部分的にのみ重複してもよい。
いくつかの例では、組成物は、複数の第3及び第4のCas-gRNA RNPを更に含む。第4のCas-gRNA RNPのうちの1つは、第1の分子中の第4の部分配列にハイブリダイズしてもよく、第1の分子中の第3の部分配列への第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよく、第4の部分配列において第1の分子を切断して第1の断片を生成するためのものであってもよい。第4の部分配列は、第3の部分配列と部分的にのみ重複してもよい。
いくつかの例では、第3のCas-gRNA RNPのうちの1つは、第2の分子中の第3の部分配列にハイブリダイズしてもよく、第2の分子中の第4の部分配列への第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよく、第3の部分配列において第2の分子を切断して第2の断片を生成するためのものであってもよい。
いくつかの例では、第4のCas-gRNA RNPのうちの1つは、第2の分子中の第4の部分配列にハイブリダイズしてもよく、第2の分子中の第3の部分配列への第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよく、第4の部分配列において第2の分子を切断して第2の断片を生成するためのものであってもよい。
いくつかの例では、組成物は、第1のCas-gRNA RNPのうちの1つと第3又は第4のCas-gRNA RNPのうちの1つとの間にない第1の分子の任意の部分を分解するためのエキソヌクレアーゼを更に含む。
いくつかの例では、組成物は、第2のCas-gRNA RNPのうちの1つと第3又は第4のCas-gRNA RNPのうちの1つとの間にない第2の分子の任意の部分を分解するためのエキソヌクレアーゼを更に含む。
いくつかの例では、エキソヌクレアーゼは、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを含む。
いくつかの例では、第3又は第4のCas-gRNA RNPのうちの1つは、第1の分子を切断するためのものであり、第3又は第4のCas-gRNA RNPのうちの1つは、第2の分子を切断するためのものである。
いくつかの例では、第1及び第2の断片は、互いに異なる塩基対数を含む。いくつかの例では、第1の断片は、約100塩基対~約1000塩基対の長さを有し、第2の断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、第1の断片は、約500塩基対~約700塩基対の長さを有し、第2の断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、第1の断片は、約200塩基対~約400塩基対の長さを有し、第2の断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、第1の断片は、約100塩基対~約200塩基対の長さを有し、第2の断片は、約100塩基対~約200塩基対の長さを有する。
本明細書のいくつかの例は、組成物を提供する。組成物は、配列を有する標的ポリヌクレオチドの第1及び第2の分子を含み得る。第1の分子は、第1の部分配列に第1の末端を有し得る。第2の分子は、第2の部分配列に第1の末端を有し得る。第1の部分配列は、第2の部分配列と部分的にのみ重複してもよい。
いくつかの例では、第1の分子の第1の末端は、標的ポリヌクレオチドの配列中で、第2の分子の第1の末端とは異なる位置にある。いくつかの例では、第1の分子の第1の末端は、標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ第2の分子の第1の末端からオフセットしている。
いくつかの例では、第1の分子は、第3の部分配列に第2の末端を更に有する。第2の分子は更に、第3の部分配列又は第4の部分配列に第2の末端を有し得る。第3の部分配列は、第4の部分配列と部分的にのみ重複してもよい。いくつかの例では、第1の分子の第2の末端は、標的ポリヌクレオチドの配列中で、第2の分子の第2の末端とは異なる位置にある。いくつかの例では、第1の分子の第2の末端は、標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ第2の分子の第2の末端からオフセットしている。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
いくつかの例では、第1及び第2の分子は、互いに異なる塩基対数を含む。いくつかの例では、第1の分子は、約100塩基対~約1000塩基対の長さを有し、第2の分子は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、第1の断片は、約500塩基対~約700塩基対の長さを有し、第2の断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、第1の断片は、約200塩基対~約400塩基対の長さを有し、第2の断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、第1の断片は、約100塩基対~約200塩基対の長さを有し、第2の断片は、約100塩基対~約200塩基対の長さを有する。
本明細書のいくつかの例は、配列を有する標的ポリヌクレオチドの断片を生成する方法を提供する。方法は、流体中で、標的ポリヌクレオチドを第1及び第2の融合タンパク質と接触させることを含み得る。第1の融合タンパク質は、第1の増幅アダプターがカップリングされた第1のトランスポザーゼにカップリングした第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。第2の融合タンパク質は、第2の増幅アダプターがカップリングされた第2のトランスポザーゼにカップリングした第2のCas-gRNA RNPを含み得る。方法は、第1及び第2のCas-gRNA RNPの活性を促進し、第1及び第2のトランスポザーゼの活性を阻害しながら、第1のCas-gRNA RNPを標的ポリヌクレオチド中の第1の部分配列にハイブリダイズさせ、第2のCas-gRNA RNPを標的ポリヌクレオチド中の第2の部分配列にハイブリダイズさせることを含み得る。次いで、方法は、第1及び第2のトランスポザーゼの活性を促進しながら、第1のトランスポザーゼを使用して第1の増幅アダプターを標的ポリヌクレオチド中の第1の位置に付加することと、第2のトランスポザーゼを使用して第2の増幅アダプターを標的ポリヌクレオチド中の第2の位置に付加することとを含み得る。
いくつかの例では、流体の第1の条件を使用して、Cas-gRNA RNPの活性が促進され、トランスポザーゼの活性が阻害される。いくつかの例では、流体の第1の条件は、Cas-gRNA RNPの活性のために十分な量のカルシウムイオン、マンガンイオン、又はカルシウムイオンとマンガンイオンとの両方の存在を含む。いくつかの例では、流体の第1の条件は、トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む。
いくつかの例では、流体の第2の条件を使用して、トランスポザーゼの活性が促進される。いくつかの例では、流体の第2の条件は、トランスポザーゼの活性のために十分な量のマグネシウムイオンの存在を含む。
いくつかの例では、方法は、第1の融合タンパク質のCas-gRNA RNPが第1の部分配列にハイブリダイズし、第2の融合タンパク質のCas-gRNA RNPが第2の部分配列にハイブリダイズしている間に、第1の融合タンパク質のCas-gRNA RNPと第2の融合タンパク質のCas-gRNA RNPとの間にない標的ポリヌクレオチドの任意の部分を分解することを更に含む。いくつかの例では、分解は、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して行われる。
いくつかの例では、方法は、標的ポリヌクレオチドを第1及び第2の融合タンパク質から遊離させて、一方の末端に第1の増幅アダプターを有し、他方の末端に第2の増幅アダプターを有する標的ポリヌクレオチドの断片を提供することを更に含む。いくつかの例では、遊離は、プロテイナーゼK、ドデシル硫酸ナトリウム(SDS)、又はプロテイナーゼKとSDSとの両方を使用して行われる。
いくつかの例では、断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、断片は、約100塩基対~約200塩基対の長さを有する。
いくつかの例では、CasはdCas9を含む。いくつかの例では、トランスポザーゼはTn5を含む。
いくつかの例では、第1の増幅アダプターはP5アダプターを含み、第2の増幅アダプターはP7アダプターを含む。
いくつかの例では、第1の増幅アダプターは第1の固有の分子識別子(UMI)を含み、第2の増幅アダプターは第2のUMIを含む。
いくつかの例では、第1の位置は第1の部分配列の約10塩基以内であり、第2の位置は第2の部分配列の約10塩基以内である。
いくつかの例では、第1及び第2の融合タンパク質の各々において、Cas-gRNA RNPは、共有結合を介してトランスポザーゼにカップリングされる。
いくつかの例では、第1及び第2の融合タンパク質の各々において、Cas-gRNA RNPは、非共有結合を介してトランスポザーゼにカップリングされる。いくつかの例では、Cas-gRNA RNPは、抗体に共有結合的にカップリングされ、トランスポザーゼは、抗体が非共有結合的にカップリングされる抗原に共有結合的にカップリングされるか、又はCas-gRNA RNPは、抗原に共有結合的にカップリングされ、トランスポザーゼは、抗原が非共有結合的にカップリングされる抗体に共有結合的にカップリングされる。いくつかの例では、Cas-gRNAは、gRNAと第1又は第2の増幅アダプターとの間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされる。いくつかの例では、Cas-gRNAは、gRNAとトランスポザーゼ内のオリゴヌクレオチドとの間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされる。
いくつかの例では、第1の融合タンパク質において、第1の部分配列にハイブリダイズするgRNAの一部は、約15~約18ヌクレオチドの長さを有し、第2の融合タンパク質において、第2の部分配列にハイブリダイズするgRNAの一部は、約15~約18ヌクレオチドの長さを有する。
いくつかの例では、第1及び第2の融合タンパク質は、標的ポリヌクレオチドに対しておおよそ化学量論比である。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
いくつかの例では、第1のタグは第1のCas-gRNA RNPにカップリングされ、第2のタグは第2のCas-gRNA RNPにカップリングされる。いくつかの例では、方法は、第1のタグを基材にカップリングした第1のタグパートナーにカップリングすることと、第2のタグを基材にカップリングした第2のタグパートナーにカップリングすることとを含む。いくつかの例では、カップリングは、第1及び第2のCas-gRNA RNPがそれぞれ第1及び第2の部分配列にハイブリダイズされた後に行われる。いくつかの例では、第1及び第2のタグがそれぞれ第1及び第2のタグパートナーに付加された後に、第1及び増幅アダプターが付加される。
いくつかの例では、第1及び第2のタグは、ビオチンを含む。いくつかの例では、第1及び第2のタグパートナーは、ストレプトアビジンを含む。いくつかの例では、基材は、ビーズを含む。いくつかの例では、Cas-gRNA RNPは、Cas12kを含む。いくつかの例では、トランスポザーゼは、Tn5又はTn7様トランスポザーゼを含む。
本明細書のいくつかの例は、標的ポリヌクレオチドを配列決定する方法を提供する。方法は、前述の方法のうちの1つを使用して標的ポリヌクレオチドの断片を生成することと、断片のアンプリコンを生成することと、アンプリコンを配列決定することとを含み得る。
本明細書のいくつかの例は、組成物を提供する。組成物は、配列を有する標的ポリヌクレオチドを含み得る。組成物は、第1の増幅アダプターがカップリングされた第1のトランスポザーゼにカップリングした第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含む第1の融合タンパク質を含み得る。第1のCas-gRNA RNPは、標的ポリヌクレオチド中の第1の部分配列にハイブリダイズしてもよい。
いくつかの例では、組成物は、第2の増幅アダプターがカップリングされた第2のトランスポザーゼにカップリングした第2のCas-gRNA RNPを含む第2の融合タンパク質を含み得る。第2のCas-gRNA RNPは、標的ポリヌクレオチド中の第2の部分配列にハイブリダイズしてもよい。
いくつかの例では、組成物は、第1のCas-gRNA RNPの活性を促進し、第1のトランスポザーゼの活性を阻害する条件を有する流体を更に含む。いくつかの例では、流体の条件は、第1のCas-gRNA RNPの活性のために十分な量のカルシウムイオン、マンガンイオン、又はカルシウムイオンとマンガンイオンとの両方の存在を含む。いくつかの例では、流体の条件は、第1のトランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む。
いくつかの例では、組成物は、第1のトランスポザーゼの活性を促進する条件を有する流体を更に含み、第1のトランスポザーゼが第1の増幅アダプターを標的ポリヌクレオチド中の第1の位置に付加する。いくつかの例では、流体の条件は、第1トランスポザーゼの活性のために十分な量のマグネシウムイオンの存在を含む。
いくつかの例では、組成物は、標的ポリヌクレオチドを第1及び第2の融合タンパク質から遊離させて、一方の末端に第1の増幅アダプターを有し、他方の末端に第2の増幅アダプターを有する標的ポリヌクレオチドの断片を提供するための薬剤を更に含む。いくつかの例では、薬剤は、プロテイナーゼK、ドデシル硫酸ナトリウム(SDS)、又はプロテイナーゼKとSDSとの両方を含む。
いくつかの例では、断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、断片は、約100塩基対~約200塩基対の長さを有する。
いくつかの例では、組成物は、第1及び第2のCas-gRNA RNPの間にない標的ポリヌクレオチドの任意の部分を分解するためのエキソヌクレアーゼを更に含む。いくつかの例では、エキソヌクレアーゼは、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを含む。
いくつかの例では、CasはdCas9を含む。いくつかの例では、トランスポザーゼはTn5を含む。
いくつかの例では、第1のアダプターはP5アダプターを含み、第2のアダプターはP7アダプターを含む。
いくつかの例では、第1の増幅アダプターは第1の固有の分子識別子(UMI)を含み、第2の増幅アダプターは第2のUMIを含む。
いくつかの例では、第1の位置は第1の部分配列の約10塩基以内であり、第2の位置は第2の部分配列の約10塩基以内である。
いくつかの例では、第1のCas-gRNA RNPは、共有結合を介して第1のトランスポザーゼにカップリングされる。
いくつかの例では、第1のCas-gRNA RNPは、非共有結合を介して第1のトランスポザーゼにカップリングされる。いくつかの例では、第1のCas-gRNA RNPは、抗体に共有結合的にカップリングされ、第1のトランスポザーゼは、抗体が非共有結合的にカップリングされる抗原に共有結合的にカップリングされるか、又はCas-gRNA RNPが、抗原に共有結合的にカップリングされ、第1のトランスポザーゼは、抗原が非共有結合的にカップリングされる抗体に共有結合的にカップリングされる。いくつかの例では、第1のCas-gRNAは、gRNAと第1又は第2の増幅アダプターとの間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされる。いくつかの例では、第1のCas-gRNAは、gRNAとトランスポザーゼ内のオリゴヌクレオチドとの間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされる。
いくつかの例では、第1の融合タンパク質において、第1の部分配列にハイブリダイズするgRNAの一部は、約15~約18ヌクレオチドの長さを有する。第2の融合タンパク質を含む例では、第2の部分配列にハイブリダイズするgRNAの一部は、約15~約18ヌクレオチドの長さを有する。
いくつかの例では、第1の融合タンパク質は、標的ポリヌクレオチドに対しておおよそ化学量論比である。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
いくつかの例は、第1のCas-gRNA RNPにカップリングした第1のタグを更に含む。いくつかの例は、基材と、基材及び第1のタグにカップリングした第1のタグパートナーとを更に含む。
いくつかの例は、第2のCas-gRNA RNPにカップリングした第2のタグを更に含む。いくつかの例は、基材と、基材及び第1のタグにカップリングした第1のタグパートナーと、基材及び第2のタグにカップリングした第2のタグパートナーとを更に含む。
いくつかの例では、第1及び第2のタグは、ビオチンを含む。いくつかの例では、第1及び第2のタグパートナーは、ストレプトアビジンを含む。いくつかの例では、基材は、ビーズを含む。いくつかの例では、Cas-gRNA RNPは、Cas12kを含む。いくつかの例では、トランスポザーゼは、Tn5又はTn7様トランスポザーゼを含む。
本明細書のいくつかの例は、標的ポリヌクレオチドのそれぞれの遺伝子座にカップリングしたタンパク質を特徴付ける方法を提供する。方法は、標的ポリヌクレオチドを、第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と接触させることを含み得る。方法は、第1及び第2のCas-gRNA RNPを標的ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることを含み得、タンパク質は、第1及び第2の部分配列間の標的ポリヌクレオチドのそれぞれの遺伝子座にカップリングされ得る。方法は、第1のCas-gRNA RNPを使用して第1の部分配列において標的ポリヌクレオチドを切断し、第2のCas-gRNA RNPを使用して第2の部分配列において標的ポリヌクレオチドを切断して断片を形成することを含み得る。タンパク質は、断片のそれぞれの遺伝子座にカップリングされ得る。方法は、対応するオリゴヌクレオチドを使用して、断片のそれぞれの遺伝子座にカップリングしたタンパク質の各々をそれぞれ標識することを含み得る。方法は、対応するオリゴヌクレオチドを配列決定することを含み得る。
いくつかの例では、方法は、対応するオリゴヌクレオチドを使用して断片のそれぞれの遺伝子座にカップリングしたタンパク質の各々をそれぞれ標識する前に断片を濃縮することを含む。いくつかの例では、第1及び第2のCas-gRNA RNPはそれぞれ、断片が第1及び第2のCas-gRNA RNPを介してタグにカップリングされるようにタグにカップリングされる。濃縮することは、第1及び第2のCas-gRNA RNPを介してタグにカップリングした断片を、タグパートナーにカップリングした基材と接触させることを含み得る。濃縮することは、タグをタグパートナーにカップリングさせて断片を基材にカップリングすることを含み得る。濃縮することは、基材にカップリングされていない標的ポリヌクレオチドの任意の部分を除去することを含み得る。
いくつかの例では、方法は、対応するオリゴヌクレオチドを使用してタンパク質を同定することを含む。
いくつかの例では、方法は、対応するオリゴヌクレオチドを使用して遺伝子座を同定することを含む。
いくつかの例では、方法は、対応するオリゴヌクレオチドを使用してタンパク質を定量化することを含む。
いくつかの例では、対応するオリゴヌクレオチドを使用してタンパク質の各々をそれぞれ標識することは、断片を異なるタンパク質に特異的な抗体の混合物と接触させることを含む。抗体の各々は、対応するオリゴヌクレオチドにカップリングされ得る。断片のそれぞれの遺伝子座にカップリングしたタンパク質に特異的である混合物中の任意の抗体について、それらの抗体及び対応するオリゴヌクレオチドは、それらのタンパク質にカップリングされ得る。いくつかの例では、複数のタンパク質が遺伝子座のそれぞれ1つにカップリングされ、混合物中の複数の抗体がその遺伝子座においてタンパク質にカップリングされる。
いくつかの例では、対応するオリゴヌクレオチドを配列決定することは、対応するオリゴヌクレオチドをビーズアレイにハイブリダイズさせることを含む。いくつかの例では、対応するオリゴヌクレオチドを配列決定することは、対応するオリゴヌクレオチドに対して合成による配列決定を行うことを含む。
いくつかの例では、対応するオリゴヌクレオチドは、固有の分子識別子(UMI)を含む。
いくつかの例では、方法は、対応するオリゴヌクレオチドのそれぞれの存在を使用してタンパク質を同定することを含む。
いくつかの例では、方法は、対応するオリゴヌクレオチドのそれぞれの量を使用してタンパク質を定量化することを含む。
いくつかの例では、対応するオリゴヌクレオチドを使用してタンパク質の各々をそれぞれ標識することは、断片を複数のトランスポザーゼと接触させること(トランスポザーゼの各々は対応するオリゴヌクレオチドにカップリングされている)と、断片のそれぞれの遺伝子座にカップリングしたタンパク質によって、遺伝子座におけるトランスポザーゼの活性を阻害することと、遺伝子座以外の位置で、トランスポザーゼを使用して断片に対応するオリゴヌクレオチドを付加することとを含む。
いくつかの例では、対応するオリゴヌクレオチドを配列決定することは、対応するオリゴヌクレオチドが付加される断片に対して合成による配列決定を行うことを含む。
いくつかの例では、対応するオリゴヌクレオチドの断片内のそれぞれの位置を使用して、タンパク質のそれぞれの遺伝子座を同定する。
いくつかの例では、トランスポザーゼは断片を部分断片に分割し、合成による配列決定は部分断片に対して行われる。
いくつかの例では、対応するオリゴヌクレオチドは、増幅アダプターを含む。いくつかの例では、増幅アダプターは、P5及びP7アダプターを含む。
いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。
いくつかの例では、CasはCas9を含む。
いくつかの例では、断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、断片は、約100塩基対~約200塩基対の長さを有する。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、標的ポリヌクレオチドの断片を含み得る。タンパク質は、断片のそれぞれの遺伝子座にカップリングされ得る。組成物は、異なるタンパク質に特異的な抗体の混合物を含み得る。抗体の各々は、対応するオリゴヌクレオチドにカップリングされ得る。断片のそれぞれの遺伝子座にカップリングしたタンパク質に特異的である混合物中の任意の抗体について、それらの抗体及び対応するオリゴヌクレオチドは、それらのタンパク質にカップリングされる。
いくつかの例では、複数のタンパク質が遺伝子座のそれぞれ1つにカップリングされ、混合物中の複数の抗体がその遺伝子座においてタンパク質にカップリングされる。
いくつかの例では、対応するオリゴヌクレオチドは、固有の分子識別子(UMI)を含む。
いくつかの例では、対応するオリゴヌクレオチドのそれぞれの存在は、タンパク質を同定するために使用可能である。
いくつかの例では、対応するオリゴヌクレオチドのそれぞれの量は、タンパク質を定量化するために使用可能である。
いくつかの例では、断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、断片は、約100塩基対~約200塩基対の長さを有する。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、標的ポリヌクレオチドの断片を含み得る。タンパク質は、断片のそれぞれの遺伝子座にカップリングされ得る。組成物は、複数のトランスポザーゼを含み得る。トランスポザーゼの各々は、対応するオリゴヌクレオチドにカップリングされ得る。断片のそれぞれの遺伝子座にカップリングしたタンパク質は、その遺伝子座においてトランスポザーゼの活性を阻害し得る。トランスポザーゼは、遺伝子座以外の位置で断片に対応するオリゴヌクレオチドを付加し得る。
いくつかの例では、対応するオリゴヌクレオチドの断片内のそれぞれの位置は、タンパク質のそれぞれの遺伝子座を同定するために使用可能である。
いくつかの例では、トランスポザーゼは、断片を部分断片に分割する。
いくつかの例では、対応するオリゴヌクレオチドは、増幅アダプターを含む。いくつかの例では、増幅アダプターは、P5及びP7アダプターを含む。いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。
いくつかの例では、トランスポザーゼはTn5を含む。
いくつかの例では、断片は、約100塩基対~約1000塩基対の長さを有する。いくつかの例では、断片は、約500塩基対~約700塩基対の長さを有する。いくつかの例では、断片は、約200塩基対~約400塩基対の長さを有する。いくつかの例では、断片は、約100塩基対~約200塩基対の長さを有する。
いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
本明細書におけるいくつかの例は、複数の部分配列を有する標的ポリヌクレオチドを含む組成物を提供する。組成物は、ガイドRNA(gRNA)にカップリングしたShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)をそれぞれ含む複数の複合体を含み得る。ShCASTは、それにカップリングした増幅アダプターを有し得る。複合体の各々は、標的ポリヌクレオチド中の部分配列の対応する1つにハイブリダイズされ得る。
いくつかの実施形態では、組成物は、部分配列への複合体のハイブリダイゼーションを促進し、かつトランスポザーゼの活性を阻害する条件を有する流体を更に含む。いくつかの例では、流体の条件は、トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む。
いくつかの例では、組成物は、トランスポザーゼの活性を促進する条件を有する流体を更に含み、トランスポザーゼは、標的ポリヌクレオチド中の位置に増幅アダプターを付加する。いくつかの例では、流体の条件は、トランスポザーゼの活性のために十分な量のマグネシウムイオンの存在を含む。
いくつかの例では、ShCASTはCas12kを含む。いくつかの例では、トランスポザーゼは、Tn5又はTn7様トランスポザーゼを含む。いくつかの実施形態では、アダプターは、P5アダプター及びP7アダプターのうちの少なくとも1つを含む。いくつかの例では、標的ポリヌクレオチドは二本鎖DNAを含む。
いくつかの例では、gRNA及びトランスポザーゼのうちの少なくとも1つは、ビオチン化される。組成物は、ビオチン化されたgRNA及びトランスポザーゼのうちの少なくとも1つがカップリングされる、ストレプトアビジンでコーティングされたビーズを更に含み得る。
本明細書のいくつかの例は、二本鎖ポリヌクレオチドの断片を生成する方法を提供する。方法は、二本鎖ポリヌクレオチドを基材にカップリングすることを含み得る。方法は、第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)ニッカーゼを二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることを含み得る。第1の部分配列は、二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり得る。第2の部分配列は、二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側であり得る。方法は、第1のCas-gRNA RNPニッカーゼを使用して、第1の部分配列において第1の鎖を切断することを含み得る。方法は、第2のCas-gRNA RNPニッカーゼを使用して、第2の部分配列において第2の鎖を切断することを含み得る。方法は、ポリメラーゼを使用して、それぞれの切断部から第1及び第2の鎖を伸長させ、基材から標的配列を溶出させることを含み得る。方法は、溶出された標的配列を配列決定することを含み得る。
いくつかの例では、基材は、ビーズ、例えば常磁性ビーズを含む。
いくつかの例では、二本鎖ポリヌクレオチドの3’末端がタグにカップリングされ、基材はタグパートナーにカップリングされ、カップリングはタグをタグパートナーにカップリングすることを含む。いくつかの例では、タグはビオチンを含み、タグパートナーはストレプトアビジンを含む。
いくつかの例では、第1及び第2のCas-gRNA RNPニッカーゼは、Cas9を含む。
いくつかの例では、ポリメラーゼは鎖置換ポリメラーゼを含む。いくつかの例では、ポリメラーゼは、Vent又はBsuを含む。
いくつかの例では、ポリメラーゼは5’エキソヌクレアーゼ活性を有する。いくつかの例では、ポリメラーゼは、Taq、Bst、又はDNAポリメラーゼIを含む。
いくつかの例は、組成物を提供する。組成物は、基材にカップリングした二本鎖ポリヌクレオチドを含み得る。組成物は、二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズした第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)ニッカーゼを含み得る。第1の部分配列は、二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり得る。第2の部分配列は、二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側であり得る。
いくつかの例では、基材は、ビーズ、例えば常磁性ビーズを含む。
いくつかの例では、二本鎖ポリヌクレオチドの3’末端はタグにカップリングされ、基材はタグにカップリングしたタグパートナーにカップリングされる。いくつかの例では、タグはビオチンを含み、タグパートナーはストレプトアビジンを含む。
いくつかの例では、第1及び第2のCas-gRNA RNPニッカーゼは、Cas9を含む。
いくつかの例は、二本鎖ポリヌクレオチドの断片を生成する方法を提供する。方法は、第1及び第2の複合体を二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることを含み得る。第1及び第2の複合体の各々は、増幅アダプターにカップリングしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。方法は、ハイブリダイズされた第1及び第2の複合体の増幅アダプターを、二本鎖ポリヌクレオチドの第1及び第2の末端にそれぞれライゲーションすることを含み得る。方法は、二本鎖ポリヌクレオチドから第1及び第2の複合体のCas-gRNA RNPを除去することを含み得る。方法は、増幅アダプターがライゲーションされた二本鎖ポリヌクレオチドを配列決定することを含み得る。
いくつかの例では、第1の部分配列は、二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、第2の部分配列は、二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側である。
いくつかの例では、増幅アダプターはY字型である。
いくつかの例では、各複合体は、Cas-gRNA RNPを増幅アダプターにカップリングするリンカーを更に含む。いくつかの例では、リンカーは、Cas-gRNA RNPのCasにカップリングされる。いくつかの例では、リンカーは、gRNAにカップリングされる。いくつかの例では、リンカーは、タンパク質、ポリヌクレオチド、又はポリマーを含む。いくつかの例では、リンカーは、Cas-gRNA RNPが除去されても増幅アダプターにカップリングしたままである。
いくつかの例では、ライゲーションは、リガーゼを使用することを含む。いくつかの例では、リガーゼは、ハイブリダイズ中に存在する。いくつかの例では、リガーゼは、ハイブリダイズ中は不活性であり、ATPを使用してライゲーションのために活性化される。いくつかの例では、リガーゼは、ハイブリダイズ後に付加される。
いくつかの例では、方法は、ハイブリダイズする前に二本鎖ポリヌクレオチドをAテーリングすることを含み、増幅アダプターは、Aテールとハイブリダイズするための不対Tを含む。あるいは増幅アダプターを平滑末端にライゲーションしてもよい。
いくつかの例では、増幅アダプターは、固有の分子識別子を含む。例えば、増幅アダプターは、二重鎖固有の分子識別子を含み得る。
いくつかの例では、Cas-gRNA RNPは、dCas9を含む。
いくつかの例は、組成物を提供する。組成物は、二本鎖ポリヌクレオチドの断片を含み得る。組成物は、二本鎖ポリヌクレオチド中の第1及び第2の部分配列にハイブリダイズした第1及び第2の複合体を含み得る。第1及び第2の複合体の各々は、増幅アダプターにカップリングしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。
いくつかの例では、第1の部分配列は、二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、第2の部分配列は、二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側である。
いくつかの例では、増幅アダプターはY字型である。
いくつかの例では、各複合体は、Cas-gRNA RNPを増幅アダプターにカップリングするリンカーを更に含む。いくつかの例では、リンカーは、Cas-gRNA RNPのCasにカップリングされる。いくつかの例では、リンカーは、gRNAにカップリングされる。いくつかの例では、リンカーは、タンパク質、ポリヌクレオチド、又はポリマーを含む。
いくつかの例では、二本鎖ポリヌクレオチドはAテールを含み、増幅アダプターは、Aテールとハイブリダイズするための不対Tを含む。あるいは増幅アダプターを平滑末端にライゲーションしてもよい。
いくつかの例では、増幅アダプターは、固有の分子識別子を含む。例えば、増幅アダプターは、二重鎖固有の分子識別子を含み得る。
いくつかの例では、Cas-gRNA RNPは、dCas9を含む。
本明細書のいくつかの例は、ポリヌクレオチドの断片を生成する方法を提供する。方法は、第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)をポリヌクレオチド中の第1の配列にハイブリダイズさせることを含み得る。方法は、第2のCas-gRNA RNPを、第1の配列から少なくとも標的配列だけ離間しているポリヌクレオチド中の第2の配列にハイブリダイズさせることを含み得る。方法は、第1及び第2の配列を第1及び第2のCas-gRNA RNPで切断して、第1及び第2の末端並びにそれらの間の標的配列を含む断片を生成することを含み得る。第1の末端は、少なくとも1つの塩基の第1の5’オーバーハングを有し得る。第2の末端は、少なくとも1つの塩基の第2の5’オーバーハングを有し得る。
いくつかの例では、第1及び第2の5’オーバーハングは各々、約2~5塩基長である。いくつかの例では、第1及び第2の5’オーバーハングは各々、約5塩基長である。
いくつかの例では、第1及び第2の5’オーバーハングは、互いに異なる配列を有する。
いくつかの例は、第1の増幅アダプターを断片の第1の末端にライゲーションすることと、第2の増幅アダプターを断片の第2の末端にライゲーションすることとを更に含む。第1の増幅アダプターは、第1の5’オーバーハングに相補的である第3の5’オーバーハングを有し得る。第2の増幅アダプターは、第2の5’オーバーハングに相補的である第4の5’オーバーハングを有し得る。第3及び第4の5’オーバーハングは、互いに異なる配列を有し得る。いくつかの例は、第1及び第2の増幅アダプターがライゲーションされた断片のアンプリコンを生成することと、アンプリコンを配列決定することと、配列決定に基づいて標的ポリヌクレオチドを同定することとを更に含む。いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。
いくつかの例では、CasはCas12aを含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、ポリヌクレオチドを含み得る。組成物は、ポリヌクレオチド中の第1の配列にハイブリダイズされた第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。組成物は、第1の配列から少なくとも標的配列だけ離間しているポリヌクレオチド中の第2の配列にハイブリダイズした第2のCas-gRNA RNPを含み得る。第1及び第2のCas-gRNA RNPはそれぞれ、ポリヌクレオチドの第1及び第2の配列を切断して、標的配列を間に持つ第1及び第2の末端を有する断片を生成するためのものであり得る。第1の末端は、少なくとも1つの塩基の第1の5’オーバーハングを有し得る。第2の末端は、少なくとも1つの塩基の第2の5’オーバーハングを有し得る。
いくつかの例では、第1及び第2の5’オーバーハングは各々、約2~5塩基長である。いくつかの例では、第1及び第2の5’オーバーハングは各々、約5塩基長である。
いくつかの例では、第1及び第2の5’オーバーハングは、互いに異なる配列を有する。
いくつかの例では、CasはCas12aを含む。
本明細書のいくつかの例は、組成物を提供する。組成物は、標的配列を間に持つ第1及び第2の末端を各々有するポリヌクレオチド断片を含み得る。第1の末端は、少なくとも1つの塩基の第1の5’オーバーハングを有し得る。第2の末端は、少なくとも1つの塩基の第2の5’オーバーハングを有し得る。第1及び第2の5’オーバーハングは、互いに異なる配列を有し得る。組成物はまた、第1の5’オーバーハングに相補的であり、かつ第2の5’オーバーハングに相補的でない第3の5’オーバーハングを有する第1の増幅アダプターを含み得る。組成物はまた、第2の5’オーバーハングに相補的であり、かつ第1の5’オーバーハングに相補的でない第4の5’オーバーハングを有する第2の増幅アダプターを含み得る。
いくつかの例は、第1の増幅アダプターを第1の末端にライゲーションし、第2の増幅アダプターを第2の末端にライゲーションするための少なくとも1つのリガーゼを更に含む。
いくつかの例では、第1及び第2の5’オーバーハングは各々、約2~5塩基長である。いくつかの例では、第1及び第2の5’オーバーハングは各々、約5塩基長である。
いくつかの例では、第1及び第2の増幅アダプターは、固有の分子識別子(UMI)を含む。
いくつかの例では、リガーゼはT4 DNAリガーゼを含む。
本明細書におけるいくつかの例は、各々が標的配列を間に持つ第1及び第2の末端を有する複数のポリヌクレオチド断片を提供する。第1の末端は、少なくとも1つの塩基の第1の5’オーバーハングを有し得る。第2の末端は、少なくとも1つの塩基の第2の5’オーバーハングを有し得る。第1及び第2の5’オーバーハングは、互いに、かつ他の断片の第1及び第2の5’オーバーハングとは異なる配列を有し得る。
いくつかの例は、複数の第1の増幅アダプターを更に含む。第1の増幅アダプターの各々は、対応する断片の第1の5’オーバーハングに相補的であり、その断片の第2の5’オーバーハングに相補的でなく、他の断片の第1又は第2の5’オーバーハングに相補的でない第3の5’オーバーハングを有し得る。本明細書におけるいくつかの例は、複数の第2の増幅アダプターを更に含む。第2の増幅アダプターの各々は、対応する断片の第2の5’オーバーハングに相補的であり、その断片の第1の5’オーバーハングに相補的でなく、他の断片の第1又は第2の5’オーバーハングに相補的でない第4の5’オーバーハングを有し得る。
いくつかの例は、第1及び第3の5’オーバーハングが相補的である第1の末端に第1の増幅アダプターをライゲーションし、第2及び第4の5’オーバーハングが相補的である第2の末端に第2の増幅アダプターをライゲーションするためのリガーゼを更に含む。いくつかの例では、リガーゼはT4 DNAリガーゼを含む。
いくつかの例では、第1及び第2の増幅アダプターは、固有の分子識別子(UMI)を含む。いくつかの例では、第1及び第2の5’オーバーハングは各々、約2~5塩基長である。いくつかの例では、第1及び第2の5’オーバーハングは各々、約5塩基長である。
本明細書のいくつかの例は、組成物を提供する。組成物は、複数のポリヌクレオチドを含み得る。組成物は、ポリヌクレオチド中のそれぞれの第1の配列にハイブリダイズした複数の第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。組成物は、それぞれの第1の配列から少なくともそれぞれの標的配列だけ離間しているポリヌクレオチド中のそれぞれの第2の配列にハイブリダイズした複数の第2のCas-gRNA RNPを含み得る。第1及び第2の複数のCas-gRNA RNPはそれぞれ、それぞれのポリヌクレオチドの第1及び第2の配列を切断して、それぞれの標的配列をそれらの間に持つ第1及び第2の末端をそれぞれ有する断片を生成するためのものであり得る。第1の末端は、少なくとも1つの塩基の第1の5’オーバーハングを有し得る。第2の末端は、少なくとも1つの塩基の第2の5’オーバーハングを有し得る。
いくつかの例では、第1及び第2の5’オーバーハングは各々、約2~5塩基長である。いくつかの例では、第1及び第2の5’オーバーハングは各々、約5塩基長である。
いくつかの例では、第1及び第2の5’オーバーハングは、互いに異なる配列を有する。
いくつかの例では、CasはCas12aを含む。
本明細書におけるいくつかの例は、ガイドRNAを提供する。ガイドRNAは、プライマー結合部位、増幅アダプター部位、及びCRISPRプロトスペーサーを含み得る。
いくつかの例では、プライマー結合部位は、CRISPRプロトスペーサーの少なくとも一部におおよそ相補的である。
いくつかの例では、増幅アダプター部位は、プライマー結合部位とCRISPRプロトスペーサーとの間に位置する。
いくつかの例では、ガイドRNAは、少なくとも1つのループを含む。いくつかの例では、第1のループは、増幅アダプター部位とCRISPRプロトスペーサーとの間に位置する。いくつかの例では、第2のループは、増幅アダプター部位とCRISPRプロトスペーサーとの間に位置する。
本明細書におけるいくつかの例は、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を提供する。Cas-gRNA RNPは、前述のgRNAのいずれか1つと、CRISPRプロトスペーサーに結合するCasタンパク質とを含み得る。
いくつかの例では、Casタンパク質は、二本鎖ポリヌクレオチド切断を行うように構成される。いくつかの例では、Casタンパク質は、Cas9、Cas 12a、又はCas12fを含む。
いくつかの例では、プライマー結合部位及び増幅アダプター部位は、Casタンパク質の外側に伸長する。
本明細書のいくつかの例は、複合体を提供する。複合体は、第1及び第2の鎖を含むポリヌクレオチドを含み得る。複合体は、第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。第1のCas-gRNA RNPは、第1のプライマー結合部位、第1の増幅アダプター部位、及び第1のCRISPRプロトスペーサーを含む第1のガイドRNA、並びに第1のCRISPRプロトスペーサーに結合する第1のCasタンパク質を含み得る。第1のCRISPRプロトスペーサーは第1の鎖にハイブリダイズしてもよく、第1のプライマー結合部位は第2の鎖にハイブリダイズしてもよい。
いくつかの例では、第1及び第2の鎖は、第1のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で第1のCas-gRNA RNPによって切断される。いくつかの例では、第1のCasタンパク質は、Cas9、Cas 12a、又はCas12fを含む。
いくつかの例では、複合体は、第1のCasタンパク質によって引き起こされた第2の鎖の切断部に増幅アダプター部位のアンプリコンを作製するための第1の逆転写酵素を更に含む。いくつかの例では、第1の逆転写酵素は、第1のCasタンパク質にカップリングされる。いくつかの例では、第1の逆転写酵素及び第1のCasタンパク質は、第1の融合タンパク質の構成要素である。
いくつかの例では、第1のプライマー結合部位は、第1のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である。
いくつかの例では、第1の増幅アダプター部位は、第1のプライマー結合部位と第1のCRISPRプロトスペーサーとの間に位置する。
いくつかの例では、第1のgRNAは、少なくとも1つのループを更に含む。いくつかの例では、第1のループは、第1の増幅アダプター部位と第1のCRISPRプロトスペーサーとの間に位置する。いくつかの例では、第2のループは、第1の増幅アダプター部位と第1のCRISPRプロトスペーサーとの間に位置する。
いくつかの例は、第2のCas-gRNA RNPを更に含む。第2のCas-gRNA RNPは、第2のプライマー結合部位、第2の増幅アダプター部位、及び第2のCRISPRプロトスペーサーを含む第2のガイドRNAを含み得る。第2のCas-gRNA RNPは、第2のCRISPRプロトスペーサーに結合する第2のCasタンパク質を含み得る。第2のCRISPRプロトスペーサーは第1の鎖にハイブリダイズしてもよく、第2のプライマー結合部位は第2の鎖にハイブリダイズしてもよい。
いくつかの例では、第1及び第2の鎖は、第2のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で第2のCas-gRNA RNPによって切断される。いくつかの例では、第2のCas-gRNA RNPによる第1及び第2の鎖の切断部は、第1のCas-gRNA RNPによる第1及び第2の鎖の切断部から少なくとも標的配列だけ離間している。いくつかの例では、第2のCasタンパク質は、Cas9、Cas 12a、又はCas12fを含む。
いくつかの例では、複合体は、第2のCasタンパク質によって引き起こされた第2の鎖の切断部に増幅アダプター部位のアンプリコンを作製するための第2の逆転写酵素を更に含む。いくつかの例では、第2の逆転写酵素は、第2のCasタンパク質にカップリングされる。いくつかの例では、第2の逆転写酵素及び第2のCasタンパク質は、第2の融合タンパク質の構成要素である。
いくつかの例では、第2のプライマー結合部位は、第2のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である。
いくつかの例では、第2の増幅アダプター部位は、第2のプライマー結合部位と第2のCRISPRプロトスペーサーとの間に位置する。
本明細書におけるいくつかの例は、部分二本鎖ポリヌクレオチド断片を提供する。断片は、第1の3’オーバーハングを含む第1の末端;第2の末端;及び第1及び第2の末端の間に位置する標的配列を含み得る。
いくつかの例では、第1の3’オーバーハングは、第1の増幅アダプターを含む。
いくつかの例では、第2の末端は、第2の3’オーバーハングを含む。
いくつかの例では、第2の3’オーバーハングは、第2の増幅アダプターを含む。
本明細書のいくつかの例は、方法を提供する。方法は、第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を、第1及び第2の鎖を含むポリヌクレオチドと接触させることを含み得る。第1のCas-gRNAは、第1のプライマー結合部位、第1の増幅アダプター部位、及び第1のCRISPRプロトスペーサーを含む第1のガイドRNA、並びに第1のCRISPRプロトスペーサーに結合する第1のCasタンパク質を含み得る。方法は、第1のCRISPRプロトスペーサーを第1の鎖にハイブリダイズさせることを含み得る。方法は、第1のプライマー結合部位を第2の鎖にハイブリダイズさせることを含み得る。
いくつかの例では、方法は、第1のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で、第1のCas-gRNA RNPによって第1及び第2の鎖を切断することを更に含む。いくつかの例では、第1のCasタンパク質は、Cas9、Cas 12a、又はCas12fを含む。
いくつかの例では、方法は、第1の逆転写酵素を使用して、第1のCasタンパク質によって引き起こされた第2の鎖の切断部に増幅アダプター部位のアンプリコンを生成することを更に含む。いくつかの例では、第1の逆転写酵素は、第1のCasタンパク質にカップリングされる。いくつかの例では、第1の逆転写酵素及び第1のCasタンパク質は、第1の融合タンパク質の構成要素である。
いくつかの例では、第1のプライマー結合部位は、第1のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である。
いくつかの例では、第1の増幅アダプター部位は、第1のプライマー結合部位と第1のCRISPRプロトスペーサーとの間に位置する。
いくつかの例では、第1のgRNAは、少なくとも1つのループを更に含む。いくつかの例では、第1のループは、第1の増幅アダプター部位と第1のCRISPRプロトスペーサーとの間に位置する。いくつかの例では、第2のループは、第1の増幅アダプター部位と第1のCRISPRプロトスペーサーとの間に位置する。
いくつかの例では、方法は、ポリヌクレオチドを第2のCas-gRNA RNPと接触させることを更に含む。第2のCas-gRNA RNPは、第2のプライマー結合部位、第2の増幅アダプター部位、及び第2のCRISPRプロトスペーサーを含む第2のガイドRNA;並びに第2のCRISPRプロトスペーサーに結合する第2のCasタンパク質を含み得る。方法は、第2のCRISPRプロトスペーサーを第1の鎖にハイブリダイズさせることを含み得る。方法は、第2のプライマー結合部位を第2の鎖にハイブリダイズさせることを含み得る。
いくつかの例では、方法は、第2のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で、第2のCas-gRNA RNPによって第1及び第2の鎖を切断することを含み得る。いくつかの例では、第2のCas-gRNA RNPによる第1及び第2の鎖の切断部は、第1のCas-gRNA RNPによる第1及び第2の鎖の切断部から少なくとも標的配列だけ離間している。いくつかの例では、第2のCasタンパク質は、Cas9、Cas 12a、又はCas12fを含む。
いくつかの例では、方法は、第2の逆転写酵素を使用して、第2のCasタンパク質によって引き起こされた第2の鎖の切断部に増幅アダプター部位のアンプリコンを生成することを更に含み得る。いくつかの例では、第2の逆転写酵素は、第2のCasタンパク質にカップリングされる。いくつかの例では、第2の逆転写酵素及び第2のCasタンパク質は、第2の融合タンパク質の構成要素である。
いくつかの例では、第2のプライマー結合部位は、第2のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である。
いくつかの例では、第2の増幅アダプター部位は、第2のプライマー結合部位と第2のCRISPRプロトスペーサーとの間に位置する。
いくつかの例では、第1及び第2のCas-gRNA RNP並びに第1及び第2の逆転写酵素は、第1の末端及び第2の末端を有する部分二本鎖ポリヌクレオチド断片を生成する。第1の末端は、第1の3’オーバーハングを含み得る。第2の末端は、第2の3’オーバーハングを含み得る。標的配列は、第1の末端と第2の末端との間に位置し得る。いくつかの例では、第1の3’オーバーハングは、第1の増幅アダプター部位のアンプリコンを含む。いくつかの例では、第2の3’オーバーハングは、第2の増幅アダプター部位のアンプリコンを含む。いくつかの例では、方法は、第3の増幅アダプターを第1の末端の5’基にライゲーションすることと、第4の増幅アダプターを第2の末端の5’基にライゲーションすることと、第1、第2、第3、及び第4の増幅アダプターを使用して断片を増幅することと、増幅された断片を配列決定することとを更に含む。
本明細書に記載されている利益を実現するため、本明細書に記載されている本開示の態様の各々の任意のそれぞれの特徴/例は、任意の適切な組み合わせで一緒に実施されてもよいこと、及びこれらの態様のいずれか1つ以上からの任意の特徴/例は、任意の適切な組み合わせで、本明細書に記載されている他の態様の特徴のいずれかと一緒に実施されてもよいことを理解すべきである。
Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 異なる定義された断片サイズへのWG断片化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
切断部を使用してポリヌクレオチドを標識するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 切断部を使用してポリヌクレオチドを標識するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 切断部を使用してポリヌクレオチドを標識するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 切断部を使用してポリヌクレオチドを標識するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 切断部を使用してポリヌクレオチドを標識するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
増幅アダプターをdsDNAライブラリーの断片にライゲーションするための以前から知られている例示的な組成物及びプロセスフローにおける操作を概略的に示す。
Cas-gRNA RNPを使用して増幅アダプターを選択されたポリヌクレオチド断片にライゲーションするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して増幅アダプターを選択されたポリヌクレオチド断片にライゲーションするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して増幅アダプターを選択されたポリヌクレオチド断片にライゲーションするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して増幅アダプターを選択されたポリヌクレオチド断片にライゲーションするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して増幅アダプターを選択されたポリヌクレオチド断片にライゲーションするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。 Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
タグメンテーション、停止及びTWB洗浄後の標的DNA断片を概略的に示す。
ギャップ充填及びELMとのライゲーション後の標的DNA断片を概略的に示す。
PAM部位の反対側を切断するCas9ニッカーゼ(D10A)を概略的に示す。
3’ニックを含有する標的DNAを概略的に示す。
標的断片の溶出をもたらす‘3末端のポリメラーゼ伸長を概略的に示す。
4つのラムダ標的の濃縮を示すIGVトレースの例を示す。
Cas-gRNAリボ核タンパク質(RNP)を使用するゲノムライブラリー調製、及び標的化エピジェネティックアッセイが本明細書に提供される。
ゲノムライブラリー調製に関して、本明細書におけるいくつかの例は、Cas-gRNA RNP媒介性脱宿主化に関する。本明細書におけるいくつかの例は、全ゲノム(WG)の、異なる定義された断片サイズへの断片化に関する。本明細書のいくつかの例は、ポリヌクレオチドを切断することに関し、本明細書のいくつかの例は、ポリヌクレオチドを増幅アダプターにカップリングすることに関する。ゲノムライブラリー調製に関する任意のそのような例の1つ以上の態様は、ゲノムライブラリー調製に関する任意の他のそのような例の1つ以上の態様と組み合わせて使用され得ることが理解されるであろう。
標的化エピジェネティックアッセイに関して、本明細書におけるいくつかの例は、エピジェネティックな特徴(例えば、クロマチン)を保持するDNA領域(小又は大)を濃縮するためにCas-gRNA RNPを使用することに関し、これはその後、エピジェネティック-NGSアッセイにおいて処理される。このアプローチは、ウルトラディープエピジェネティックアッセイを可能にし、重要な研究又は臨床開発であり得るようなエピジェネティック機構のより良い理解を容易にし得る微細なエピジェネティック変化(例えば、ATAC-seq又はChIP-seqと比較して)及び複雑なネットワーク(例えば、遺伝子座関連プロテオミクス)の問題解決を改善する。標的化エピジェネティックアッセイに関する任意のそのような例の1つ以上の態様は、ゲノムライブラリー調製に関する任意の例の1つ以上の態様と組み合わせて使用されてもよく、逆もまた同様であることが理解されるであろう。
最初に、本明細書で使用されるいくつかの用語を簡単に説明する。次いで、Cas-RNPを使用する、ゲノムライブラリー調製のためのいくつかの例示的な組成物及び例示的な方法、並びに標的化エピジェネティックアッセイを説明する。
用語
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、当該技術分野の当業者によって一般的に理解されるものと同じ意味を有する。「含むこと(including)」という用語、並びに「含む(include)」、「含む(includes)」及び「含まれた(included)」などの他の形態の使用は、限定ではない。「有すること(having)」という用語、並びに「有する(have)」、「有する(has)」及び「有した(had)」などの他の形態の使用は、限定ではない。本明細書で使用される場合、移行句中か又は請求項の本文中のいずれであっても、「含む(comprise)」及び「含む(comprising)」という用語は、オープンエンドの意味を有するものとして解釈されるべきである。すなわち、上記の用語は、語句「少なくとも有する」又は「少なくとも含む」と同義であると解釈されるべきである。例えば、プロセスの文脈において使用される場合、「含む(comprising)」という用語は、プロセスが少なくとも列挙された工程を含むが、追加の工程を含み得ることを意味する。化合物、組成物、又はデバイスの文脈で使用される場合、「含む(comprising)」という用語は、化合物、組成物、又はデバイスが少なくとも列挙された特徴又は構成要素を含むが、追加の特徴又は構成要素も含み得ることを意味する。
本明細書で使用される場合、単数形「1つ(a)」、「1つ(an)」及び「この(the)」は、内容が明確に別段の指示をしない限り、複数の指示対象を含む。
本明細書全体を通して使用される「実質的に」、「おおよそ(approximately)」、及び「約」という用語は、処理のばらつきなどに起因する小さな変動を記載及び考慮するために使用されている。例えば、それらは、±5%以下など、±2%以下など、±1%以下など、±0.5%以下など、±0.2%以下など、±0.1%以下など、±0.05%以下などの、±10%以下を指し得る。
本明細書で使用される場合、「ハイブリダイズする」及び「ハイブリダイゼーション」などの用語は、ポリヌクレオチドを、それらのポリヌクレオチドの長さに沿って互いに非共有結合的に会合させて、二本鎖「二重鎖」、三本鎖「三重鎖」、又はより高次の構造を形成することを意味することが意図される。例えば、2つのDNAポリヌクレオチド鎖は、相補的塩基対合を介して会合して二重鎖を形成し得る。ポリヌクレオチド鎖間の一次相互作用は、典型的には、ヌクレオチド塩基特異的、例えば、A:T、A:U、及びG:Cであり得る。塩基スタッキング及び疎水性相互作用も二重鎖安定性に寄与し得る。ハイブリダイゼーション条件は、約1M未満、より通常は約500mM未満、又は約200mM未満の塩濃度を含み得る。ハイブリダイゼーション緩衝液は、5%SSPEなどの緩衝塩溶液、又は当該技術分野で公知の他の適切な緩衝液を含み得る。ハイブリダイゼーション温度は5℃程度と低くすることができるが、典型的には22℃よりも高く、より典型的には約30℃よりも高く、典型的には37℃を超える。第1及び第2のポリヌクレオチド間の会合の強度は、それらのポリヌクレオチド内のヌクレオチド配列間の相補性と共に増加する。ポリヌクレオチド間のハイブリダイゼーションの強度は、二本鎖の50%のポリヌクレオチド鎖が分離する融解温度(Tm)によって特徴付けられ得る。
本明細書で使用される場合、「ヌクレオチド」という用語は、糖、及び少なくとも1つのホスフェート基を含み、一部の例では、核酸塩基もまた含む分子を意味することが意図される。核酸塩基を欠くヌクレオチドは、「脱塩基」と称され得る。ヌクレオチドは、デオキシリボヌクレオチド、修飾デオキシリボヌクレオチド、リボヌクレオチド、修飾リボヌクレオチド、ペプチドヌクレオチド、修飾ペプチドヌクレオチド、修飾ホスフェート糖骨格ヌクレオチド、及びそれらの混合物を含む。ヌクレオチドの例には、アデノシン一リン酸(adenosine monophosphate、AMP)、アデノシン二リン酸(adenosine diphosphate、ADP)、アデノシン三リン酸(adenosine triphosphate、ATP)、チミジン一リン酸(thymidine monophosphate、TMP)、チミジン二リン酸(thymidine diphosphate、TDP)、チミジン三リン酸(thymidine triphosphate、TTP)、シチジン一リン酸(cytidine monophosphate、CMP)、シチジン二リン酸(cytidine diphosphate、CDP)、シチジン三リン酸(cytidine triphosphate、CTP)、グアノシン一リン酸(guanosine monophosphate、GMP)、グアノシン二リン酸(guanosine diphosphate、GDP)、グアノシン三リン酸(guanosine triphosphate、GTP)、ウリジン一リン酸(uridine monophosphate、UMP)、ウリジン二リン酸(uridine diphosphate、UDP)、ウリジン三リン酸(uridine triphosphate、UTP)、デオキシアデノシン一リン酸(deoxyadenosine monophosphate、dAMP)、デオキシアデノシン二リン酸(deoxyadenosine diphosphate、dADP)、デオキシアデノシン三リン酸(deoxyadenosine triphosphate、dATP)、デオキシチミジン一リン酸(deoxythymidine monophosphate、dTMP)、デオキシチミジン二リン酸(deoxythymidine diphosphate、dTDP)、デオキシチミジン三リン酸(deoxythymidine triphosphate、dTTP)、デオキシシチジン二リン酸(deoxycytidine diphosphate、dCDP)、デオキシシチジン三リン酸(deoxycytidine triphosphate、dCTP)、デオキシグアノシン一リン酸(deoxyguanosine monophosphate、dGMP)、デオキシグアノシン二リン酸(deoxyguanosine diphosphate、dGDP)、デオキシグアノシン三リン酸(deoxyguanosine triphosphate、dGTP)、デオキシウリジン一リン酸(deoxyuridine monophosphate、dUMP)、デオキシウリジン二リン酸(deoxyuridine diphosphate、dUDP)及びデオキシウリジン三リン酸(deoxyuridine triphosphate、dUTP)が含まれる。
本明細書で使用される場合、「ヌクレオチド」という用語はまた、天然に存在するヌクレオチドと比較して修飾された核酸塩基、糖、骨格及び/又はリン酸部分を含むタイプのヌクレオチドである、任意のヌクレオチドアナログを包含することが意図される。ヌクレオチド類似体はまた、「修飾核酸」と称され得る。例となる修飾核酸塩基の例には、イノシン、キササニン、ヒポキササニン、イソシトシン、イソグアニン、2-アミノプリン、5-メチルシトシン、5-ヒドロキシメチルシトシン、2-アミノアデニン、6-メチルアデニン、6-メチルグアニン、2-プロピルグアニン、2-プロピルアデニン、2-チオウラシル、2-チオチミン、2-チオシトシン、15-ハロウラシル、15-ハロシトシン、5-プロピニルウラシル、5-プロピニルシトシン、6-アゾウラシル、6-アゾシトシン、6-アゾチミン、5-ウラシル、4-チオウラシル、8-ハロアデニン又はグアニン、8-アミノアデニン又はグアニン、8-チオールアデニン又はグアニン、8-チオアルキルアデニン又はグアニン、8-ヒドロキシルアデニン又はグアニン、5-ハロ置換ウラシル又はシトシン、7-メチルグアニン、7-メチルアデニン、8-アザグアニン、8-アザアデニン、7-デアザグアニン、7-デアザアデニン、3-デアザグアニン、3-デアザアデニンなどが含まれる。当技術において公知のとおり、ある特定のヌクレオチドアナログは、ポリヌクレオチド、例えば、アデノシン5’-ホスホスルフェートなどのヌクレオチドアナログに組み込まれた状態にはなり得ない。ヌクレオチドは、任意の好適な数のホスフェート、例えば、3、4、5、6、又は6を超えるホスフェートを含み得る。ヌクレオチド類似体には、ロック核酸(LNA)、ペプチド核酸(PNA)、及び5-ヒドロキシルブチニル-2’-デオキシウリジン(「スーパーT」)も含まれる。
本明細書で使用される場合、用語「ポリヌクレオチド」とは、相互に結合しているヌクレオチドの配列を含む分子を指す。ポリヌクレオチドは、ポリマーの非限定的な一例である。ポリヌクレオチドの例としては、デオキシリボ核酸(DNA)、リボ核酸(RNA)、並びにロック核酸(LNA)及びペプチド核酸(PNA)などの、それらの類似体が挙げられる。ポリヌクレオチドは、RNA又は一本鎖DNAなどのヌクレオチドの一本鎖配列であり得、二本鎖DNAなどのヌクレオチドの二本鎖配列であるか、又はヌクレオチドの一本鎖及び二本鎖配列の混合物を含み得る。二本鎖DNA(double stranded DNA、dsDNA)は、ゲノムDNA、及びPCR及び増幅生成物を含む。一本鎖DNA(single stranded DNA、ssDNA)は、dsDNAに変換され得、その反対もあり得る。ポリヌクレオチドには、エナンチオマーDNA、LNA、又はPNAなどの非自然発生DNAが含まれ得る。ポリヌクレオチド中のヌクレオチドの正確な配列は、既知であっても未知であってもよい。以下は、ポリヌクレオチドの例である:遺伝子又は遺伝子断片(例えば、プローブ、プライマー、発現配列タグ(expressed sequence tag、EST)、又は遺伝子発現連続分析(serial analysis of gene expression、SAGE)タグ)、ゲノムDNA、ゲノムDNA断片、エクソン、イントロン、メッセンジャーRNA(messenger RNA、mRNA)、転移RNA、リボソームRNA、リボザイム、cDNA、組換えポリヌクレオチド、合成ポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、いかなる配列の単離されたDNA、いかなる配列の単離されたRNA、核酸プローブ、前述のいずれかのプライマー又は増幅されたコピー。
本明細書で使用される場合、「ポリメラーゼ」は、ヌクレオチドをポリヌクレオチドに重合することによってポリヌクレオチドを組み立てる活性部位を有する酵素を意味することが意図される。ポリメラーゼは、プライミングされた一本鎖標的ポリヌクレオチドに結合し、ヌクレオチドをプライマーに連続的に付加して成長させ、標的ポリヌクレオチドの配列に相補的な配列を有する「相補的コピー」ポリヌクレオチドを形成することができる。次いで、別のポリメラーゼ、又は同じポリメラーゼは、その相補的コピーポリヌクレオチドの相補的コピーを形成することによって、標的ヌクレオチドのコピーを形成することができる。かかるコピーのいずれも、本明細書では「アンプリコン」と称され得る。DNAポリメラーゼは、標的ポリヌクレオチドに結合し、次いで、ヌクレオチドを、ポリヌクレオチド鎖の3’末端の遊離ヒドロキシル基に連続的に付加して成長させ(アンプリコン成長)つつ、標的ポリヌクレオチドを下流へ移動することができる。DNAポリメラーゼは、DNA鋳型から相補的DNA分子を合成し得、RNAポリメラーゼは、DNA鋳型からRNA分子を合成し得る(転写)。ポリメラーゼは、短いRNA又はDNA鎖(プライマー)を使用して、鎖成長を開始し得る。いくつかのポリメラーゼは、それらが鎖に塩基を付加する部位の上流の鎖を置換し得る。かかるポリメラーゼは、鎖置換であるとも言われ得、これは、ポリメラーゼによって読み取られる鋳型鎖から相補鎖を除去する活性を有すると言われ得る。
ポリメラーゼの例としては、Bst DNAポリメラーゼ、9°Nm DNAポリメラーゼ、Phi29 DNAポリメラーゼ、DNAポリメラーゼI(大腸菌(E.coli))、DNAポリメラーゼI(Large)、(クレノウ)断片、クレノウ断片(3’-5’exo-)、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、Deep VentR(商標)(exo-)DNAポリメラーゼ、Deep VentR(商標)DNAポリメラーゼ、DyNAzyme(商標)EXT DNA、DyNAzyme(商標)II Hot Start DNAポリメラーゼ、Phusion(商標)High-Fidelity DNAポリメラーゼ、Therminator(商標)DNAポリメラーゼ、Therminator(商標)II DNAポリメラーゼ、VentR(登録商標)DNAポリメラーゼ、VentR(商標)(exo-)DNAポリメラーゼ、RepliPHI(商標)Phi29 DNAポリメラーゼ、rBst DNAポリメラーゼ、rBst DNAポリメラーゼ(Large)、断片(IsoTherm(商標)DNAポリメラーゼ)、MasterAmp(商標)AmpliTherm(商標)DNAポリメラーゼ、Taq DNAポリメラーゼ、Tth DNAポリメラーゼ、Tfl DNAポリメラーゼ、Tgo DNAポリメラーゼ、SP6 DNAポリメラーゼ、Tbr DNAポリメラーゼ、DNAポリメラーゼベータ、及びThermoPhi DNAポリメラーゼが挙げられる。特定の非限定的な例では、ポリメラーゼは、Bst、Bsu、及びPhi29からなる群から選択される。ポリメラーゼはハイブリダイズした鎖を伸長させるので、一本鎖結合タンパク質(SSB)を含むことが有益であり得る。SSBは、置換された(非鋳型)鎖を安定化し得る。鎖置換活性を有する例示的なポリメラーゼとしては、Ventポリメラーゼ、Bsuポリメラーゼ、Bst(バチルス・ステアロサーモフィルス(Bacillus stearothermophilus))ポリメラーゼ、exo-クレノウポリメラーゼ又は配列決定グレードT7エキソ-ポリメラーゼの大きな断片が含まれるが、これらに限定されない。いくつかのポリメラーゼは、それらの前の鎖を切断し、それを成長する鎖に効果的に置き換える(5’エキソヌクレアーゼ活性)。5’エキソヌクレアーゼ活性を有するポリメラーゼの例としては、Taq、Bst、及びDNAポリメラーゼIが挙げられる。いくつかのポリメラーゼは、その後ろの鎖を分解する活性(3’エキソヌクレアーゼ活性)を有する。いくつかの有用なポリメラーゼは、3’及び/又は5’エキソヌクレアーゼ活性を低減又は排除するために変異又は他の方法で修飾されている。ポリメラーゼは、逆転写酵素(RT)を含み得る。RTの非限定的な例としては、MMLV及びその変異体、例えば、その全内容が参照により本明細書に組み込まれる、Anzalone et al.,「Search-and-replace genome editing without double-strand breaks or donor DNA」,Nature 576:149-157(2019)に記載されているものが挙げられる。
本明細書で使用される場合、「プライマー」という用語は、ヌクレオチドが遊離3’OH基を介して付加され得るポリヌクレオチドとして定義される。プライマーは、ブロックが除去されるまで重合を防止する3’ブロックを含み得る。プライマーは、カップリング反応を可能にするか、又はプライマーを別の部分にカップリングすることを可能にするための、5’末端の修飾を含み得る。プライマーは、例えば、UV光、化学物質、酵素などの適切な条件下で切断され得る、8-オキソ-Gなどの1つ以上の部分を含み得る。プライマーの長さは、任意の好適な数の塩基の長さであり得、天然及び/又は非天然ヌクレオチドの好適な組み合わせを含み得る。標的ポリヌクレオチドは、プライマーにハイブリダイズする(プライマーに相補的な配列を有する)「増幅アダプター」又はより単純には「アダプター」を含み得、プライマーの遊離3’OH基にヌクレオチドを付加することによって相補的コピーポリヌクレオチドを生成するように増幅され得る。「捕捉プライマー」は、基材に結合し、標的ポリヌクレオチドの第1のアダプターにハイブリダイズし得るプライマーを意味することが意図され、「直交捕捉プライマー」は、基材に結合し、その標的ポリヌクレオチドの第2のアダプターにハイブリダイズし得るプライマーを意味することが意図される。第1のアダプターは、捕捉プライマーの配列と相補的な配列を有し得、第2のアダプターは、直交捕捉プライマーのものと相補的な配列を有し得る。捕捉プライマー及び直交捕捉プライマーは、互いに異なる独立した配列を有し得る。更に、捕捉プライマー及び直交捕捉プライマーは、少なくとも1つの他の特性において互いに異なり得る。例えば、捕捉プライマー及び直交捕捉プライマーは、互いに異なる長さを有し得、該捕捉プライマー又は該直交捕捉プライマーのいずれかは、該捕捉プライマー又は該直交捕捉プライマーの他方が有しない非核酸部分(遮断基又は除去部分など)を含み得、又はかかる特性の任意の好適な組み合わせを含み得る。修飾された捕捉プライマーは、限定されないが、DNAなどの複数の天然に存在する核酸を更に含み得る。
いくつかの例では、捕捉プライマーは、Illumina,Inc.から市販されているP5又はP7プライマーである。P5及びP7プライマーは、互いに直交するプライマーの非限定的な例である。P5及びP7プライマー配列は、いくつかの例では、以下の配列を有し得る:
ペアリードセット:
P5:5’-AATGATACGGCGACCACCGAGAUCTACAC-3’(配列番号1)
P7:5’-CAAGCAGAAGACGGCATACGAGAT-3’(配列番号2)
単一リードセット:
P5:5’-AATGATACGGCGACCACCGA-3’(配列番号3)
P7:5’-CAAGCAGAAGACGGCATACGA3’(配列番号4)
式中、Gは、G又は8-オキソグアニンである。
本明細書で使用するとき、用語「複数の」とは、2つ以上の異なるメンバーの集団を意味することを意図する。複数とは、小さい、中程度、大きい、から非常に大きいサイズまでの範囲であり得る。小さいサイズの複数とは、例えば、数メンバー~数十メンバーの範囲であり得る。中程度のサイズの複数とは、例えば、数十メンバー~約100メンバー又は数百メンバーの範囲であり得る。大きい複数とは、例えば、約数百メンバー~約1000メンバー、数千メンバー、及び数万メンバーの範囲であり得る。非常に大きな複数とは、例えば、数万メンバー~約数十万、数百万、数千万、又は数億以上のメンバーの範囲であり得る。したがって、複数は、2から1億をはるかに超えるメンバーのサイズの範囲、並びにメンバーの数によって測定される全てのサイズの間及び上記の例示的な範囲よりも大きい範囲であり得る。複数のポリヌクレオチドの例としては、例えば、約1×10以上、5×10以上又は1×10以上の異なるポリヌクレオチドの集団が挙げられる。したがって、この用語の定義は、2より大きい全ての整数値を含むことが意図される。複数値の上限は、例えば、サンプル中のポリヌクレオチド配列の理論的多様性によって設定され得る。
本明細書で使用される場合、「二本鎖」という用語は、ポリヌクレオチドに関して使用される場合、ポリヌクレオチド中のヌクレオチドの全て又は実質的に全てが、相補的ポリヌクレオチド内のそれぞれのヌクレオチドに水素結合していることを意味することが意図される。二本鎖ポリヌクレオチドは「二重鎖」とも称され得る。本明細書で使用される場合、「一本鎖」という用語は、ポリヌクレオチドに関して使用される場合、ポリヌクレオチド中のヌクレオチドのいずれも、相補的ポリヌクレオチド中のそれぞれのヌクレオチドに水素結合していないことを意味する。
本明細書で使用される場合、「標的ポリヌクレオチド」という用語は、分析又は作用の対象となるポリヌクレオチドを意味することが意図され、「ライブラリーポリヌクレオチド」、「鋳型ポリヌクレオチド」、又は「ライブラリーテンプレート」などの用語を使用しても参照され得る。分析又は作用としては、ポリヌクレオチドを捕捉、増幅、配列決定、及び/又は他の手順に供することが挙げられる。標的ポリヌクレオチドは、分析される標的配列に追加のヌクレオチド配列を含み得る。例えば、標的ポリヌクレオチドは、プライマー結合部位として機能する増幅アダプターを含む1つ以上のアダプターを含み得、それは、分析される標的ポリヌクレオチド配列の側方にある(flank)。捕捉プライマーにハイブリダイズした標的ポリヌクレオチドは、標的ポリヌクレオチドの全てが伸長に適さないように、捕捉オリゴヌクレオチドの5’又は3’末端を超えて伸長するヌクレオチドを含み得る。特定の例では、複数の標的ポリヌクレオチドは、互いに異なる配列を有し得るが、互いに同じである第1及び第2のアダプターを有し得る。特定の標的ポリヌクレオチド配列に隣接し得る2つのアダプターは、互いに同じ配列、又は互いに相補的配列を有し得るか、又は2つのアダプターは、異なる配列を有し得る。したがって、複数の標的ポリヌクレオチド中の種は、例えば、配列決定(例えば、SBS)によって評価される未知の配列領域が隣接した、既知の配列領域を含み得る。いくつかの例では、標的ポリヌクレオチドは、単一の末端で増幅アダプターを担持し、かかるアダプターは、標的ポリヌクレオチドの3’末端又は5’末端のいずれかに位置し得る。標的ポリヌクレオチドは、アダプターなしで使用され得、その場合、プライマー結合配列は、標的ポリヌクレオチドに存在する配列を直接用い得る。
「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語は、本明細書においては交換可能に使用される。用語の違いは、特に明記しない限り、サイズ、配列、又は他の特性の任意の特定の違いを示すことを意図するものではない。説明を明確にするために、いくつかのポリヌクレオチド種を含む特定の方法又は組成物を説明する際に、1つの種のポリヌクレオチドを別の種と区別するために用語を使い分けてもよい。
「配列」及び「部分配列」という用語は、場合によっては、本明細書で交換可能に使用され得る。例えば、配列は、その中に1つ以上の部分配列を含み得る。かかる部分配列の各々は、配列とも称され得る。
本明細書で使用するとき、用語「アンプリコン」は、ポリヌクレオチドに関して使用する場合、ポリヌクレオチドの複製による生成物を意味し、この生成物は、ポリヌクレオチドのヌクレオチド配列の少なくとも一部と実質的に同じ又は実質的に相補的なヌクレオチド配列を有する。「増幅」及び「増幅すること」は、ポリヌクレオチドのアンプリコンを作製するプロセスを指す。標的ポリヌクレオチドの第1のアンプリコンは、典型的には相補的なコピーであり得る。追加的なアンプリコンは、第1のアンプリコンの生成後に、標的ポリヌクレオチド又は第1のアンプリコンから作成されたコピーである。後続のアンプリコンは、標的ポリヌクレオチドと実質的に相補的であるか、又は標的ポリヌクレオチドと実質的に同一である配列を有し得る。ポリヌクレオチドの(例えば、増幅アーチファクトによる)少数の変異が、そのポリヌクレオチドのアンプリコンを生成するときに起こり得ることは理解されるであろう。
本明細書で使用される場合、「保護要素」という用語は、ポリヌクレオチドの5’末端又は3’末端に関して使用される場合、ポリヌクレオチドの末端の改変を阻害するエレメントを意味することが意図される。例示的に、保護要素は、5’又は3’エキソヌクレアーゼの作用など、ポリヌクレオチドの末端における1つ以上の酵素の作用を阻害し得る。保護要素の非限定的な例としては、二本鎖ポリヌクレオチドの末端の5’鎖及び3’鎖にライゲーションされたヘアピン配列、修飾塩基(例えば、ホスホロチオエート結合又は3’リン酸を含む)、又は脱リン酸化塩基が挙げられる。
本明細書で使用される場合、「CRISPR-Casシステム」、「Cas-gRNAリボ核タンパク質」、及びCas-gRNA RNPなどの用語は、標的ポリヌクレオチド中の配列に相補的又は実質的に相補的なオリゴヌクレオチド配列を含むガイドRNA(gRNA)配列と、Casタンパク質とを含む酵素系を指す。CRISPR-Casシステムは、一般に、コアエレメント含量及び配列に基づいて、更に10のサブタイプに細分される3つの主要なタイプに分類することができる;例えば、Makarova et al.,「Evolution and classification of the CRISPR-Cas systems,」Nat Rev Microbiol.9(6):467-477(2011)参照。Casタンパク質は、様々な活性、例えばヌクレアーゼ活性を有し得る。したがって、CRISPR-Casシステムは、(例えば、gRNAを介して)特定の配列を標的化するための機構、並びに(例えば、Casタンパク質を介して)配列に対するある特定の酵素活性を提供する。
I型CRISPR-Casシステムは、別個のヘリカーゼ活性及びDNase活性を有するCas3タンパク質を含み得る。例えば、1-E型システムにおいて、crRNAは、カスケード(抗ウイルス防御のためのCRISPR関連複合体)と呼ばれるマルチサブユニットエフェクター複合体に組み込まれ、これは、標的DNAに結合し、Cas3タンパク質による分解を誘発する;例えば、Brouns et al.,「Small CRISPR RNAs guide antiviral defense in prokaryotes」,Science 321(5891):960-964(2008);Sinkunas et al.,「Cas3 is a single-stranded DNA nuclease and ATP-dependent helicase in the CRISPR-Cas immune system」,EMBO J 30:1335-1342(2011);及びBeloglazova et al.,「Structure and activity of the Cas3 HD nuclease MJ0384,an effector enzyme of the CRISPR interference」,EMBO J 30:4616-4627(2011)を参照されたい。II型CRISPR-Casシステムは、crRNAを生成して標的DNAを切断することができる単一タンパク質(約160KDa)である、シグネチャーCas9タンパク質を含む。Cas9タンパク質は、典型的には、2つのヌクレアーゼドメインである、アミノ末端付近のRuvC様ヌクレアーゼドメインと、タンパク質の中央付近のHNH(又はMcrA様)ヌクレアーゼドメインとを含む。Cas9タンパク質の各ヌクレアーゼドメインは、二重らせんの一方の鎖を切断するように特殊化されている;例えば、Jinek et al.,「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity」,Science 337(6096):816-821(2012)を参照されたい。III型CRISPR-Casシステムは、ポリメラーゼ及びRAMPモジュールを含む。III型システムは、III-A及びIII-Bのサブタイプに更に分けることができる。III-A型CRISPR-Casシステムは、プラスミドを標的化することが示されており、III-A型システムのポリメラーゼ様タンパク質は、標的DNAの切断に関与する;例えば、Marraffini et al.,「CRISPR interference limits horizontal gene transfer in Staphylococci by targeting DNA」,Science 322(5909):1843-1845 (2008)を参照されたい。III-B型CRISPR-Casシステムもまた、RNAを標的化することが示されている;例えば、Hale et al.,「RNA-guided RNA cleavage by a CRISPR-RNA-Cas protein complex」,Cell 139(5):945-956(2009)を参照されたい。CRISPR-Casシステムは、天然に存在するCRISPR-Casシステムに由来する操作された及び/又はプログラムされたヌクレアーゼ系を含む。CRISPR-Casシステムは、操作された及び/又は変異したCasタンパク質を含み得る。CRISPR-Casシステムは、操作された及び/又はプログラムされたガイドRNAを含み得る。
いくつかの具体例では、本発明のCas-gRNA RNPのうちの1つにおけるCasタンパク質は、Cas9、又はgRNAが相補的である配列で標的ポリヌクレオチドを切断することができる他の適切なCasを、以下の参照文献に記載されているような方法で含むことができ、それらの各々の全内容は参照により本明細書に組み込まれる:Nachmanson et al.,「Targeted genome fragmentation with CRISPR/Cas9 enables fast and efficient enrichment of small genomic regions and ultra-accurate sequencing with low DNA input(CRISPR-DS)」,Genome Res.28(10):1589-1599 (2018);Vakulskas et al.,「A high-fidelity Cas9 mutant delivered as a ribonucleoprotein complex enables efficient gene editing in human hematopoietic stem and progenitor cells」,Nature Medicine 24:1216-1224 (2018);Chatterjee et al.,「Minimal PAM specificity of a highly similar SpCas9 ortholog」,Science Advances 4(10):eaau0766,1-10 (2018);Lee et al.,「CRISPR-Cap:multiplexed double-stranded DNA enrichment based on the CRISPR system」,Nucleic Acids Research 47(1):1-13 (2019)。S.thermophilus CRISPR-Casシステムから単離されたCas9-crRNA複合体、並びに、別個の構成要素からインビトロで組み合わされた複合体は、それが合成オリゴデオキシヌクレオチド及びcrRNAに相補的なヌクレオチド配列を有するプラスミドDNAの両方に結合することが実証される。Cas9は、RuvC及びHNH活性部位/ヌクレアーゼドメインの2つのヌクレアーゼドメインを有し、これらの2つのヌクレアーゼドメインは、反対のDNA鎖の切断に関与することが示されている。いくつかの例では、Cas9タンパク質は、S.thermophilus CRISPR-CasシステムのCas9タンパク質に由来する。いくつかの例では、Cas9タンパク質は、約1,409アミノ酸残基を有するマルチドメインタンパク質である。
他の例では、Casは、gRNAが相補的である配列で標的ポリヌクレオチドを切断しないように、例えば、以下の参照文献に記載されているような方法で操作されてもよく、それらの各々の全内容は参照により本明細書に組み込まれる:Guilinger et al.,「Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification」,Nature Biotechnology 32:577-582(2014);Bhatt et al.,「Targeted DNA transposition using a dCas9-transposase fusion protein」,https://doi.org/10.1101/571653,pages 1-89 (2019);Xu et al.,「CRISPR-assisted targeted enrichment-sequencing (CATE-seq)」,available at URL www.biorxiv.org/content/10.1101/672816v1,1-30 (2019);及びTijan et al.,「dCas9-targeted locus-specific protein isolation method identifies histone gene regulators」,PNAS 115(12):E2734-E2741 (2018)。ヌクレアーゼ活性を欠くCasは、不活性化Cas(dCas)と称され得る。いくつかの例では、dCasは、RuvC及びHNH活性部位/ヌクレアーゼドメインの両方が変異している、Cas9タンパク質のヌクレアーゼ欠損バリアントを含み得る。Cas9タンパク質のヌクレアーゼ欠損変異体(dCas9)は、二本鎖DNAに結合するが、DNAを切断しない。Cas9タンパク質の別の変異体は、crRNAに相補的な鎖を切断するドメイン中の第1の突然変異と、crRNAに非相補的な鎖を切断するドメイン中の第2の突然変異とを有する、2つの不活性化ヌクレアーゼドメインを有する。いくつかの例では、Cas9タンパク質は、第1の突然変異D10A及び第2の突然変異H840Aを有する。
更に他の例では、Casタンパク質は、Cascadeタンパク質を含む。大腸菌(E.coli)のカスケード複合体は、配列特異的に二本鎖DNA(dsDNA)標的を認識する。大腸菌(E.coli)のカスケード複合体は、5つの機能的に必須のCRISPR関連(Cas)タンパク質(CasA1B2C6D1E1、カスケードタンパク質とも呼ばれる)と61ヌクレオチドのcrRNAとを含む、405kDaの複合体である。crRNAは、相補的DNA鎖と塩基対を形成する一方で、非相補鎖を置換してRループを形成することによって、カスケード複合体をdsDNA標的配列に誘導する。カスケードは、ATPを消費することなく標的DNAを認識し、これは、連続的なインベーダーDNA監視がエネルギー投資なしに行われることを示唆する;例えば、Matthijs et al.,「Structural basis for CRISPR RNA-guided DNA recognition by Cascade」,Nature Structural & Molecular Biology 18(5):529-536(2011)を参照されたい。更に他の例では、Casタンパク質は、Cas3タンパク質を含む。例示的に、大腸菌(E.coli)Cas3は、RNAとDNAとのATP非依存的アニーリングを触媒して、Rループ、及びRNA塩基対のハイブリッドを二本鎖DNAに形成し得る。Cas3タンパク質は、Cas9よりも長いgRNAを使用し得る;例えば、Howard et al.,「Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein」,Biochem J.439(1):85-95(2011)を参照されたい。そのようなより長いgRNAは、標的DNAへの他のエレメントのより容易なアクセス、例えば、ポリメラーゼによって伸長されるプライマーのアクセスを可能にし得る。Cas3タンパク質によって提供される別の特徴は、Cas3タンパク質がCas9のようにPAM配列を必要とせず、したがって、所望の配列を標的化するためにより高い柔軟性を提供することである。Cas3によるRループ形成は、補因子としてマグネシウムを利用し得る;例えば、Howard et al.,「Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein」,Biochem J.439(1):85-95(2011)を参照されたい。PAM配列の必要性を低減又は回避するCas9バリアントも開発されている;例えば、その全内容が参照により本明細書に組み込まれる、Walton et al.,「Unconstrained genome targeting with near PAMless engineered CRISPR-Cas9 variants」,Science 368(6488):290-296(2020)を参照されたい。カチオンなどの任意の適切な補因子が、本発明の組成物及び方法において使用されるCasタンパク質と一緒に使用され得ることが理解されるであろう。
二本鎖ポリヌクレオチドを破壊し、ループ構造を作り出すことができる任意のCRISPR-Casシステムが使用され得ることも理解されるべきである。例えば、Casタンパク質としては、以下の参考文献に記載されているようなCasタンパク質を挙げることができるが、これらに限定されず、それらの各々の全内容は参照により本明細書に組み込まれる:Haft et al.,「A guild of 45 CRISPR-associated(Cas)protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes」,PLoS Comput Biol.1(6):e60,1-10(2005);Zhang et al.,「Expanding the catalog of cas genes with metagenomes」,Nucl.Acids Res.42(4):2448-2459(2013);及びStrecker et al.,「RNA-guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53 (2019)(Casタンパク質はCas12kを含み得る)。これらのCRISPR-Casシステムのいくつかは、標的配列を認識して結合するために特定の配列を利用し得る。例えば、Cas9は、5’-NGGプロトスペーサー隣接モチーフ(PAM)の存在を利用し得る。
いくつかの例では、Casタンパク質は、例えば、1つ以上の塩基、例示的には2~5塩基のdsDNA切断後に一本鎖DNAオーバーハング領域を残すように選択され得る。例えば、CRISPR-Cas12a(Cpf1)は、Integrated DNA Technologies,Inc.(アイオワ州コーラルビル)から市販されている。製造業者によれば、CRISPR-Cas12a(Cpf1)は、5’オーバーハングを有するスタッガードカットを生成し、CRISPR-Cas9とは異なる部位を標的とし得る。いくつかの例では、5’オーバーハングは、5塩基長であり得る。これらのCRISPR-Cas系のいくつかは、PAMを利用し得る。例えば、その全内容が参照により本明細書に組み込まれる、Teng et al.,「Enhanced mammalian genome editing by new Cas12a orthologs with optimized crRNA scaffolds」,Genome Biology 20:15(2019)に記載されるような方法で、Cas12a(Cpf1又はC2c1)又はFnCas12aは、切断部位の上流のTTTNのPAMを使用してもよいが、出現するCas12aオルソログは、低減されたPAM要件(例えば、YTN)を有してもよい。Cas12は、Francisella novicida、Acidaminococcus sp.、Lachnospiraceae sp.、及びPrevotella sp.などの生物に由来し得る。Cas12aに関する更なる詳細については、その内容全体が参照により本明細書に組み込まれる、Covsky et al.,「CRISPR-Cas12a exploits R-loop asymmetry to form double-strand breaks」,eLife,9:e55143(2020)を参照されたい。
CRISPR-Casシステムはまた、操作された及び/又はプログラムされたガイドRNA(gRNA)を含み得る。本明細書で使用されるとき、「ガイドRNA」及び「gRNA」(当該技術分野では単一ガイドRNA又はsgRNAと呼ばれることもある)という用語は、標的DNA配列の領域に相補的又は実質的に相補的であり、Casタンパク質をその領域に誘導する配列を含むRNAを意味することが意図される。ガイドRNAは、標的DNA配列の領域に相補的又は実質的に相補的であるヌクレオチド配列に加えて、ヌクレオチド配列を含み得る。gRNAを設計するための方法は、当該技術分野において周知であり、非限定的な例は、以下の参考文献に提供されており、これらの各々の全内容は、参照により本明細書に組み込まれる:Stevens et al.,「A novel CRISPR/Cas9 associated technology for sequence-specific nucleic acid enrichment」,PLoS ONE 14(4):e0215441,pages 1-7(2019);Fu et al.,「Improving CRISPR-Cas nuclease specificity using truncated guide RNAs,Nature Biotechnology 32(3):279-284 (2014);Kocak et al.,「Increasing the specificity of CRISPR systems with engineered RNA secondary structures」,Nature Biotechnology 37:657-666 (2019);Lee et al.,「CRISPR-Cap:multiplexed double-stranded DNA enrichment based on the CRISPR system」,Nucleic Acids Research 47(1):e1,1-13 (2019);Quan et al.,「FLASH:a next-generation CRISPR diagnostic for multiplexed detection of antimicrobial resistance sequences」,Nucleic Acids Research 47(14):e83,1-9 (2019);及びXu et al.,「CRISPR-assisted targeted enrichment-sequencing (CATE-seq)」,https://doi.org/10.1101/672816,1-30 (2019)。
いくつかの例では、gRNAは、キメラ、例えば、トランス活性化CRISPR RNA(tracrRNA)に融合されたCRISPR RNA(crRNA)を含む。そのようなキメラ単一ガイドRNA(sgRNA)は、Jinek et al.,「A programmable dual-RNA-guided endonuclease in adaptive bacterial immunity」,Science 337(6096):816-821(2012)に記載されている。Casタンパク質は、キメラsgRNAによって、5’-NGGプロトスペーサー隣接モチーフ(PAM)が続く任意のゲノム遺伝子座に指向され得る。非限定的な一例において、crRNA及びtracrRNAは、T7プロモーターを含む合成二本鎖DNA鋳型を使用して、インビトロ転写によって合成され得る。tracrRNAは固定配列を有してもよいが、標的配列はcrRNAの配列の一部を決定してもよい。等モル濃度のcrRNA及びtracrRNAを混合し、55℃で30秒間加熱してもよい。Cas9を37℃にて同じモル濃度で添加し、RNAミックスと共に10分間インキュベートすることができる。次いで、10~20倍モル過剰の得られたCas9-gRNA RNPを標的DNAに添加することができる。結合反応は15分以内に起こり得る。他の適切な反応条件を容易に使用することができる。
本明細書で使用される場合、「融合タンパク質」及び「キメラタンパク質」という用語は、互いに異なる機能的特性(例えば、異なる酵素活性)を有する2つ以上のポリペプチドドメインを含む要素を意味することが意図される。ドメインは、互いに共有結合的又は非共有結合的にカップリングしていてもよい。融合タンパク質は、任意選択的に、1つ以上の他のポリペプチドドメインに作動可能に連結された第3、第4若しくは第5のポリペプチドドメイン又は他のポリペプチドドメインを含み得る。融合タンパク質は、同じポリペプチドドメインの複数のコピーを含み得る。融合タンパク質はまた、又は代替的に、1つ以上のポリペプチドにおいて1つ以上の突然変異を含み得る。融合タンパク質は、ポリヌクレオチド(例示的に、gRNA)及び/又はドメインを互いにカップリングするリンカーなどの1つ以上の非タンパク質要素を含み得る。融合タンパク質の非限定的な例については、その全内容が参照により本明細書に組み込まれる、以下の参考文献を参照されたい:Guilinger et al.,「Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification」,Nature Biotechnology 32:577-582(2014);Bhatt et al.,「Targeted DNA transposition using a dCas9-transposase fusion protein」,https://doi.org/10.1101/571653,pages 1-89 (2019);及びStrecker et al.,「RNA-guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53(2019)。別の例示的な融合タンパク質はShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)であり、これはCas12k及びTn7様トランスポザーゼを含む。内部にCas12k及びTn7を含むShCASTに関する更なる詳細については、その全内容が参照により本明細書に組み込まれる、Strecker et al.,「RNA-Guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53(2019)を参照されたい。
本明細書で使用される場合、「トランスポザーゼ」という用語は、オリゴヌクレオチドをポリヌクレオチドにカップリングすることができる酵素を意味することが意図される。いくつかの例では、オリゴヌクレオチドは、増幅アダプターを含み得、任意選択的に、固有の分子識別子(UMI)を含み得る。トランスポザーゼは、オリゴヌクレオチドを付加しながらポリヌクレオチドを切断してもよい。トランスポザーゼの非限定的な一例はTn5である。更に別の例では、トランスポザーゼは、レトロトランスポゾン又はレトロウイルス由来のインテグラーゼを含み得る。トランスポザーゼ、トランスポソーム及びトランスポソーム複合体は、その全内容が参照により本明細書に組み込まれる米国特許出願公開第2010/0120098号の開示によって例示されるように、当業者に一般に知られている。
本明細書に提供されるような方法で使用され得るトランスポザーゼの更なる非限定的な例については、それらの各々の全内容が参照により本明細書に組み込まれる、以下の参考文献を参照されたい:Strecker et al.,「RNA-guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53(2019);Klompe et al.,「Transposon-encoded CRISPR-Cas systems direct RNA-guided DNA integration」,Nature 571:219-225(2019);Bhatt et al.,「Targeted DNA transposition using a dCas9-transposase fusion protein」,https://doi.org/10.1101/571653,pages 1-89(2019)。提供される方法で使用できる既知の転位システムの他の例は、黄色ブドウ球菌(Staphylococcus aureus)Tn552、Tyl、トランスポゾンTn7、Tn/O及びIS10、マリナートランスポザーゼ、Tel、P要素、Tn3、細菌の挿入配列、レトロウイルス、並びに酵母のレトロトランスポゾン(例えば、Colegio et al.2001,J.Bacteriol.183:2384-8;Kirby et al.,2002,Mol.Microbiol.43:173-86;Devine and Boeke,1994,Nucleic Acids Res.,22:3765-72;国際特許出願第95/23875号、Craig,1996,Science 271:1512;Craig,1996,Review in:Curr Top Microbiol Immunol.204:27-48;Kleckner et al.,1996,Curr Top Microbiol Immunol.204:49-82;Lampe et al.,1996,EMBO J.15:5470-9;Plasterk,1996,Curr Top Microbiol Immunol 204:125-43;Gloor,2004,Methods Mol.Biol.260:97-114;Ichikawa and Ohtsubo,1990,J Biol.Chem.265:18829-32;Ohtsubo and Sekine,1996,Curr.Top.Microbiol.Immunol.204:1-26;Brown et al.,1989,Proc Natl Acad Sci USA86:2525-9;and Boeke and Corces,1989,Annu Rev Microbiol.43:403-34)を含むが、それらに限定されない。別の例として、ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)は、Tn7様トランスポザーゼを含む;更なる詳細については、その全内容が参照により本明細書に組み込まれる、Strecker et al.,「RNA-Guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53(2019)を参照されたい。
いくつかの例では、トランスポザーゼは、例えば、それらの各々の全内容は参照により本明細書に組み込まれる、米国特許出願公開第2010/0120098号明細書又は国際公開第2010/04860号に記載されているような方法で、標的ポリヌクレオチドの断片化並びに二本鎖DNA断片の両方の鎖の5’末端への、又は5’及び3’末端へのアダプターのライゲーションをもたらす「タグメンテーション」又は「転位」と呼ばれ得るプロセスを実行し得る。
トランスポザーゼは、トランスポザーゼと、トランスポゾン末端含有組成物と、二本鎖ポリヌクレオチドとを含む「転位複合体」を形成し得、トランスポゾン末端含有組成物の二本鎖標的ポリヌクレオチドへの挿入又は転位を触媒し得る。転位複合体の例としては、限定されないが、高活性Tn5トランスポザーゼ及びTn5型トランスポゾン末端によって、又はMuAトランスポザーゼ並びにR1及びR2末端配列を含むMuトランスポゾン末端によって形成されるものが挙げられる;例えば、それらの各々の全内容が参照により本明細書に組み込まれる、以下の参考文献を参照されたい:Goryshin et al.,「Tn5 in vitro transposition」,J.Biol.Chem。273:7367-7394(1998);Mizuuchi,「In vitro transposition of bacteriophage Mu:a biochemical approach to a novel replication reaction」,Cell 35(3 pt 2):785-794(1983);及びSavilahti et al.,「The phage Mu transposomes core:DNA requirements for assembly and function」,EMBO J.14(19):4893-4903(1995)。トランスポザーゼ及びトランスポゾン末端の組み合わせは、「トランスポソーム」と称され得る。
トランスポザーゼ及び他の適切な転位系の更なる別の例としては、スタフィロコッカス・アウレウス(Staphylococcus aureus)Tn552が挙げられる(例えば、Colegio et al.,「In vitro transposition system for efficient generation of random mutants of Campylobacter jejuni」,J Bacteriol.183:2384-2388(2001)並びにKirby et al.,「Cryptic plasmids of Mycobacterium avium:Tn552 to the rescue」,Mol Microbiol.,43(1):173-186(2002));TyI(Devine et al.,「Efficient integration of artificial transposons into plasmid targets in vitro:a useful tool for DNA mapping,sequencing and genetic analysis」,Nucleic Acids Res.22(18):3765-3772(1994)及び国際特許出願第95/23875号);トランスポゾンTn7(Craig,「V(D)J recombination and transposition:Closer than expected」,Science 271(5255):1512(1996)及びCraig,Review in:Curr Top Microbiol Immunol,204:27-48(1996));TnIO及びISlO(Kleckner et al.,Curr Top Microbiol Immunol,204:49-82(1996));マリナートランスポザーゼ(Lampe et al.,「A purified mariner transposase is sufficient to mediate transposition in vitro」,EMBO J.15(19):5470-5479(1996));Tci(Plasterk,Curr Top Microbiol Immunol,204:125-143(1996)),P Element(Gloor,「Gene targeting in Drosophila」,Methods Mol Biol 260:97-114(2004));TnJ(Ichikawa et al.,「In vitro transposition of transposon Tn3」,J Biol Chem.265(31):18829-18832(1990));細菌挿入配列(Ohtsubo et al.,「Bacterial insertion sequences」,Curr.Top.Microbiol.Immunol.204:1-26(1996));レトロウイルス(Brown et al.,「Retroviral integration:Structure of the initial covalent product and its precursor,and a role for the viral IN protein」,Proc Natl Acad Sci USA,86:2525-2529(1989));及び酵母のレトロトランスポゾン(Boeke et al.,「Transcription and reverse transcription of retrotransposons」,Annu Rev Microbiol.43:403-434(1989)を参照されたい。
本明細書で使用される場合、「ヌクレアーゼ」という用語は、ポリヌクレオチドのヌクレオチドサブユニット間のホスホジエステル結合を切断することができる酵素を意味することが意図される。「エンドヌクレアーゼ」という用語は、ポリヌクレオチド鎖内のホスホジエステル結合を切断することができる酵素を指す。
本明細書で使用される場合、「ニッカーゼ」という用語は、DNA二重鎖の一本鎖のみを切断するエンドヌクレアーゼを指す。いくつかのCRISPR-Cas系は、二本鎖ポリヌクレオチドの一方の鎖のみを切断することができ、したがって、CRISPRニッカーゼ又はCas-gRNA RNPニッカーゼと称され得る。例えば、「Cas9ニッカーゼ」という用語は、典型的にはCas9タンパク質の1つのヌクレアーゼドメインを不活性化することによる、Cas9タンパク質に由来するニッカーゼを指す。CRISPRニッカーゼの非限定的な例としては、第1の突然変異D10A及び第2の突然変異H840Aを有するS.PyogenesのCas9が挙げられる。
ポリペプチドの文脈において、本明細書で使用される「バリアント」及び「誘導体」という用語は、アミノ酸残基の置換、欠失又は付加の導入によって改変されたポリペプチド又はポリペプチドの断片のアミノ酸配列を含むポリペプチドを指す。ポリペプチドのバリアント又は誘導体は、ポリヌクレオチドのアミノ酸配列の一部を含む融合タンパク質であり得る。本明細書で使用される「バリアント」又は「誘導体」という用語はまた、例えば、ポリペプチドへの任意の種類の分子の共有結合によって化学的に修飾されたポリペプチド又はその断片を指す。例えば、限定するものではないが、ポリペプチド又はポリペプチドの断片は、例えば、グリコシル化、アセチル化、ペグ化、リン酸化、アミド化、既知の保護基/ブロッキング基による誘導体化、タンパク質分解切断、細胞リガンド又は他のタンパク質への結合などによって化学的に修飾することができる。バリアント又は誘導体は、天然に存在する又は出発ペプチド若しくはポリペプチドとは異なる方法で、結合した分子の種類又は位置のいずれかで修飾される。バリアント又は誘導体は、ペプチド又はポリペプチド上に天然に存在する1つ以上の化学基の欠失を更に含む。ポリペプチド若しくはポリペプチドの断片のバリアント又は誘導体は、限定するものではないが、特異的な化学的切断、アセチル化、製剤化、ツニカマイシンの代謝合成などを含む、当業者に公知の技術を使用した化学修飾によって化学的に修飾することができる。更に、ポリペプチド若しくはポリペプチドの断片のバリアント又は誘導体は、1つ以上の非古典的アミノ酸を含み得る。ポリペプチドバリアント又は誘導体は、本明細書に記載されているポリペプチド又はポリペプチドの断片と類似又は同一の機能を有し得る。ポリペプチドバリアント又は誘導体は、本明細書に記載されているポリペプチド又はポリペプチドの断片と比較し、追加の又は異なる機能を有し得る。
本明細書で使用される場合、「配列決定」という用語は、ポリヌクレオチドの配列を決定することを意味することが意図される。配列決定は、合成による配列決定、ブリッジPCR、連鎖停止配列決定、ハイブリダイゼーションによる配列決定、ナノポア配列決定、及びライゲーションによる配列決定のうちの1つ以上を含み得る。
本明細書で使用される場合、「脱宿主化(dehosting)」という用語は、別の種のポリヌクレオチドに対する、ある種のポリヌクレオチドの選択的な不活性化又は分解を意味することが意図される。例えば、哺乳動物(例えば、ヒト)などの第1の種は、細菌、真菌、及びウイルスなどの多数の他の種に対する宿主として作用し得る。1つ以上の他の種のポリヌクレオチドが増幅及び配列決定され得るように、第1の種のポリヌクレオチドを選択的に不活性化又は分解することが望ましい場合がある。
標的に対して「選択的」であることは、その標的に結合し、かつ異なる標的に結合しないことを意味することが意図される。例えば、種特異的反復要素に対して選択的なCas-gRNA RNPは、その種特異的反復要素に結合してもよく、異なる種特異的反復要素に結合しなくてもよい。
本明細書で使用される場合、「種特異的反復要素」という用語は、所定の種のポリヌクレオチド内に存在し、別の種のポリヌクレオチド中には存在し得ない反復配列を意味することが意図される。複数の染色体を有する種(例えば、哺乳動物、例えば、ヒト)は、各染色体上に異なる種特異的要素を含み得るか、又は各染色体上に同じ種特異的要素、若しくは各染色体上に同じ種特異的要素及び異なる種特異的要素の混合物を含み得る。種特異的反復要素の一例は、フォトスペーサー隣接モチーフ又はPAM配列(例えば、NGG)である。Cas-gRNA RNPのgRNAは、種特異的反復要素にハイブリダイズする配列を有し得る。
本明細書で使用される場合、「固有の分子識別子」及び「UMI」という用語は、ポリヌクレオチドにカップリングされ得、それを介してポリヌクレオチドが同定され得るオリゴヌクレオチドを意味することが意図される。例えば、異なるUMIのセットを複数の異なるポリヌクレオチドに結合させてもよく、それらのポリヌクレオチドの各々を、そのポリヌクレオチドにカップリングされた特定のUMIを使用して同定してもよい。
本明細書で使用される場合、種の「全ゲノム」又は「WG」という用語は、その種の細胞プロセスによって使用されるポリヌクレオチドの大部分を一緒に提供する1つ以上のポリヌクレオチドのセットを意味することが意図される。種の全ゲノムは、種の染色体DNA及び/又はミトコンドリアDNAの任意の適切な組み合わせを含み得、植物種の場合、葉緑体に含まれるDNAを含み得る。1つ以上のポリヌクレオチドのセットは、一緒になって、その種の細胞プロセスによって使用されるポリヌクレオチドの少なくとも約50%、又は少なくとも約60%、又は少なくとも約70%、又は少なくとも約80%、又は少なくとも約90%、又は少なくとも約95%、又は少なくとも約98%、又は少なくとも約99%を提供し得る。
本明細書で使用される場合、「断片」という用語は、ポリヌクレオチドの一部を意味することが意図される。例えば、ポリヌクレオチドは、総塩基数の長さであってもよく、そのポリヌクレオチドの断片は、総塩基数の長さより短くてもよい。
本明細書で使用される場合、「サンプル」という用語は、1つ以上のポリヌクレオチドを含む流体の容量を意味することが意図される。サンプル内のポリヌクレオチドは、全ゲノムを含み得、又は全ゲノムの一部のみを含み得る。サンプルは、単一種又は複数の種に由来するポリヌクレオチドを含み得る。
本明細書で使用される「抗体」という用語は、標的抗原部位及びその目的のアイソフォームに結合する所望の生物学的活性を示す限り、モノクローナル抗体(完全長モノクローナル抗体を含む)、ポリクローナル抗体、多重特異性抗体(例えば、二重特異性抗体)、及び抗体断片を包含する。「抗体断片」という用語は、全長抗体の一部、一般にはその抗原結合領域又は可変領域を含む。本明細書で使用される「抗体」という用語は、ヒト抗体、ラット抗体、マウス抗体、ウサギ抗体などを含むがこれらに限定されない、任意の種及び資源に由来する任意の抗体を包含し、合成的に作製され得るか、又は天然に存在し得る。
本明細書で使用される「モノクローナル抗体」という用語は、実質的に均一な抗体の集団から得られる抗体を指す。すなわち、集団を含む個々の抗体は、少量で存在し得る可能な天然に存在する変異を除いて同一である。モノクローナル抗体は高度に特異的であり、単一の抗原部位に対して向けられている。更に、異なる決定基(エピトープ)に対する異なる抗体を典型的には含む従来の(ポリクローナル)抗体調製物とは対照的に、各モノクローナル抗体は、抗原上の単一の決定基に対するものである。「モノクローナル抗体」はまた、当該技術分野で公知の技術を使用してファージ抗体ライブラリーから単離され得る。モノクローナル抗体は、この用語が本明細書で使用される場合、重鎖及び/又は軽鎖の一部が、特定の種に由来する抗体又は特定の抗体クラス若しくはサブクラスに属する抗体の対応する配列と同一又は相同であり、鎖の残りの部分が、別の種に由来する抗体又は別の抗体クラス若しくはサブクラスに属する抗体の対応する配列と同一まあ葉相同である「キメラ」抗体(免疫グロブリン)、並びにかかる抗体の断片を含み得るが、それらが所望の生物学的活性を示す限りにおいてである。
本明細書で使用される場合、「標的特異的」及び「選択的」などの用語は、ガイドRNA又は他のポリヌクレオチドに関して使用される場合、別のポリヌクレオチド中の配列に特異的である(実質的に相補的であり、ハイブリダイズし得る)配列を含むポリヌクレオチドを意味することが意図される。
本明細書で使用される場合、「相補的」及び「実質的に相補的」という用語は、ポリヌクレオチドに関して使用される場合、そのポリヌクレオチドが、特定の条件下で別のポリヌクレオチド中の配列に選択的にハイブリダイズすることができる配列を含むことを意味することが意図される。
本明細書で使用される場合、「増幅」及び「増幅する」などの用語は、ポリヌクレオチドのアンプリコンを生成するための任意の適切な増幅方法の使用を指す。ポリメラーゼ連鎖反応(PCR)は、1つの非限定的な増幅方法である。当該技術分野で公知の他の適切な増幅方法としては、限定されないが、ローリングサークル増幅;riboprimer増幅(例えば、米国特許第7,413,857号明細書に記載されている);ICAN;UCAN;ribospia;末端タグ付け;(例えば、米国特許出願公開第2005/0153333号明細書に記載されている)及びEberwine型aRNA増幅又は鎖置換増幅が挙げられる。増幅方法の更なる非限定的な例は、国際公開第02/16639号;国際公開第00/56877号;オーストラリア国特許出願公開第00/29742号明細書;米国特許第5,523,204号明細書;米国特許第5,536,649号明細書;米国特許第5,624,825号明細書;米国特許第5,631,147号明細書;米国特許第5,648,211号明細書;米国特許第5,733,752号明細書;米国特許第5,744,311号明細書;米国特許第5,756,702号明細書;米国特許第5,916,779号明細書;米国特許第6,238,868号明細書;米国特許第6,309,833号明細書;米国特許第6,326,173号明細書;米国特許第5,849,547号明細書;米国特許第5,874,260号明細書;米国特許第6,218,151号明細書;米国特許第5,786,183号明細書;米国特許第6,087,133号明細書;米国特許第6,214,587号明細書;米国特許第6,063,604号明細書;米国特許第6,251,639号明細書;米国特許第6,410,278号明細書;国際公開第00/28082号;米国特許第5,591,609号明細書;米国特許第5,614,389号明細書;米国特許第5,773,733号明細書;米国特許第5,834,202号明細書;米国特許第6,448,017号明細書;米国特許第6,124,120号明細書;及び米国特許第6,280,949号明細書に記載されている。
「ポリメラーゼ連鎖反応」及び「PCR」という用語は、本明細書で使用される場合、少量のポリヌクレオチド、例えば、RNA及び/又はDNAが増幅される手順を指す。一般に、増幅プライマーは、PCR中に使用するためにポリヌクレオチドにカップリングされる。例えば、それらの各々の全内容が参照により本明細書に組み込まれる、以下の参考文献を参照されたい:Mullisの米国特許第4,683,195号明細書;Mullis et al.,Cold Spring Harbor Symp.Quant.Biol.,51:263(1987);及びErlich,ed.,PCR Technology,(Stockton Press,NY,1989)。当業者に知られているように、PCRを行うために多種多様な酵素及びキットが利用可能である。例えば、いくつかの例では、PCR増幅は、製造業者によって記載されるように、EPICENTRE Biotechnologies(ウィスコンシン州マディソン)からのFAILSAFE(商標)PCR System又はMASTERAMP(商標)Extra-Long PCR Systemのいずれかを使用して実行される。
本明細書で使用される場合、「ライゲーション」及び「ライゲーションする」などの用語は、2つ以上のポリヌクレオチドの末端間に共有結合又は連結を形成することを意味することが意図される。結合又は連鎖の性質は大きく異なり得、ライゲーションは酵素的又は化学的に実行され得る。ライゲーションは通常、酵素的に行われ得、あるオリゴヌクレオチドの5’炭素末端ヌクレオチドと別のヌクレオチドの3’炭素との間にホスホジエステル結合を形成する。鋳型駆動ライゲーション反応は、以下の参考文献に記載されており、それらの各々の全内容は参照により本明細書に組み込まれる:米国特許第4,883,750号明細書;米国特許第5,476,930号明細書;米国特許第5,593,826号明細書;及び米国特許第5,871,921号明細書。ライゲーションはまた、ホスホジエステル結合の非酵素的形成、又はホスホロチオエート結合、ジスルフィド結合などのポリヌクレオチドの末端間の非ホスホジエステル共有結合の形成を用いて行われてもよい。
本明細書で使用される場合、用語「基材」とは、本明細書に記載されている構成物のための支持体として使用される材料を指す。例となる基材材料は、ガラス、シリカ、プラスチック、石英、金属、金属酸化物、オルガノ-シリケート(例えば、多面体有機シルセスキオキサン(polyhedral organic silsesquioxanes、POSS))、ポリアクリレート、酸化タンタル、相補型金属酸化膜半導体(complementary metal oxide semiconductor、CMOS)、又はそれらの組み合わせを含むことができる。POSSの一例は、Kehagias et al.,Microelectronic Engineering 86(2009),pp.776-778に記載されているものであり得、これは、参照によりその全体が本明細書に組み込まれる。いくつかの例では、本出願に使用される基材は、ガラス、溶融シリカ、又は他のシリカ含有材料などのシリカベースの基材を含む。いくつかの例では、シリカ系基材は、ケイ素、二酸化ケイ素、窒化ケイ素、又は水素化シリコーンを含むことができる。いくつかの例では、本出願において使用される基材は、ポリエチレン、ポリスチレン、ポリ(塩化ビニル)、ポリプロピレン、ナイロン、ポリエステル、ポリカーボネート、及びポリ(メタクリル酸メチル)などのブラスチック材料又は構成要素を含む。プラスチック材料の例は、ポリ(メタクリル酸メチル)、ポリスチレン、及び環式オレフィンポリマー基材を含む。いくつかの例では、基材は、シリカベースの材料若しくはプラスチック材料、又はそれらの組み合わせであるか、又はそれらを含む。特定の例では、基材は、ガラス又はケイ素系ポリマーを含む少なくとも1つの表面を有する。一部の例では、基材は、金属を含むことができる。一部のこのような例では、金属は金である。いくつかの例では、基材は、金属酸化物を含む少なくとも1つの表面を有する。一例では、表面は、酸化タンタル又は酸化スズを含む。アクリルアミド、エノン、又はアクリレートもまた、基材材料又は構成要素として利用することができる。他の基材材料は、限定するものではないが、ヒ化ガリウム、リン化インジウム、アルミニウム、セラミック、ポリイミド、石英、樹脂、ポリマー及びコポリマーを含むことができる。一部の例では、基材及び/又は基材表面は、石英であり得るか、又は石英を含むことができる。一部の他の例では、基材及び/又は基材表面は、GaAs又はITOなどの半導体であり得るか、又は当該半導体を含むことができる。上述のリストは、本出願を例示することが意図されているが、本出願を限定するものではない。基材は、単一の材料又は複数の異なる材料を含むことができる。基材は、複合体又は積層体とすることができる。いくつかの例では、基材は、有機シリケート材料を含む。
基材は、水平、円形、球形、ロッド形状、又は任意の他の好適な形状とすることができる。基材は、剛性であってもよく、又は可撓性であってもよい。いくつかの例では、基材は、ビーズ又はフローセルである。
基材は、基材の1つ以上の表面上にパターンを有していなくてもよく、テクスチャード加工を有していてもよく、又はパターンを有していてもよい。一部の例では、基材は、パターン形成されている。そのようなパターンは、ポスト、パッド、ウェル、隆起、チャネル、又は他の三次元凹状若しくは凸構造を含み得る。パターンは、基材の表面全体にわたって規則的であってもよく、又は不規則的であってもよい。パターンは、例えば、ナノインプリントリソグラフィーによって、又は例えば、非金属製表面に特徴部を形成する金属パッドの使用によって形成することができる。
いくつかの例では、本明細書に記載されている基材は、フローセルの少なくとも一部を形成するか、又はフローセル内に位置するか、又はフローセルに結合されている。フローセルは、複数のレーン又は複数のセクターに分割されているフローチャンバを含んでもよい。本明細書において説明されている方法及び組成物に使用することができるフローセルの例、並びにフローセルを製造するための基材例は、限定するものではないが、Illumina、Inc.(San Diego,CA)から市販されているものを含む。
Cas-gRNA RNP媒介性脱宿主化のための組成物及び方法
本明細書におけるいくつかの例は、Cas-gRNA RNP媒介脱宿主化に関する。例えば、図1A~図1Kは、Cas-gRNA RNP媒介性脱宿主化のための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
より複雑な種、例示的には哺乳動物は、細菌、真菌、及びウイルスなどの複数の他のより単純な種を宿主とすることができる。宿主となる種のポリヌクレオチド(DNAなど)を配列決定することが望ましい場合があるが、そのようなポリヌクレオチドを宿主種のポリヌクレオチドから十分に分離することは困難であり得る。例えば、宿主由来の流体又は組織から精製されたポリヌクレオチドのサンプルは、主に、宿主由来のポリヌクレオチド(例えば、約99%以上)、及び他の種に由来する比較的少量のポリヌクレオチド(例えば、約1%以下)を含み得る。したがって、そのサンプルの配列決定は主に宿主の配列を生じ得、他の種の配列に関する情報は比較的少ない。本明細書で提供されるように、所与の種(宿主など)のポリヌクレオチドは、そのサンプル内の1つ以上の他の種のポリヌクレオチドを配列決定する能力を増強するような方法でサンプルから除去され得る。
例えば、図1Aに示されるように、第1の種から得られたサンプルは、第1の種に由来する第1の二本鎖ポリヌクレオチドと、1つ以上の第2の種に由来する第2の二本鎖ポリヌクレオチドとの混合物を含み得る。例示的に、第1の種(S1)は、細菌、真菌、及びウイルス(S2、S3など)などの多数の他の種に対する宿主として作用し得る哺乳動物(例えば、ヒト)であり得る。図1Aに示される非限定的な例では、組成物101は、第1の種に由来するポリヌクレオチドS1-1、S1-2、S1-3の混合物;第2の種に由来するポリヌクレオチドS2-1;及び第3の種に由来するポリヌクレオチドS3-1を含む。第1の種に由来する第1の種に由来するポリヌクレオチドS1-1、S1-2、S1-3の各々は、図1Aに示されるような種特異的反復要素140を含み得る。例えば、第1の種が哺乳動物である場合、その種に由来するポリヌクレオチドは、哺乳動物特異的反復要素を含み得る。例えば、第1の種がヒトである場合、そのヒト由来のポリヌクレオチドの各々は、1つ以上のヒト特異的反復要素140を含み得る。
各所定の種に由来するポリヌクレオチドの濃度、数、及び種類は、各特定のサンプルについて変化し得ることが理解されるであろう。例えば、第1の種が第2及び第3の種に対する宿主である場合、サンプルは、第2及び第3の種よりも有意に高い濃度の第1の種に由来するポリヌクレオチドを含有し得る。更に、第1の種は、より大きな遺伝的複雑性を有し得、例えば、ヒトの23本の比較的長い染色体S1-1、S1-2、S1-3・・・S1-23などの複数のポリヌクレオチドを有するゲノムを含み得、一方、第2及び/又は第3の種は、遺伝的により単純であり得、例えば、単一の比較的短いポリヌクレオチドのみを有するゲノムを含み得る。更に、混合物中の1つ以上の種のポリヌクレオチドは、それらの種が生理学的プロセス中にインビボで通常使用するよりも短い断片にエクスビボで断片化され得る。更に、混合物中の1つ以上の種のポリヌクレオチドは、環状(S3-1など)であり得、したがって、いかなる末端も有し得ない。
図1Aに示されるように、混合物中の各ポリヌクレオチドは二本鎖であり得る。例えば、ポリヌクレオチドS1-1は、第1の鎖111及び相補的な第2の鎖111’を含み得る;ポリヌクレオチドS1-2は、第1の鎖112及び相補的な第2の鎖112’を含み得る;ポリヌクレオチドS1-3は、第1の鎖113及び相補的な第2の鎖113’を含み得る;ポリヌクレオチドS2-1は、第1の鎖121及び相補的な第2の鎖121’を含み得る;ポリヌクレオチドS3-1は、第1の鎖131及び相補的な第2の鎖131’を含み得る。いくつかの例では、第1、第2、及び/又は第3の種に由来する二本鎖ポリヌクレオチドは、二本鎖DNAを含み得る。
第1の二本鎖ポリヌクレオチドの末端、及び存在する場合、第2の二本鎖ポリヌクレオチドの末端は、保護され得る。例えば、図1Bに示されるように、組成物102は、混合物中の二本鎖ポリヌクレオチドの任意の末端を保護する保護要素150を含む。例示的に、保護要素150は、第1の種のポリヌクレオチドS1-1、S1-2及びS1-3の末端、並びに第2の種のポリヌクレオチドS2-1の末端にカップリングされ、それらを保護する。第3の種のポリヌクレオチドS3-1は環状であるので、かかるポリヌクレオチドは、保護要素150がカップリングされ得る末端を有していなくてもよい。保護要素150は、かかる保護要素がカップリングしている二本鎖ポリヌクレオチドの末端に対する1つ以上の酵素(エキソヌクレアーゼなど)の作用を阻害する任意の適切な化学部分を含み得る。例えば、図1Bの挿入図に示されるように、保護要素150は、修飾塩基151、末端にライゲーションされたヘアピンアダプター152、又は5’脱リン酸化末端を含み得る。修飾塩基151は、例えば、ホスホロチオエート結合又は3’ホスフェートを含み得る、ターミナルトランスフェラーゼを用いて付加され得る。ヘアピンアダプター152は、互いにハイブリダイズするステム配列と、ステム配列間に伸長するループ配列とを含むオリゴヌクレオチドを含み得、例えば、末端修復を行って任意のオーバーハングを埋め、次いでAオーバーハング(「Aテール」)を付加し(例えば、Klenow Fragment exo-などのエキソヌクレアーゼを使用して)、次いでヘアピンアダプター152を末端にライゲーションするなど、当該技術分野で公知の方法で付加され得る。二本鎖ポリヌクレオチドの5’末端は、適切なホスファターゼ酵素を使用して脱リン酸化され得る。
第1及び第2の二本鎖ポリヌクレオチドの末端を保護した後、第1の二本鎖ポリヌクレオチド中の自由末端を選択的に生成することができる。例えば、図1Cは、Cas-gRNA RNP 160が、第1の二本鎖ポリヌクレオチド内に存在し、かつ第2の二本鎖ポリヌクレオチド内に存在しない配列、例えば、種特異的反復要素140にハイブリダイズしている組成物103を示す。次いで、配列をCas-gRNA RNPで切断して、図1Dに示すような方法で、自由末端を生成することができ、これには、自由末端141、141’がポリヌクレオチドS1-1の鎖に生成され、自由末端143、142’がポリヌクレオチドS1-2の鎖に生成され、自由末端142、143’がポリヌクレオチドS1-3の鎖に生成されるが、それらのポリヌクレオチドはCas-gRNA RNP 160が選択的にハイブリダイズする種特異的反復要素150を含まないため、ポリヌクレオチドS2-1及びS3-1では自由末端が生成されない組成物104が含まれる。Casは、例えばCas9を含み得る。
次いで、第1の二本鎖ポリヌクレオチドは、Cas-gRNA RNP 160によって生成された自由末端から保護末端に向かって分解され得る。例えば、図1Eに例示される組成物105は、第1の二本鎖ポリヌクレオチドS1-1、S1-2、S1-3を分解するためのエキソヌクレアーゼ170を含む。任意の適切なエキソヌクレアーゼ170を使用することができる。例示的に、自由末端は、図1Eの挿入図の上部に示されるような方法で3’末端を含み得、第1の二本鎖ポリヌクレオチドS1-1、S1-2、S1-3は、エキソヌクレアーゼIIIを使用して分解され得る。別の純粋に例示的な例として、自由末端は、図1Eの挿入図の下部に示されるような方法で5’末端を含み得、第1の二本鎖ポリヌクレオチドS1-1、S1-2、S1-3の各々の1本の鎖は、ラムダエキソヌクレアーゼを使用して分解され得る。使用される保護要素150の特定のタイプに依存して、エキソヌクレアーゼの使用は、ポリヌクレオチドS1-1、S1-2、S1-3の各々の両方の鎖が分解される図1Fに例示される組成物106、又はポリヌクレオチドS1-1、S1-2、S1-3が一本鎖にされる図1Gに例示される組成物107を生じ得る。例示的に、保護要素150がヘアピンオリゴヌクレオチドを含む場合、一方の鎖を分解した後、エキソヌクレアーゼがヘアピンに続いて他方の鎖を分解し、両方の鎖の分解をもたらすことができる。別の例として、保護要素150が修飾塩基又は5’脱リン酸化塩基を含む場合、エキソヌクレアーゼが一方の鎖を分解した後、保護要素は、エキソヌクレアーゼが他方の鎖を分解することを阻害し得る。使用される特定のエキソヌクレアーゼ、及び第1の種のポリヌクレオチドが完全に分解されるか又は一本鎖にされるかにかかわらず、ポリヌクレオチドS2-1及びS3-1は、ポリヌクレオチドS2-1の末端が保護要素150によって保護され、ポリヌクレオチド3 S3-1は末端を欠くので、そのエキソヌクレアーゼによって分解され得ない。
第1の種のポリヌクレオチドの分解後、増幅アダプターを混合物中の任意の残りの二本鎖ポリヌクレオチドの末端にライゲーションすることができる。例えば、図1Hは、ポリヌクレオチドS1-1、S1-2、及びS1-3が分解され(例えば、両方の鎖が図1Fに示されるように分解されるか、又はポリヌクレオチドが図1G及び1Hに示されるように一本鎖にされる)、保護基150が混合物中の任意の残りの二本鎖ポリヌクレオチド、例えばポリヌクレオチドS2-1から除去される組成物108を示す。第1の種のポリヌクレオチドの任意の残りの部分にカップリングした任意の残りの保護基150も同様に除去され得る。図1Iに図示されるように、任意の環状ポリヌクレオチド(例えば、第3の種のS3-1)は、例えば、タグメンテーション、せん断、又は混合物中の任意の残りの二本鎖ポリヌクレオチド(例えば、S2-1)を断片化することができる他の適切な断片化技術を使用して開かれ得る。次いで、増幅アダプターは、残りの二本鎖ポリヌクレオチド、例えば、第2の種及び第3の種のものにライゲーションされ得るか、又は残りの二本鎖ポリヌクレオチドをタグ化して、図1Jに示される組成物109を得ることができる。組成物109は、第1の種から、実質的に一本鎖ポリヌクレオチドS1-1、S1-2、S1-3のみ;第2及び/又は第3の種から、実質的に二本鎖ポリヌクレオチドS1-2、S1-3のみ;及び第2の二本鎖ポリヌクレオチドS2-1、S3-1の断片の末端にライゲーションされ、かつ第1の二本鎖ポリヌクレオチドS1-1、S1-2、S1-3のいずれの末端にも実質的にライゲーションされていない増幅アダプター180を含む。第1の種のポリヌクレオチドが、図1Fを参照して説明されるような方法で完全に分解される場合、組成物109は、代わりに、第1の種に由来する任意のポリヌクレオチドを含まなくてもよいことが理解されるであろう。図1Jに示されるような方法では、増幅アダプター180は、Y字型であってもよく、それらの各々の全内容が参照により本明細書に組み込まれる、以下の参考文献に記載されているような固有の分子識別子(UMI)を含み得る:Kennedy et al.,「Detecting ultralow-frequency mutations by Duplex Sequencing」,Nat Protoc.9:2586-2606(2014);及びKivioja et al.,「Counting absolute numbers of molecules using unique molecular identifiers」,Nature Methods 9:72-42(2012)。その後、二本鎖ポリヌクレオチドS2-1及びS3-1は、実質的に第1の種に由来するポリヌクレオチドのいずれも配列決定することなく、増幅され(例えば、PCRを使用して)、配列決定され得る。したがって、ポリヌクレオチドS2-1及びS3-1の配列は、第2及び第3の種を宿主とし得る第1の種からのバックグラウンドシグナルが比較的低いか又は実質的にない状態で得ることができる。
第1の種のポリヌクレオチドS1-1、S1-2、及びS1-3は、これらのポリヌクレオチドを増幅及び配列決定に利用できないようにするために、必ずしも完全に分解される必要はないことに留意されたい。例えば、増幅アダプター180は、任意の二本鎖ポリヌクレオチドに選択的にライゲーションされ、任意の一本鎖ポリヌクレオチドに実質的にライゲーションされないように構成され得る。したがって、増幅アダプターがライゲーションされた混合物中の任意の二本鎖ポリヌクレオチドを増幅し、次いで配列決定することができるが、任意の一本鎖ポリヌクレオチドは、適切な増幅アダプターを欠くために増幅することができない。例示的に、タグメンテーションは、dsDNAにのみアダプターを付加してもよく、ssDNAにアダプターを付加しなくてもよい。別の例として、T4 DNAリガーゼは、dsDNAのみに作用し得る。これに関して、増幅アダプター180は、そのようなアプローチのいずれにおいても平滑末端又はAテールであり得ることに留意されたい。
図1Kは、第1の種に由来する第1の二本鎖ポリヌクレオチドと第2の種に由来する第2の二本鎖ポリヌクレオチドとの混合物を処理するための方法における操作の例示的なフローを示す。図1Kに例示される方法1000は、混合物中に、第1の二本鎖ポリヌクレオチドの末端及び第2の二本鎖ポリヌクレオチドの任意の末端を保護すること(操作1001)を含み得る。例えば、図1Bを参照して説明されるような方法で、保護要素150は、第1の二本鎖ポリヌクレオチドS1-1、S1-2及びS1-3並びに第2の二本鎖ポリヌクレオチドS2-1の末端に付加され得るが、二本鎖ポリヌクレオチドS3-1は末端を欠いており、したがって、保護要素150にカップリングされ得ない。
図1Kに示される方法1000はまた、第1及び第2の二本鎖ポリヌクレオチドの末端を保護した後に、第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成すること(操作1002)を含み得る。例えば、図1Cを参照して説明されるような方法で、Cas-gRNA RNP 160は、第1の種のポリヌクレオチドS1-1、S1-2、及びS1-3内にあり、かつ第2の種のポリヌクレオチドS2-1(又は第3の種のポリヌクレオチドS3-1)内にない配列、例えば種特異的反復要素と選択的にハイブリダイズされ得る。Cas-gRNA RNP 160は、第1の種のポリヌクレオチドS1-1、S1-2、及びS1-3を切断して、図1Dを参照して説明されるような自由末端を生成し得る。図1Kに例示される方法1000はまた、第1の二本鎖ポリヌクレオチドを自由末端から保護末端に向かって分解すること(操作1003)を含み得る。例えば、図1E~1Gを参照して説明されるような方法で、エキソヌクレアーゼは、それぞれの自由末端141、141’、142、142’、及び143、143’から第1の種のポリヌクレオチドS1-1、S1-2、及びS1-3を分解するために使用され得る。続いて、増幅アダプターは、図1I~1Jを参照して説明されるような方法で、第2の種のポリヌクレオチドS2-1にカップリングされ得(任意選択的に、増幅アダプターを添加する前に断片化を含む)、次いで、ポリヌクレオチドが増幅され、配列決定される。
したがって、本明細書で提供されるように、Cas-gRNA RNPは、所望の種のポリヌクレオチドにおいて自由末端を選択的に生成するために使用され得、これらのポリヌクレオチドは、その後、増幅及び配列決定され得る1つ以上の他の種のポリヌクレオチドのために、増幅又は配列決定のために実質的に利用不可能にするような方法で分解される。
異なる定義された断片サイズへの全ゲノム(WG)の断片化
本明細書におけるいくつかの例は、全ゲノム(WG)の異なる定義された断片サイズへの断片化に関する。例えば、図2A~図2Kは、WGを異なる定義された断片サイズにの断片化するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。
種に応じて、その種のWGは、明確な数の染色体を含む。各ヒト染色体の一般的な配列は、十分に特徴付けられているが、各個体の染色体の配列は、その個体に特異的な遺伝的変異を含む。更に、例えば、個体が、その個体の正常組織とは異なる遺伝的変異を有する腫瘍を有する場合、1つ以上の染色体の配列は、個体内でさえ変動し得る場合がある;腫瘍は、異なる位置で異なる遺伝的変異さえ有し得る。これら及び他のタイプの遺伝的変異により、WG配列決定を行うことが望ましい。典型的には、WG配列決定は、血液又は他の流体又は組織のアリコートを個体から取得し、そのアリコート内のDNAを精製し、次いで、そのDNAを、配列決定されるのに適したサイズのより小さな断片に断片化することによって開始する。DNAを配列決定するために使用される特定の機器に依存して、特定のサイズ範囲(例えば、約100~約1000塩基対)の断片のみが適切に配列決定され得る。しかしながら、超音波処理又は酵素的断片化などの機械的プロセスを使用してDNAを断片化するこれまでに公知の方法は、異なる断片サイズの比較的広い分布を生じる。その分布内の断片のごく一部(例えば、約20%)のみが、配列決定に適切な範囲のサイズを有してもよく、WGの残りの部分(例えば、約80%)は廃棄されてもよい。本明細書で提供されるように、WG-又は任意の他の適切なポリヌクレオチド又はポリヌクレオチドの集合-は、任意の所望の数の異なる断片サイズに断片化され得、その断片サイズの各々は比較的良好に制御され得る。
例えば、図2Aに示されるように、所与の種の染色体の一部又は更には全部を含むWGの第1の精製サンプル201を得ることができる。図2Aに示される非限定的な例では、サンプル201は、ヒトのWGを含み、したがって、23本のDNA染色体C1、C2、...C23を含む。本明細書で提供されるように処理され得る所与のサンプルは、任意の適切な数の任意の適切なタイプのポリヌクレオチドを含み得ることが理解されるであろう。サンプル201内の染色体C1、C2、...C23は、それらの長さに沿って異なる配列210、220を含み、これらの配列の異なる部分は、おおよそ均一なサイズの断片を形成するように、おおよそ均一に離間した位置で染色体を切断するために使用されるCas-gRNA RNPのための所定の標的として使用され得る。例示的に、第1の配列210は、おおよそ第1の塩基対数だけ互いに離間されてもよく、第2の配列220は、おおよそ第2の塩基対数だけ互いに離間されてもよい。配列210は、各個々の位置で同じ特定の配列を含む必要はなく、同様に、配列220は、各個々の位置で同じ特定の配列を含む必要はないことに留意されたい。代わりに、配列210は、Cas-gRNA RNPの第1のセットのための所定の標的として使用される異なる染色体内の選択された位置の第1のセットを表し、そのRNPの各々は、配列210の特定の1つに標的化されてもよく、配列220は、Cas-gRNA RNPの第2のセットのための所定の標的として使用される異なる染色体内の選択された位置の第2のセットを表し、そのRNPの各々は、配列220の特定の1つに標的化されてもよい。
図2Bに示される組成物202は、第1の配列210にハイブリダイズしたCas-gRNA RNPの第1のセット251と、第2の配列220にハイブリダイズしたCas-gRNA RNP 252の第2のセット252とを含む。Cas-gRNA RNPの第1のセット251及び第2のセット252はそれぞれ、サンプル内の第1及び第2の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。CasはCas9を含み得る。Cas-gRNA RNPの第1のセット251及び第2のセット252は各々、任意の適切な数のCas-gRNA RNPを含み得る。第1のセット251のRNPの各所与の1つは、第1のセット又は第2のセット内の1つ以上の他のRNPと同じであってもよく、その場合、そのようなRNPは、互いに同じ特定の配列210又は220を標的としてもよく、又は第1のセット若しくは第2のセット内の複数の他のRNPと異なっていてもよく、その場合、そのRNPは、そのような他のRNPとは異なる特定の配列を標的としてもよい。同様に、第2のセット252のRNPの各所与の1つは、第1のセット又は第2のセット内の1つ以上の他のRNPと同じであってもよく、その場合、そのようなRNPは、互いに同じ特定の配列210又は220を標的としてもよく、又は第1のセット又は第2のセット内の複数の他のRNPと異なっていてもよく、その場合、そのRNPは、そのような他のRNPとは異なる特定の配列を標的としてもよい。
Cas-gRNA RNPの第1及び第2のセット251、252の各々におけるRNPの数は、適切には、所望のポリヌクレオチド(例えば、1本以上の二本鎖DNA染色体、又は二本鎖DNA染色体のセット全体)を断片化するように選択され得る。例示的に、Cas-gRNA RNPの第1のセット251は、少なくとも約50,000個の異なるCas-gRNA RNP、又は少なくとも約100,000個の異なるCas-gRNA RNP、又は少なくとも約1,000,000個の異なるCas-gRNA RNP、又は少なくとも約10,000,000個の異なるCas-gRNA RNP、又は少なくとも約20,000,000個の異なるCas-gRNA RNPを含み得る。例示的に、Cas-gRNA RNPの第2のセット252は、少なくとも約50,000個の異なるCas-gRNA RNP、又は少なくとも約100,000個の異なるCas-gRNA RNP、又は少なくとも約1,000,000個の異なるCas-gRNA RNP、又は少なくとも約10,000,000個の異なるCas-gRNA RNP、又は少なくとも約20,000,000個の異なるCas-gRNA RNPを含み得る。
図2Cに示される組成物203は、Cas-gRNA RNPの第1のセット251及び第2のセット252によるそのような切断部から生じ、各々がおおよそX塩基対を含む断片260のセットを含むか、又は本質的にそれからなる。したがって、第1のサンプル201中の実質的に全WG(又は任意の適切なポリヌクレオチド)は、規定されたサイズの断片260に断片化され得る。Cas-gRNA RNPの第1及び第2のセット251、252によってそれぞれ標的化される染色体C1、C2、...C23に沿った配列210、220の特定の位置は、任意の適切な長さの断片260を提供するように選択され得ることが理解されるであろう。この特定の例では、配列210が離間している第1の塩基対数は、配列210及び220が各染色体の長さに沿って実質的に交互になるように、配列220が離間している第2の塩基対数とおおよそ同じである。例示的に、第1の塩基対数は、約100~約2000(例えば、約500~約700)であり得、第2の塩基対数は、約100~約2000(例えば、約500~約700)であり得るか、又は第1の塩基対数は、約1000塩基対~約3000塩基対(例示的に、約2000塩基対)であり得、第1の塩基対数は、約1000塩基対~約3000塩基対(例示的に、約2000塩基対)であり得る。
配列210及び220は集合的に、適切に予め規定され、比較的等間隔の位置にあるので、断片260の各々における塩基対数は、比較的密な分布を有し得る。例えば、WG断片260中の塩基対数は、約20%未満、又は約10%未満、又は約5%未満、又は約2%未満、又は更に約1%未満だけ変動し得る。WG断片260の各々における塩基対数(X)は、例示的に、約100塩基対~約1000塩基対、例えば、約200塩基対~約400塩基対(例示的に、約300塩基対)であり得、又は約1000塩基対~約3000塩基対(例示的に、約2000塩基対)であり得る。
Cas-gRNA RNPの第1及び/又は第2のセットは、他の長さを有するWG断片を生成するために使用され得ることに留意されたい。実際に、所与のWGについて、互いに異なる規定された長さを有する断片を生成し、次いで、そのような異なる規定された長さの各々を使用して得られる配列を比較することが所望され得る。本明細書で提供されるように、異なる断片長はそれぞれ、WGの異なるサンプル(又は他のポリヌクレオチドの異なるサンプル)中で生成され得る。例えば、図2Dに示されるように、WGの第2の精製サンプル204を得ることができ、これは、図2Aに示されるサンプル201のように、おおよそ第1の塩基対数だけ互いに離間している第1の配列210、及びおおよそ第2の塩基対数だけ互いに離間している第2の配列220を有する23本のDNA染色体C1、C2、...C23を含む。図2Aに具体的に示されていないが、染色体C1、C2、...C23は、Cas-gRNA RNPの第1のセットのための所定の標的として使用され得る異なる染色体内の選択された位置の他のセットを表し得る他の配列を含み得る。例えば、図2Dに示される配列230は、Cas-gRNA RNPの第3のセットのための所定の標的として使用される異なる染色体内の選択された位置の第3のセットを表し、そのRNPの各々は、配列230のうちの特定のものに標的化され得る。
図2Eに示される組成物205は、第1の配列210にハイブリダイズしたCas-gRNA RNPの第1のセット251、及び第2の配列220にハイブリダイズしたCas-gRNA RNP 252の第2のセット252、並びに第3の配列230にハイブリダイズしたCas-gRNA RNPの第3のセット253を含む。図2Bを参照して説明されたものと同様の方法で、Cas-gRNA RNPの第1のセット251、第2のセット252、及び第3のセット253はそれぞれ、サンプル内の第1、第2、及び第3の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。CasはCas9を含み得る。図2Bを参照して説明されたものと同様の方法で、Cas-gRNA RNPの第1のセット251、第2のセット252、及び第3のセット253は各々、任意の適切な数のCas-gRNA RNPを含み得る。第1のセット251のRNPの各所与の1つは、第1のセット、第2のセット、又は第3のセット内の1つ以上の他のRNPと同じであってもよく、その場合、そのようなRNPは、互いに同じ特定の配列210、220、又は230を標的としてもよく、又は第1のセット、第2のセット、又は第3のセット内の複数の他のRNPと異なっていてもよく、その場合、そのRNPは、そのような他のRNPとは異なる特定の配列を標的としてもよい。同様に、第2のセット252のRNPの各所与の1つは、第1のセット、第2のセット、又は第3のセット内の1つ以上の他のRNPと同じであってもよく、その場合、そのようなRNPは、互いに同じ特定の配列210、220、又は230を標的としてもよく、又は第1のセット、第2のセット、又は第3のセット内の複数の他のRNPと異なっていてもよく、その場合、そのRNPは、そのような他のRNPとは異なる特定の配列を標的としてもよい。同様に、第3のセット253のRNPの各所与の1つは、第1のセット、第2のセット、又は第3のセット内の1つ以上の他のRNPと同じであってもよく、その場合、そのようなRNPは、互いに同じ特定の配列210、220、又は230を標的としてもよく、又は第1のセット、第2のセット、又は第3のセット内の複数の他のRNPと異なっていてもよく、その場合、そのRNPは、そのような他のRNPとは異なる特定の配列を標的としてもよい。
Cas-gRNA RNPの第1、第2、及び第3のセット251、252、253の各々におけるRNPの数は、適切には、所望のポリヌクレオチド(例えば、1本以上の二本鎖DNA染色体、又は二本鎖DNA染色体のセット全体)を断片化するように選択され得る。例示的に、Cas-gRNA RNPの第1のセット251は、少なくとも約50,000個の異なるCas-gRNA RNP、又は少なくとも約100,000個の異なるCas-gRNA RNP、又は少なくとも約1,000,000個の異なるCas-gRNA RNP、又は少なくとも約10,000,000個の異なるCas-gRNA RNP、又は少なくとも約20,000,000個の異なるCas-gRNA RNPを含み得る。例示的に、Cas-gRNA RNPの第2のセット252は、少なくとも約50,000個の異なるCas-gRNA RNP、又は少なくとも約100,000個の異なるCas-gRNA RNP、又は少なくとも約1,000,000個の異なるCas-gRNA RNP、又は少なくとも約10,000,000個の異なるCas-gRNA RNP、又は少なくとも約20,000,000個の異なるCas-gRNA RNPを含み得る。例示的に、Cas-gRNA RNPの第3のセット253は、少なくとも約50,000個の異なるCas-gRNA RNP、又は少なくとも約100,000個の異なるCas-gRNA RNP、又は少なくとも約1,000,000個の異なるCas-gRNA RNP、又は少なくとも約10,000,000個の異なるCas-gRNA RNP、又は少なくとも約20,000,000個の異なるCas-gRNA RNPを含み得る。
図2Fに示される組成物206は、Cas-gRNA RNPの第1のセット251、第2のセット252、及び第3のセット253によるそのような切断部から生じ、各々がおおよそY塩基対(X≠Y)を含む断片270のセットを含むか、又は本質的にそれからなる。したがって、第2のサンプル204中の実質的に全WG(又は任意の適切なポリヌクレオチド)は、規定されたサイズの断片270に断片化され得る。Cas-gRNA RNPの第1、第2、及び第3のセット251、252、253によってそれぞれ標的化される染色体C1、C2、...C23に沿った配列210、220、230の特定の位置は、任意の適切な長さの断片270を提供するように選択され得ることが理解されるであろう。この特定の例では、配列210が離間している第1の塩基対数は、図2A~図2Cを参照して説明されたものと同様の方法で、配列210及び220が各染色体の長さに沿って実質的に交互になるように、配列220が離間している第2の塩基対数とおおよそ同じである。しかしながら、配列230が離間している第3の塩基対数は、塩基対の第1及び/又は第2の数と異なっていてもよい。したがって、配列210及び220は、各染色体の長さに沿って実質的に交互であり得るが、配列230は、図2Eに示されるような方法で、配列210及び220のうちの異なるものの間に規則的に挿入され得る。例示的に、第1の塩基対数は、約100~約2000(例えば、約500~約700)であり得、第2の塩基対数は、約100~約2000(例えば、約500~約700)であり得、第3の塩基対数は、約100~約2000(例えば、約200~約400)であり得るか、又は第1の塩基対数は、約1000~約3000(例えば、約2000)であり得、第2の塩基対数は、約1000~約3000(例えば、約2000)であり得、第3の塩基対数塩基対数は、約500~約2000(例えば、約1000)であり得る。
配列210、220、230は集合的に、適切に予め規定され、比較的等間隔の位置にあるので、断片270の各々における塩基対数は、比較的密な分布を有し得る。例えば、WG断片270中の塩基対数は、約20%未満、又は約10%未満、又は約5%未満、又は約2%未満、又は更に約1%未満だけ変動し得る。WG断片270の各々における塩基対(Y)の数は、例示的に、約100塩基対~約1000塩基対、例えば、約100塩基対~約200塩基対(例えば、約150塩基対)であり得る。
サンプル201を使用して実行された処理をサンプル204を使用して実行された処理と比較すると、Cas-gRNA RNPの同じセットを使用して、互いに異なる長さを有するWG断片を生成し得ることが理解され得る。例えば、Cas-gRNA RNPの第1及び第2のセット251、252は、長さXを有する断片260を生成するために使用されてもよく、また、長さY(X≠Y)を有する断片270を生成するために(Cas-gRNA RNPの第3のセット253と組み合わせて)使用されてもよい。Cas-gRNA RNPの第1、第2、及び/又は第3のセットは、同様に、Cas-gRNA RNPの更に別の異なるセットを提供する必要なく、WGの他のサンプルのための更に他の規定された長さの断片を生成するために使用され得る。
例えば、図2Gに示されるように、WGの第3の精製サンプル207を得ることができ、これは、図2Aに示されるサンプル201、及び図2Dに示されるサンプル204のように、おおよそ第1の塩基対数だけ互いに離間している第1の配列210を有する23本のDNA染色体C1、C2、...C23を含む。図2Gに具体的に示されていないが、染色体C1、C2、...C23は、Cas-gRNA RNPの他のセットのための所定の標的として使用され得る異なる染色体内の選択された位置の他のセットを表し得る他の配列を含み得る。例えば、図2Aに示される配列220及び図2Dに示される配列230は、Cas-gRNA RNPの他のセットのための所定の標的として使用される異なる染色体内の選択された位置の他のセットを表す。図2Hに示される組成物208は、第1の配列210にハイブリダイズされたCas-gRNA RNPの第1のセット251を含む。図2Bを参照して説明されたものと同様の方法で、Cas-gRNA RNPの第1のセット251は、サンプル内の第1の配列210を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。CasはCas9を含み得る。図2Bを参照して説明されたものと同様の方法で、Cas-gRNA RNPの第1のセット251は各々、任意の適切な数のCas-gRNA RNPを含み得る。第1のセット251のRNPの各所与の1つは、第1のセット内の1つ以上の他のRNPと同じであってもよく、その場合、そのようなRNPは、互いに同じ特定の配列210を標的としてもよく、又は第1のセット内の複数の他のRNPと異なっていてもよく、その場合、そのRNPは、そのような他のRNPとは異なる特定の配列を標的としてもよい。Cas-gRNA RNPの第1のセット251中のRNPの数は、適切には、所望のポリヌクレオチド(例えば、1本以上の二本鎖DNA染色体、又は二本鎖DNA染色体のセット全体)を断片化するように選択され得る。例示的に、Cas-gRNA RNPの第1のセット251は、少なくとも約50,000個の異なるCas-gRNA RNP、又は少なくとも約100,000個の異なるCas-gRNA RNP、又は少なくとも約1,000,000個の異なるCas-gRNA RNP、又は少なくとも約10,000,000個の異なるCas-gRNA RNP、又は少なくとも約20,000,000個の異なるCas-gRNA RNPを含み得る。
図2Iに示される組成物209は、Cas-gRNA RNPの第1のセット251(図2Hに示される)によるそのような切断部から生じ、各々がおおよそZ個の塩基対(X≠Y≠Z)を含む断片280のセットを含むか、又は本質的にそれからなる。したがって、第3のサンプル207中の実質的に全WG(又は任意の適切なポリヌクレオチド)は、規定されたサイズの断片280に断片化され得る。Cas-gRNA RNPの第1のセット251によってそれぞれ標的化される染色体C1、C2、...C23に沿った配列210の特定の位置は、任意の適切な長さの断片280を提供するように選択され得ることが理解されるであろう。例示的に、第1の塩基対数は、約100~約2000(例えば、約500~約700、例えば、約600、又は約200~約400、例えば、約300)であり得、又は約1000塩基対~約3000塩基対、例えば、約2000であり得る。配列210は集合的に、適切に予め規定され、比較的等間隔の位置にあるので、断片280の各々における塩基対数は、比較的密な分布を有し得る。例えば、WG断片280中の塩基対数は、約20%未満、又は約10%未満、又は約5%未満、又は約2%未満、又は更に約1%未満だけ変動し得る。WG断片280の各々における塩基対(Z)の数は、例示的に、約100塩基対~約1000塩基対、例えば、約500~約700塩基対(例示的に、約600)、若しくは約200~約400塩基対(例示的に、約300)であり得、又は約1000塩基対~約3000塩基対、例えば、約2000であり得る。
第3のサンプル207と共にCas-gRNA RNPの第1のセット251を使用する代わりに、第2のセット252又は第3のセット253のいずれかを第1のセット251の代わりに使用して、代わりに他の長さを有する断片を提供し得る標的配列220又は230を標的化することができることが理解されるであろう。任意の適切な数のポリヌクレオチド(1つのポリヌクレオチドを含む)の任意の適切な数のサンプル(1つのサンプルを含む)が、Cas-gRNA RNPの任意の適切な数のセット(1つのセットを含む)を使用して調製され得ることも理解されるであろう。例えば、図2Jは、WGの断片を生成する方法における操作のフローを示す。図2Jに示される方法2000は、Cas-gRNA RNPのセットを、おおよそ塩基対数だけ互いに離間しているWGのサンプル内の配列にハイブリダイズさせること(操作2001)を含む。得られた組成物は、おおよそ塩基対数だけ互いに離間しているWGのサンプル内の配列にハイブリダイズしたCas-gRNA RNPのセットを含み得る。Cas-gRNA RNPのセットはそれぞれ、サンプル内の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものであり得る。例えば、図2Jに示される方法2000は、Cas-gRNA RNPのセットを用いて配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片のセットを生成すること(操作2002)を含み得る。配列間の塩基対数は、約100~約2000、例えば、約500~約700(例えば、約600)、又は約200~約400(例えば、約300)、又は約100~約200(例えば、約150)であり得、又は約1000塩基対~約3000塩基対、例えば、約2000であり得る。いくつかの例では、WG断片内の塩基対数は、約100~約2000、例えば、約100~約200(例えば、約150)、又は約200~約400(例えば、約300)、又は約500~約700(例えば、約600)であり得、又は約1000塩基対~約3000塩基対、例えば、約2000であり得る。WG断片のセットのWG断片内の塩基対数は、約20%未満変動し得る。
追加的又は代替的に、他のサンプルでは、Cas-gRNA RNPの1つ以上の他のセットを互いに組み合わせて使用して、WGの断片を生成してもよい。例えば、図2Kは、WGのサンプルにおいてWGの断片を生成する別の方法における操作のフローを示す。図2Kに示される方法2010は、Cas-gRNA RNPの第1のセットを、おおよそ第1の塩基対数だけ互いに離間しているWG内の第1の配列にハイブリダイズさせること(操作2011)を含み得る。図2Kに示される方法2010はまた、Cas-gRNA RNPの第2のセットを、おおよそ第2の塩基対数だけ互いに離間されたWG内の第2の配列にハイブリダイズさせること(操作2012)を含み得る。操作2011及び2012は、例えば、WGのサンプルをCas-gRNA RNPの第1及び第2のセットと接触させることによって、互いに同時に行われ得る。あるいはサンプルをCas-gRNA RNPの第1のセットと接触させ、続いてCas-gRNA RNPの第2のセットと接触させてもよく、又はその逆であってもよい。図2Kに示される方法2010はまた、第1のサンプル内のCas-gRNA RNPの第1及び第2のセットで第1及び第2の配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片の第1のセットを生成することを更に含み得る。第1及び第2の配列は、互いに同時に切断され得る。あるいは第1の配列を、Cas-gRNA RNPの第1のセットで切断し、続いてCas-gRNA RNPの第2のセットで切断してもよく、又はその逆であってもよい。図2Kは、例えば、図2D~図2Fを参照して説明されるような方法でCas-gRNA RNPの1つ以上の更なるセットを使用して更なる配列を切断するように適切に改変され得ることが理解されるであろう。
所与のサンプル内のポリヌクレオチドを切断するために使用されるCas-gRNA RNPのセットの特定の数にかかわらず、得られる断片が増幅され、配列決定され得ることが理解されるであろう。例えば、増幅アダプターは、図1Jを参照して説明されるのと同様の方法で断片の末端にライゲーションされ得、アンプリコンは、それにライゲーションされた増幅アダプターを有する断片から生成され得、そしてアンプリコンは配列決定され得る。例えば、増幅アダプターは、断片260、断片270、及び/又は断片280の末端にライゲーションされ得、次いで、そのような断片が増幅され、配列決定され得る。いくつかの例では、増幅アダプターは、固有の分子識別子(UMI)を含む。断片の異なるセットは、互いに別々に増幅及び配列決定され得るか、又は増幅及び/若しくは配列決定のために一緒に混合され得る。例示的に、断片260、270、及び/又は280の任意の適切なもののアンプリコンは、増幅及び/又は配列決定のために一緒に混合されてもよい。
したがって、各々が互いにおおよそ同じ数の塩基対を有する少なくとも約1,000,000個のWG断片のセットを含むか、又は本質的にそれからなる組成物が本明細書において提供される。例示的に、塩基対数は、約100~約200(例えば、約150)、又は約200~約400(例えば、約300)、又は約500~約700(例えば、約600)、又は約1000~約3000、例えば、約2000であり得る。組成物は、種の全ゲノムに由来し得、全ゲノムの配列を提供するように増幅及び配列決定され得る。WG断片のサイズは、使用される配列決定技術と共に使用するために調整することができ、WGの比較的低い部分が配列決定に使用可能な長さであり得る機械的断片化技術と比較して、所与のサンプル内の実質的に全WGを配列決定することができる。
切断を用いたポリヌクレオチドの標識
本明細書の他の箇所に記載されるように、固有の分子識別子(UMI)は、配列決定のためにそれらのポリヌクレオチドを標識する方法として、それぞれのポリヌクレオチドにカップリングされ得る。例示的に、所与のUMIにカップリングした所与のポリヌクレオチド分子の任意のアンプリコンはまた、そのUMIを含み得、それによって、それらのアンプリコンは、他のUMIにカップリングした他のポリヌクレオチド分子と比較して、そのポリヌクレオチド分子に由来するものとして一意的に同定され得る。しかしながら、そのようなUMIは増幅プロセス中に突然変異する可能性があり、そのような突然変異は、アンプリコンが由来するポリヌクレオチド分子を同定する能力を阻害する可能性がある。本明細書で提供されるように、Cas-gRNA RNPは、UMIを必要とすることなく、配列決定のためにそれらのポリヌクレオチド分子及びそれらのアンプリコンを標識するような方法でポリヌクレオチド分子を切断するために使用され得るが、そのようなUMIは、任意選択的に本明細書で提供されるような方法で切断されるポリヌクレオチドにカップリングされ得る。
例えば、図3A~図3Eは、切断部を使用してポリヌクレオチドを標識するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。図3Aは、二本鎖DNAなどの標的ポリヌクレオチドの第1及び第2の分子M1、M2を含む組成物301を示す。分子M1、M2の各々は、実質的に同じ配列を有してもよく、したがって、どの分子が「第1」であるとみなされ、どの分子が「第2」であるかは任意である。標的ポリヌクレオチドの配列は、互いに1つ以上の異なる位置でポリヌクレオチド分子M1、M2を切断するために使用され得る異なる部分配列を含み得、そのような切断のそれぞれの位置は、それぞれのポリヌクレオチド分子を標識するために考慮され得る。例えば、ポリヌクレオチド分子の各々は、第1のCas-gRNA RNPが標的化され得る(gRNAの関連部分に相補的な配列を有する)第1の部分配列311と、第2のCas-gRNA RNPが標的化され得る第2の部分配列312と、第3のCas-gRNA RNPが標的化され得る第3の部分配列313と、第4のCas-gRNA RNPが標的化され得る第4の部分配列314とを含み得る。第1及び第2の部分配列311、312は、互いに部分的にのみ重複してもよく、第3及び第4の部分配列313、314は、互いに部分的にのみ重複してもよい。
図3Bに示される組成物302において、標的ポリヌクレオチドの第1及び第2の分子M1、M2は、流体中で、第1及び第2のCas-gRNA RNP 351、352の各々の複数と接触し、また、第3及び第4のCas-gRNA RNP 353、354の各々の複数と接触してもよい。RNPのいずれが分子M1、M2の各々の中の対応する部分配列と最初にハイブリダイズするかに依存して、RNPの他の部分は、図3Bに示されるような方法で、これらの分子の中の他の部分配列とハイブリダイズすることを阻害され得る。非限定的な一例では、第1のCas-gRNA RNP 351のうちの1つは、第1の分子M1内の第1の部分配列311にハイブリダイズしてもよく、第2のCas-gRNA RNPのうちの1つは、第2の分子M2内の第2の部分配列312にハイブリダイズしてもよい。第1及び第2の部分配列311、312は互いに部分的にのみ重複するので、第1の分子M1にハイブリダイズする第1のCas-gRNA RNP 351のうちの1つは、第1の分子M1における第2の部分配列311への第2のCas-gRNA RNP 351のいずれかのハイブリダイゼーションを阻害し得、第2の分子M2にハイブリダイズする第2のCas-gRNA RNP 352のうちの1つは、第2の分子M2における第1の部分配列312への第1のCas-gRNA RNP 351のいずれかのハイブリダイゼーションを阻害し得る。すなわち、第1のCas-gRNA RNP 351のうちの1つが分子のうちの1つにハイブリダイズすれば、第2のCas-gRNA RNP 352もその分子にハイブリダイズしなくてもよく、第2のCas-gRNA RNP 352のうちの1つが分子のうちの1つにハイブリダイズすれば、第1のCas-gRNA RNP 351もその分子にハイブリダイズしなくてもよい。次いで、図3Cを参照してより詳細に説明されるような方法で、分子は、第1又は第2のCas-gRNA RNP 351、352がハイブリダイズされる第1又は第2の部分配列311、312で切断され得る。したがって、切断部は互いに異なる位置にあってもよい。例示的に、第1の分子M1の切断部は、標的ポリヌクレオチドの配列中で、第2の分子M2の切断部とは異なる位置にあり得る。いくつかの状況では、同じタイプのRNPが、第1及び第2の分子M1、M2の両方にハイブリダイズし得、この場合、これらの分子は、同じ位置で切断され得ることが理解されるであろう。
図3Bに例示されるような方法で、第3及び第4のCas-gRNA RNP 353、354は、同様に、第3又は第4の部分配列313、314にハイブリダイズし得、他のRNPのそれらの部分配列へのハイブリダイゼーションを阻害し得る。例えば、第3のCas-gRNA RNP 353のうちの1つは、第1の分子M1内の第3の部分配列313にハイブリダイズしてもよく、第1の分子M1内の第4の部分配列314への第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害してもよい。図3Cを参照してより詳細に説明されるような方法で、第1の分子M1は、次いで、第3のCas-gRNA RNP 353のうちの1つを使用して、第3の部分配列において切断され、断片を生成し得る。あるいは第4のCas-gRNA RNP 354のうちの1つは、第1の分子M1内の第4の部分配列354にハイブリダイズしてもよく、第3のCas-gRNA RNPのうちのいずれかの第1の分子中の第3の部分配列へのハイブリダイゼーションを阻害してもよい。次いで、図3Cを参照してより詳細に説明されるような方法で、第1の分子M1は、第4のCas-gRNA RNP 354のうちの1つを使用して、第4の部分配列において切断され、断片を生成し得る。RNPは、同様の方法で、第2の分子M2の異なる部分配列にハイブリダイズし得る。例えば、第3のCas-gRNA RNP 353のうちの1つは、第2の分子M2内の第3の部分配列313にハイブリダイズしてもよく、第2の分子M2内の第4の部分配列314への第4のCas-gRNA RNP 354のいずれかのハイブリダイゼーションを阻害してもよい。図3Cを参照してより詳細に説明されるような方法で、第2の分子M1は、次いで、第3のCas-gRNA RNP 354のうちの1つを使用して、第3の部分配列313において切断され、断片を生成し得る。あるいは第4のCas-gRNA RNP 354のうちの1つは、第2の分子M2における第4の部分配列314にハイブリダイズしてもよく、第2の分子M2における第3の部分配列313への第3のCas-gRNA RNP 353のいずれかのハイブリダイゼーションを阻害してもよい。次いで、図3Cを参照してより詳細に説明されるような方法で、第2の分子M2は、第4のCas-gRNA RNP 354のうちの1つを使用して、第4の部分配列において切断され、断片を生成し得る。いくつかの状況では、同じタイプのRNPが、第1及び第2の分子M1、M2の両方にハイブリダイズし得、この場合、これらの分子は、同じ位置で切断され得ることが理解されるであろう。しかしながら、統計的には、第1及び第2の分子における切断の少なくとも1つは、標的ポリヌクレオチドの配列において互いに異なる位置にあり得る可能性が高い。
ここで図3Cを参照すると、第1及び第2の分子M1、M2は、Cas-gRNA RNPを使用して切断されて、組成物303を生成し得る。例示的に、第1の分子M1は、それにハイブリダイズした第1のCas-gRNA RNP 351のうちの1つを使用して位置341で切断され得、第2の分子M2は、第2のCas-gRNA RNPのうちの1つを使用して位置342で切断され得る。同様に、第1の分子M1は、それにハイブリダイズした第3又は第4のCas-gRNA RNP 353、354のうちの1つを使用して、位置343又は344で切断され得、第2の分子M2は、それにハイブリダイズした第3又は第4のCas-gRNA RNP 353、354のうちの1つを使用して、位置343又は344で切断され得る。しかしながら、標的ポリヌクレオチドの任意の分子は、任意の適切な位置、例えば、Cas-gRNA RNPがハイブリダイズし得る位置で切断され得ることを理解されたい。1つの分子における位置341での切断部は、例えば、標的ポリヌクレオチドの配列中で、約2塩基対~約40塩基対(例えば、約2~20塩基対、又は約5~10塩基対)だけ別の分子における位置342での切断部からオフセットされ得る。同様に、1つの分子における位置343での切断部は、例えば、標的ポリヌクレオチドの配列中で、約2塩基対~約40塩基対(例えば、約2~20塩基対、又は約5~10塩基対)だけ別の分子における位置344での切断部からオフセットされ得る。したがって、図3Cに示されるように、第1及び第2の分子M1、M2の各々において作製される切断部341又は342及び343又は344の特定の組み合わせに依存して、異なる長さの断片及び異なる塩基対数を有する断片が形成され得る。例えば、断片331は、切断部341の位置と切断部343の位置との間の長さを有し得る。断片332は、切断部342の位置と切断部344の位置との間の長さを有し得る。断片333は、切断部341の位置と切断部344との間の長さを有し得、断片334は、切断部342の位置と切断部343との間の長さを有し得る。断片331及び332は、互いにおおよそ同じ長さを有し得るが、様々な断片内の切断部の特定の位置のために、断片333よりも短く、断片334より長くあり得ることに留意されたい。断片331、332、333、334の各々は、約100塩基対~約1000塩基対、例えば、約500塩基対~約700塩基対(例示的に、約600塩基対)、又は約200塩基対~約400塩基対(例示的に、約300塩基対)、又は約100塩基対~約200塩基対(例示的に、約150塩基対)、又は約1000~約3000塩基対、例えば、約2000塩基対の長さを有し得る。
したがって、図3Cに示される組成物303は、配列を有する標的ポリヌクレオチドの第1及び第2の分子M1、M2を含み得る。第1の分子(例えば、断片331又は断片333)は、第1の部分配列311に第1の末端を有し得、第2の分子(例えば、断片332又は334)は、第2の部分配列312に第1の末端を有し得る。図4を参照して説明したような方法で、第1の部分配列311、312は第2の部分配列と部分的にのみ重複してもよい。第1の分子の第1の末端は、標的ポリヌクレオチドの配列中で、第2の分子の第1の末端とは異なる位置にあってもよい。第1の分子の第1の末端は、例えば、標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ第2の分子の第1の末端からオフセットされ得る。第1の分子(例えば、断片331)は、第3の部分配列313に第2の末端を更に有し得、第2の分子(例えば、断片332又は334)は、第3の部分配列313又は第4の部分配列314に第2の末端を更に有し得る。第3の部分配列は、第4の部分配列と部分的にのみ重複してもよい。第2の分子の第1の末端は、標的ポリヌクレオチドの配列中で、第2の分子の第2の末端とは異なる位置にあってもよい。第1の分子の第2の末端は、標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ第2の分子の第2の末端からオフセットされ得る。第1及び第2の分子は、互いに異なる塩基対数を含み得、又は互いに同じ数の塩基対を有し得る。
いくつかの例では、Casは、それぞれのCas-gRNA RNP 351、352、353、及び/又は354がハイブリダイズする分子を切断するCas9を含む。他の例では、Casは、不活性化Cas9(dCas9)を含む。非限定的な一例では、第1のCas-gRNA RNP 351のうちの1つ、及び第3又は第4のCas-gRNA RNP 353、354のうちの1つが、第1の分子M1にハイブリダイズしている間に、第1のCas-gRNA RNPとその第3又は第4のCas-gRNA RNPとの間にない第1の分子の任意の部分は、例えば、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して分解され得る。別の非限定的な例では、第2のCas-gRNA RNP 352のうちの1つ、及び第3又は第4のCas-gRNA RNP 353、354のうちの1つが、第2の分子M2にハイブリダイズしている間に、第2のCas-gRNA RNPとその第3又は第4のCas-gRNA RNPとの間にない第2の分子の任意の部分は、例えば、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して分解され得る。すなわち、適切なエキソヌクレアーゼを使用して、それにハイブリダイズするCas-gRNA RNPの間に位置しない分子の部分を分解することができる。したがって、Cas-gRNA RNPは、それらの間の分子の部分を保護すると考えられ得る。
本発明の方法を使用して生成された断片は、増幅され、配列決定され得る。例えば、図3Dに示されるように、増幅アダプター360は、図1Jを参照して説明されるのと同様の方法で断片の末端にライゲーションされ得、アンプリコンは、それにライゲーションされた増幅アダプターを有する断片から生成され得、そしてアンプリコンは配列決定され得る。例えば、増幅アダプター360は、断片331、332、333、334の末端にライゲーションされ得、次いで、そのような断片が増幅され、配列決定され得る。いくつかの例では、増幅アダプターは固有の分子識別子(UMI)を含むが、そのようなUMIは純粋に任意である。任意のUMIを、増幅アダプターと同じ操作で、第1及び第2の断片の末端にカップリング及びライゲーションすることができる。
第1の部分配列311、第2の部分配列312、第3の部分配列313、及び第4の部分配列314を使用して、異なる断片のアンプリコンを、第1及び第2の分子M1、M2のうちの異なる分子に由来するものとして同定することができる。例示的に、断片331及びそのアンプリコンは、部分配列311内に収まる位置341に第1の末端を有し、部分配列313内に収まる位置342に第2の末端を有し得る。断片332及びそのアンプリコンは、部分配列312内に収まる位置342の第1の末端と、部分配列314内に収まる位置344の第2の末端とを有し得る。断片333及びそのアンプリコンは、部分配列311内に収まる位置341に第1の末端、及び部分配列314内に収まる位置344に第2の末端を有し得;断片334及びそのアンプリコンは、部分配列312内に収まる位置342に第1の末端、及び部分配列313内に収まる位置332に第2の末端を有し得る。したがって、部分配列311、312、313、314内の所与のアンプリコンのそれぞれの末端の位置に基づいて、そのようなアンプリコンが分子M1又はM2のうちの特定の1つに由来することを決定することができる。同様に、任意のUMIを使用して、アンプリコンを分子M1又はM2の特定の1つに由来するものとして同定することができる。特定の分子に由来するリードの全てを同定するこの能力は、元の分子の真の配列を決定するために、これらのリードを折り畳むことを可能にする。実際には、これにより誤り訂正及び精度の向上がもたらされ得、調製及び配列決定中に導入され得る誤りとは対照的に真のバリアントの同定が可能になる。これはまた、UMIを追加する非常に効率的な方法を提供する。比較すると、増幅の前にライゲーションされるUMIは、変換効率が低いという欠点がある可能性がある。本発明の方法は、PCR中に導入されるエラーを受けにくく、したがってより正確であり得るライブラリーの切断にUMI同定を組み込むことができる。
図3Eは、ポリヌクレオチドを切断するための方法における操作の例示的なフローを示す。図3Eに示される方法3000は、流体中で、標的ポリヌクレオチドの第1及び第2の分子を複数の第1及び第2のCas-gRNA RNPと接触させること(操作3001)を含む。図3Eに示される方法3000は、第1のCas-gRNA RNPのうちの1つを第1の分子中の第1の部分配列にハイブリダイズさせること(操作3002)を含む。例えば、図3Bを参照して説明されるような方法で、第1のCas-gRNA RNP 351のうちの1つが分子M1中の第1の部分配列311にハイブリダイズし得る。図3Eに示される方法3000は、第2のCas-gRNA RNPのうちの1つを第2の分子中の第2の部分配列にハイブリダイズさせることを含み、第2の部分配列は第1の部分配列と部分的にのみ重複する(操作3003)。例えば、図3Bを参照して説明されるような方法で、第2のCas-gRNA RNP 352のうちの1つが分子M2中の第2の部分配列312にハイブリダイズされ得る。図3Eに示される方法3000は、第1のCas-gRNA RNPのうちの1つによって、第1の分子中の第2の部分配列への第2のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害すること(操作3004)を含む。例えば、分子M1にハイブリダイズした第1のCas-gRNA RNP 351は、第2のCas-gRNA RNP 352もその分子にハイブリダイズすることを阻害し得る。図3Eに示される方法3000は、第2のCas-gRNA RNPのうちの1つによって、第2の分子中の第1の部分配列への第1のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害すること(操作3005)を含む。例えば、分子M2にハイブリダイズした第2のCas-gRNA RNP 352は、第1のCas-gRNA RNP 351もその分子にハイブリダイズすることを阻害し得る。図3Eに示される方法3000は、第1の部分配列において第1の分子を切断すること(操作3006)と、第2の部分配列において第2の分子を切断すること(操作3007)とを含む。Cas-gRNA RNPを使用してそのような分子を切断するための例示的な操作は、図3Cを参照して提供される。
したがって、標的ポリヌクレオチドの異なる分子は、種々の位置で末端を生成するように規定された位置で切断され得、増幅及び配列決定に続いて、標的ポリヌクレオチドの配列におけるそのような末端の位置を使用して、アンプリコンが由来する分子を同定することが理解され得る。
増幅アダプターのポリヌクレオチドへのカップリング
増幅アダプターのポリヌクレオチドへのカップリングは、それらの増幅及び配列決定を容易にする。本明細書で提供されるように、増幅アダプターは、Cas-gRNA RNP及びトランスポザーゼの両方を含む融合タンパク質を使用してポリヌクレオチドにカップリングされ得る。例えば、図4A~図4Jは、増幅アダプターをポリヌクレオチドに導入するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。図4Aに示されるように、組成物401は、第1のCas-gRNA RNPを使用して標的化され得る(すなわち、Cas-gRNA RNPのgRNAがハイブリダイズし得る配列を含む)第1の部分配列410を含む標的ポリヌクレオチドP1(二本鎖DNAなど)を含み得る。任意選択的に、組成物401は、第2のCas-gRNA RNPを使用して標的化され得る第2の部分配列420を更に含み得る。図4Bに示されるように、標的ポリヌクレオチドP1は、流体中で、第1の融合タンパク質430及び任意の第2の融合タンパク質440と接触させられ得る。第1の融合タンパク質430(及び、存在する場合、第2の融合タンパク質440)は、流体中の標的ポリヌクレオチドP1に対しておおよそ化学量論比であり得る。
第1の融合タンパク質430は、第1の増幅アダプター(破線で示す)がカップリングされた第1のトランスポザーゼ432にカップリングされた第1のCas-gRNA RNP 431を含み得る。任意選択の第2の融合タンパク質440は、第2の増幅アダプター(点線で示す)がカップリングされた第2のトランスポザーゼ442にカップリングされた第2のCas-gRNA RNP 441を含み得る。Cas-gRNA RNPをトランスポザーゼにカップリングするための非限定的な例は、図4F~4Iを参照して以下に更に提供される。任意の適切な増幅アダプターが、トランスポザーゼ432、442を使用して標的ポリヌクレオチドにカップリングされ得ることが理解されるであろう。例示的に、第1の増幅アダプターは、P5アダプターを含み得、第2の増幅アダプターは、P7アダプターを含み得る。任意選択的に、第1の増幅アダプターはまた、第1の固有の分子識別子(UMI)を含み得、第2の増幅アダプターは、第2のUMIを含み得る。UMIは、本明細書の他の箇所に記載されているような方法で配列決定中に使用され得る。
第1のCas-gRNA RNP 431(及び、存在する場合、第2のCas-gRNA RNP 441)の活性を促進し、第1のトランスポザーゼ432(及び、存在する場合、第2のトランスポザーゼ442)の活性を阻害しながら、第1のCas-gRNA RNP 431が標的ポリヌクレオチドP1中の第1の部分配列410にハイブリダイズし、存在する場合、第2のCas-gRNA RNP 441が標的ポリヌクレオチド中の第2の部分配列420にハイブリダイズする、図4Bに示される組成物402が提供され得る。いくつかの例では、流体の条件を使用して、第1及び第2のCas-gRNA RNP 431、441の活性が促進され得、トランスポザーゼ432、442の活性が阻害され得る。例えば、異なる酵素が機能するために特定のイオンを使用し得ることは周知である。例示的に、Cas-gRNA RNP 431、441は、カルシウムイオン(Ca2+)、マンガンイオン(Mn2+)、又はカルシウムイオンとマンガンイオンとの両方を使用して、例えば、それぞれ配列420、430にハイブリダイズするように機能し得る。比較すると、トランスポザーゼ432、442は、マグネシウムイオン(Mg2+)を使用して機能し得る、例えば、増幅アダプターを標的ポリヌクレオチドPにカップリングし得る。したがって、Cas-gRNA RNP 432、442の活性のために十分な量のカルシウムイオン、マンガンイオン、又はカルシウムイオンとマンガンイオンとの両方が存在し、トランスポザーゼ431、441の活性のために十分な量のマグネシウムイオンが存在しないことを含む条件を有する流体中で、標的ポリヌクレオチドP1を第1及び第2の融合タンパク質430、440と接触させることによって、Cas-gRNA RNPは適切に機能し得るが、トランスポザーゼは適切に機能し得ない。追加的又は代替的に、トランスポザーゼの標的ポリヌクレオチドへの結合は、任意の適切な方法で阻害され得、例えば、トランスポザーゼ上の結合部位を可逆的にブロックすること、トランスポザーゼのために使用されるものとは異なる温度を使用してCas-gRNA RNPをハイブリダイズすること、及び/又はトランスポザーゼの標的ポリヌクレオチドへの結合能を遅延させるためにCas-gRNAが標的ポリヌクレオチドにハイブリダイズする後までトランスポザーゼアダプターのトランスポザーゼへの結合を遅延させることなどが挙げられる。任意選択的に、第1の融合タンパク質430のCas-gRNA RNP 431が第1の部分配列410にハイブリダイズし、第2の融合タンパク質440のCas-gRNA RNP 441が第2の部分配列420にハイブリダイズする間に、Cas-gRNA RNP 431、441の間にない標的ポリヌクレオチドP1の任意の部分が、例えば、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して分解され得る。
続いて、第1及び第2のトランスポザーゼ432、442の活性を促進しながら、第1のトランスポザーゼを使用して、第1の増幅アダプターを標的ポリヌクレオチドP1内の第1の位置に付加することができ、第2のトランスポザーゼを使用して、第2の増幅アダプターを標的ポリヌクレオチド中の第2の位置に付加することができる。例えば、トランスポザーゼ432、442の活性は、トランスポザーゼの活性のために十分な量のマグネシウムイオンの存在など、流体の第2の条件を使用して促進され得る。例示的に、マグネシウムイオンは流体中に混合され得る。したがって、トランスポザーゼ432、442が標的ポリヌクレオチドP1に作用して第1及び第2の増幅アダプターをそれにカップリングさせる、図4Cに示される組成物403が提供され得る。標的ポリヌクレオチドP1は、第1及び第2の融合タンパク質430、440から遊離されて、一方の末端に第1の増幅アダプターを有し、他方の末端に第2の増幅アダプターを有する標的ポリヌクレオチドP1の断片450を含む、図4Dに示される組成物404を提供し得る。そのような遊離は、プロテイナーゼK、ドデシル硫酸ナトリウム(SDS)、又はプロテイナーゼKとSDSとの両方を使用して行われ得る。増幅アダプターがカップリングされた断片450は増幅され、配列決定され得る。
断片450の長さは、第1の配列410と第2の配列420、例えば、それらの間のおおよその距離に密接に関連し得る。例えば、図4Cに示されるように、融合タンパク質440の第1のCas-gRNA RNP 431は、リンカー433を介して第1のトランスポザーゼ432にカップリングされてもよく、融合タンパク質430の第2のCas-gRNA RNP 441は、リンカー443を介して第2のトランスポザーゼ442にカップリングされてもよい。リンカー433、443の非限定的な例は、図4F~4Iを参照して以下でより詳細に提供される。リンカー433、443は、明確な長さを有し得、したがって、トランスポザーゼがそれぞれのCas-gRNA RNPから移動し得る明確な距離を提供し得る。したがって、Cas-gRNA RNP 431、441が標的ポリヌクレオチドP1内のそれらのそれぞれの配列410、420にハイブリダイズされ、トランスポザーゼ432、442が活性化されると(例えば、流体の条件を使用して)、トランスポザーゼはそれぞれ、リンカー433、443の長さによって許容され得る任意の位置で、Cas-gRNA RNPに比較的近い標的ポリヌクレオチドの領域にカップリングされ得る。しかしながら、トランスポザーゼは(Cas-gRNA RNPがそうであるように)標的ポリヌクレオチドP1内の特定の配列にカップリングしない可能性があるため、トランスポザーゼがそれぞれ結合し得る位置の範囲が存在し得る。例示的に、トランスポザーゼ432が第1のアダプターを付加する第1の位置は、第1の部分配列410の約10塩基以内であってもよく、トランスポザーゼ442が第2のアダプターを付加する第2の位置は、第2の部分配列420の約10塩基以内であってもよい。
図4Dに示される断片450は、例えば、配列410、420間の距離(図4A~図4Cに示す)によっておおよそ定義されるような任意の適切な長さを有し得ることが理解されるであろう。例えば、断片450は、約100塩基対~約1000塩基対、例えば、約500塩基対~約700塩基対(例示的に、約600塩基対)、又は約200塩基対~約400塩基対(例示的に、約300塩基対)、又は約100塩基対~約200塩基対(例示的に、約150塩基対)の長さ、又は約1000塩基対~約3000塩基対(例示的に、約2000塩基対)の長さを有し得る。
図4Eに示されるように、第1及び第2の融合タンパク質430、440内のそれぞれのgRNA 434、444は、それぞれの配列410、420へのそのハイブリダイゼーションを促進するための任意の適切な長さ及び配列を有し得る。例えば、第1又は第2の部分配列410、420にハイブリダイズするgRNA 434、444の5’末端は、Cas-gRNA RNPにおいてより典型的に使用されるgRNAの5’末端に対して切断されていてもよい。例示的に、図4Eに示されるように、典型的なgRNAは、長さxの5’末端を有し得、xは約20ヌクレオチドであり得るが、gRNA 434、444は、長さyの5’末端を有し得、yはx未満である。いくつかの例では、第1の部分配列410にハイブリダイズするgRNA 434の部分yは、約15~約18ヌクレオチドの長さを有してもよく、第2の部分配列420にハイブリダイズするgRNA 444の部分yは、約15~約18ヌクレオチドの長さを有してもよい。切断型gRNAに関する更なる詳細については、その全内容が参照により本明細書に組み込まれる、Fu et al.,「Improving CRISPR-Cas nuclease specificity using truncated guide RNAs」,Nat.Biotechnol.32(3):279-284(2014)を参照されたい。
任意の適切なCas及び任意の適切なトランスポザーゼが融合タンパク質430、440において使用され得ることが理解されるであろう。例示的に、Casは、dCas9を含んでもよく(例えば、トランスポザーゼが活性化される前にCasが標的ポリヌクレオチドP1を切断することを阻害するように)、トランスポザーゼは、Tn5を含んでもよい(例えば、トランスポザーゼの活性が、十分な量のマグネシウムイオンを添加するなどの流体条件を通して良好に制御され得るように)。Cas及びトランスポザーゼは、任意の適切なカップリングを介して、例えば、共有結合を介して、又は非共有結合を介して互いにカップリングされ得る。共有結合は、例示的に、銅(I)触媒クリック反応、又は歪み促進アジド-アルキン環化付加によって形成され得る。非共有結合は、任意の適切な方法で形成され得る。例えば、図4Fに示されるような方法で、Cas-gRNA RNPは、抗体461に共有結合的にカップリングされ得、トランスポザーゼは、抗体が非共有結合的にカップリングされる抗原462に共有結合的にカップリングされ得るか、又は図4Gに示されるような方法で、Cas-gRNA RNPは、抗原461に共有結合的にカップリングされ得、トランスポザーゼは、抗原が非共有結合的にカップリングされる抗体462に共有結合的にカップリングされ得る。あるいは図4Hに示されるような方法で、Cas-gRNAは、gRNAの部分463と第1又は第2の増幅アダプターとの間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされ得る。更に別の例として、図4Iに示されるような方法で、Cas-gRNAは、gRNAの部分464とトランスポザーゼ内のオリゴヌクレオチド465との間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされ得る。Casが別のタンパク質にカップリングされ得る方法の更なる例については、その全内容が参照により本明細書に組み込まれる、以下の参考文献を参照されたい:Guilinger et al.,「Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification」,Nature Biotechnology 32:577-582(2014);及びBhatt et al.,「Targeted DNA transposition in vitro using a dCas9-transposase fusion protein」,Nucleic Acids Res.47:8126-8135(2019)。
図4Jは、配列を有する標的ポリヌクレオチドの断片を生成する方法における操作の例示的なフローを示す。図4Jに示される方法4000は、流体中で、標的ポリヌクレオチドを、増幅アダプターがカップリングされたトランスポザーゼにカップリングしたCas-gRNA RNPを各々含む第1及び第2の融合タンパク質と接触させること(操作4001)を含む。例えば、標的ポリヌクレオチドP1は、図4Bを参照して説明されるような方法で、第1の融合タンパク質430及び第2の融合タンパク質440と接触させられ得る。図4Jに示される方法4000は、Cas-gRNA RNPの活性を促進し、トランスポザーゼの活性を阻害しながら、(i)第1のCas-gRNA RNPを標的ポリヌクレオチド中の第1の部分配列にハイブリダイズさせることと、(ii)第2のCas-gRNA RNPを標的ポリヌクレオチド中の第2の部分配列にハイブリダイズさせること(操作4002)とを含む。例えば、流体は、図4Bを参照して説明されるような方法(例示的に、十分な量のCa2+及び/又はMn2+の存在並びに十分な量のMg2+の非存在)でトランスポザーゼ432及び442の活性を阻害しながら、第1のCas-gRNA RNP 431の第1の部分配列410への、及び第2のCas-gRNA RNP 442の第2の部分配列420へのそのようなハイブリダイゼーションを促進する第1の条件を有し得る。図4Jに示される方法4000は、第1及び第2のトランスポザーゼの活性を促進しながら、(i)第1のトランスポザーゼを使用して第1の増幅アダプターを標的ポリヌクレオチド中の第1の位置に付加することと、(ii)第2のトランスポザーゼを使用して第2の増幅アダプターを標的ポリヌクレオチド中の第2の位置に付加すること(操作4003)とを含む。例えば、流体は、図4Cを参照して説明されるような方法で、第1及び第2のトランスポザーゼ432及び442の活性を促進する第2の条件(例示的に、十分な量のMg2+の存在)を有し得る。
いくつかの実施態様では、ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮が使用され得る。
ライブラリー調製後に別個の濃縮工程を使用する特定の遺伝子の標的化配列決定は、時間がかかる場合がある。例えば、このような別個の濃縮工程は、オリゴヌクレオチドプローブをライブラリーDNAにハイブリダイズさせることと、ストレプトアビジンでコーティングされたビーズ上でハイブリダイズしたDNAを単離することと、を包含し得る。効率及び必要な時間が著しく改善されているものの、そのような別個の濃縮プロトコルは、約2時間と多くの試薬を要する場合があり、そのようなプロトコルの自動化を困難にし得る。
比較すると、本明細書のいくつかの例を使用して、調製及び濃縮の両方について単一工程を使用する、特定の遺伝子の標的化配列決定のためのライブラリーの調製及び濃縮ができる。
例えば、図7A及び図7Hは、増幅アダプターをポリヌクレオチドにカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。まず図7Aを参照すると、組成物701は、第1のCas-gRNA RNPを使用して標的化され得る(すなわち、Cas-gRNA RNPのgRNAがハイブリダイズし得る配列を含む)第1の部分配列710を含む標的ポリヌクレオチドP3(二本鎖DNAなど)を含み得る。任意選択的に、組成物701は、第2のCas-gRNA RNPを使用して標的化され得る第2の部分配列720を更に含み得る。標的ポリヌクレオチドP3は、無細胞DNAなどの部分的に断片化されたdsDNA、又は本明細書の他の箇所に記載されるような方法で断片化されたDNAを含み得る。あるいは標的ポリヌクレオチドP3は、染色体全体のDNAを含み得る。図7Bに示されるように、標的ポリヌクレオチドP3は、図4A~4Dを参照して説明されたものと同様の方法で、流体中で、第1の融合タンパク質730及び任意の第2の融合タンパク質740と接触させられ得る。第1の融合タンパク質730(及び、存在する場合、第2の融合タンパク質740)は、流体中の標的ポリヌクレオチドP3に対しておおよそ化学量論比であり得る。
第1の融合タンパク質730は、第1のCas-gRNA RNP 731を含み得、これはタグ733を含み、第1の増幅アダプター(破線で示す)がカップリングされた第1のトランスポザーゼ732にカップリングされている。任意選択の第2の融合タンパク質740は、第2のCas-gRNA RNP 741を含み得、これはタグ733を含み、第2の増幅アダプター(点線によって示される)がカップリングされた第2のトランスポザーゼ742にカップリングされている。タグ733は、それぞれのCas-gRNA RNPの任意のgRNA RNPの任意の適切な部分にカップリングされ得る。Cas-gRNA RNPをトランスポザーゼにカップリングするための非限定的な例は、図4F~4Iを参照して上記に更に提供される。任意の適切な増幅アダプターが、トランスポザーゼ732、742を使用して標的ポリヌクレオチドにカップリングされ得ることが理解されるであろう。例示的に、第1の増幅アダプターは、P5アダプターを含み得、第2の増幅アダプターは、P7アダプターを含み得る。任意選択的に、第1の増幅アダプターはまた、第1の固有の分子識別子(UMI)を含み得、第2の増幅アダプターは、第2のUMIを含み得る。UMIは、本明細書の他の箇所に記載されているような方法で配列決定中に使用され得る。
第1のCas-gRNA RNP 731(及び、存在する場合、第2のCas-gRNA RNP 741)の活性を促進し、第1のトランスポザーゼ732(及び、存在する場合、第2のトランスポザーゼ742)の活性を阻害しながら、第1のCas-gRNA RNP 731が標的ポリヌクレオチドP3中の第1の部分配列710にハイブリダイズし、存在する場合、第2のCas-gRNA RNP 741が標的ポリヌクレオチド中の第2の部分配列720にハイブリダイズする、図7Bに示される組成物702が提供され得る。いくつかの例では、図4A~4Dを参照して説明したような方法で流体の条件を使用して、第1及び第2のCas-gRNA RNP 731、741の活性が促進され得、トランスポザーゼ732、742の活性が阻害され得る。
標的ポリヌクレオチドP3は、タグ733を使用して濃縮され得る。例えば、図7Cに示される組成物703において、ハイブリダイズした第1及び第2のCas-gRNA RNP 731、732(それぞれタグ733及びトランスポザーゼ732、742にカップリングされている)を有する標的ポリヌクレオチドを、それぞれのリンカーを介してタグパートナー751にカップリングした基材750と接触させてもよい。タグパートナー751は、タグ733に共有結合的又は非共有結合的にカップリングするように選択され得、標的ポリヌクレオチドP3がタグ733及びタグパートナー751を介して基材750にカップリングされる図7Dに示されるような組成物704を形成する。基材750にカップリングされない任意の他のポリヌクレオチドは、洗い流され得る。
続いて、第1及び第2のトランスポザーゼ732、742の活性を促進しながら、第1のトランスポザーゼを使用して、第1の増幅アダプターを標的ポリヌクレオチドP3内の第1の位置に付加することができ、第2のトランスポザーゼを使用して、第2の増幅アダプターを標的ポリヌクレオチド中の第2の位置に付加することができる。例えば、トランスポザーゼ732、742の活性は、図4A~4Dを参照して説明されるような方法で、流体の第2の条件を使用して促進され得る。したがって、トランスポザーゼ732、742が標的ポリヌクレオチドP3に作用して第1及び第2の増幅アダプターをそれにカップリングさせる、図7Eに示される組成物705が提供され得る。ポリヌクレオチドP3は、第1及び第2の融合タンパク質730、740から遊離されて、一方の末端に第1の増幅アダプターを有し、他方の末端に第2の増幅アダプターを有する標的ポリヌクレオチドP3の断片760を含む、図7Fに示される組成物706を提供し得る。そのような遊離は、プロテイナーゼK、ドデシル硫酸ナトリウム(SDS)、又はプロテイナーゼKとSDSとの両方を使用して;Cas-gRNA RNP 731、741を変性させること、タグパートナー751からタグ733をデカップリングすること、タグパートナー751と基材750との間のリンカーを切断することなどによって行われ得る。あるいは断片760は、その後の処理のために基材750にカップリングされたままであってもよい。いずれの例においても、図7Fに示される得られた濃縮断片760(具体的に示されていない基材750への任意のカップリング)は、図5G~5H又は5I~5Jを参照して説明されるような方法で更に分析され得る。
増幅アダプターがカップリングされた断片760は増幅され、配列決定され得る。図4A~4Eを参照して説明されるような方法で、断片760の長さは、第1の配列710と第2の配列720、例えば、それらの間のおおよその距離に密接に関連し得る。図7Gに示される断片760は、例えば、配列710、720間の距離によっておおよそ定義されるような任意の適切な長さを有し得ることが理解されるであろう。例えば、断片760は、約100塩基対~約1000塩基対、例えば、約500塩基対~約700塩基対(例示的に、約600塩基対)、又は約200塩基対~約700塩基対(例示的に、約300塩基対)、又は約100塩基対~約200塩基対(例示的に、約150塩基対)の長さ、又は約1000塩基対~約3000塩基対(例示的に、約2000塩基対)の長さを有し得る。
任意の適切なタグ733及びタグパートナー751が、標的ポリヌクレオチドP3を基材750にプルダウンするために使用され得ることが理解されるであろう。例えば、タグパートナー751はSNAPタンパク質を含み得、タグ733はO-ベンジルグアニンを含み得る;タグパートナーはCLIPタンパク質を含み得、タグはO-ベンジルシトシンを含み得る;タグパートナーはSpyTagを含み得、タグはSpyCatcherを含み得る;タグパートナーはSpyCatcherを含み得、タグはSpyTagを含み得る;タグパートナーはビオチンを含み得、タグはストレプトアビジンを含み得る;タグパートナーはストレプトアビジンを含み得、タグはビオチンを含み得る;タグパートナーはNTAを含み得、タグはHisタグを含み得る;タグパートナーはHisタグを含み得、タグはNTAを含み得る;タグパートナーは、抗体(例えば抗FLAG抗体)を含み得、タグは、抗体が選択的である抗原(例えばFLAGタグ)を含み得る;タグパートナーは抗原(例えばFLAGタグ)を含み得、タグは、抗原に対して選択的な抗体(例えば抗FLAG抗体)を含み得る;又はタグパートナーは第1のオリゴヌクレオチドを含み得、タグは、第1のオリゴヌクレオチドに相補的であり、第1のオリゴヌクレオチドにハイブリダイズする第2のオリゴヌクレオチドを含み得る。タグパートナー751は、任意の適切な結合を介して、例えば、共有結合又は非共有結合を介して基材750にカップリングされ得る。同様に、タグ733はそれぞれ、例えば、図4F~4Iを参照して説明されたものと同様の方法で、任意の適切なカップリングを介して、例えば、共有結合を介して、又は非共有結合を介して、Cas-gRNA RNP 731、732にカップリングされ得る。いくつかの例では、それぞれ第1及び第2の融合タンパク質730、740内のgRNA 734、744は、図7Gに示されるような方法でタグ733にカップリングされ得る。例えば、タグにカップリングしたRNAオリゴヌクレオチドは商業的に購入することができ、それらの調製は当該技術分野で公知である。
任意の適切なCas及び任意の適切なトランスポザーゼが融合タンパク質730、740において使用され得ることが理解されるであろう。例示的に、Casは、dCas9を含んでもよく(例えば、トランスポザーゼが活性化される前にCasが標的ポリヌクレオチドP3を切断することを阻害するように)、トランスポザーゼは、Tn5を含んでもよい(例えば、トランスポザーゼの活性が、十分な量のマグネシウムイオンを添加するなどの流体条件を通して良好に制御され得るように)。他の例では、CasはCas12kを含み得、トランスポザーゼはTn7又はTn7様トランスポザーゼを含み得る(例えば、トランスポザーゼの活性が、十分な量のマグネシウムイオンを添加するなどの流体条件によって十分に制御され得るように)。Cas及びトランスポザーゼは、任意の適切な結合を介して、例えば共有結合を介して、又は非共有結合を介して、例えば図4F~図4Iを参照して、又はStreckerらに記載されているような方法で互いにカップリングされ得る。
例えば、図6A及び図6Bは、ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的なプロセスにおける組成物及び操作を概略的に示す。ShCAST6000は、Cas12k 6001と、RNAガイド6004を用いて大腸菌(E.coli)ゲノム中の特定の部位にDNA6003を挿入することができるTn7様トランスポザーゼ6002とを含む。本明細書で提供されるいくつかの例は、特定の遺伝子の標的化増幅のために、ShCAST又はTn5トランスポザーゼを組み込んだ改変バージョンのShCAST(ShCAST-Tn5)を利用する。このように、ライブラリー調製及び濃縮工程が組み合わされ、したがって、標的ライブラリー配列決定のワークフロー効率を簡略化し、改善し、自動化を促進する。
例示的には、gRNA 6004は、特定の遺伝子(配列)を標的化するように設計されてもよく、gRNAの間隔は、挿入サイズを制御してもよい。いくつかの例では、gRNA 6004及び/又はShCAST/ShCAST-Tn5 6002は、タグ6005にカップリングされてもよく、例えば、ビオチン化されてもよい。図6Aに示されているような方法で、gRNA 6004及びアダプター6003(例えば、Illuminaアダプター)を有する転位性エレメントをShCASTのトランスポザーゼ6002上に含ませ、複合体6000を得ることができる。図6Bのプロセスフロー6010に示されるような方法で、得られたShCAST/ShCAST-Tn5複合体6000は、図4A~4J及び図7A~7Gを参照して説明されたものと同様の方法で、タグメンテーションを阻害しながら、複合体を標的DNA中のそれぞれの配列に結合させる流体条件下(例えば、マグネシウム、Mg2+が少ないか、又は全くない)でゲノムDNA(標的ポリヌクレオチド)6011と混合され得る。次いで、タグ化(例えば、ビオチン化)gRNA及び/又はShCAST/ShCAST-Tn5がカップリングするストレプトアビジンビーズ6012などのタグパートナーにカップリングした基材を使用して複合体を単離することができる。例えば、オフターゲットタグメンテーションを低減又は最小化するために、任意の非結合DNAを洗い流してもよい。次いで、流体条件は、図4A-4Jを参照して説明されたものと同様の方法で、タグメンテーションを促進するように変更されてもよい(例えば、マグネシウムを十分に増加させる)。配列決定のための調製においてビーズからライブラリーを遊離させるために、ギャップ充填ライゲーション工程とそれに続く熱解離を使用することができる。
図6A~図6Bに示されるような組成物及び操作において、複合体6000のトランスポザーゼ部分6002は、DNAにランダムに挿入することが可能であり得ることに留意されたい。そのような挿入は、ShCAST/ShCAST-Tn5複合体を、タグメンテーションを阻害することによって、標的が結合されることを可能にする流体条件下(例えば、低マグネシウム又は無マグネシウム)でゲノムDNAと混合することによって阻害又は最小化され得る。
内部にCas12k及びTn7を含むShCASTに関する更なる詳細については、その全内容が参照により本明細書に組み込まれる、Strecker et al.,「RNA-Guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53 (2019)を参照されたい。
タグ733又はタグ6005は、任意の適切な時点でタグパートナーに(したがって基材に)カップリングされてもよく、そのような結合は、必ずしも融合タンパク質又は複合体が標的ポリヌクレオチドにカップリングした後に行われる必要はなく、実際に、融合タンパク質又は複合体が標的ポリヌクレオチドに結合する前に行われてもよいことを理解されたい。例示的に、図7Gに図示されるような方法でタグ733にカップリングしたgRNA 734、744は、タグ733とタグパートナー751との間の相互作用を使用して基材750にカップリングされ得る。次いで、融合タンパク質又は複合体のCas(トランスポザーゼも含む)は、基材結合gRNAにカップリングされ得る。次いで、標的ポリヌクレオチドは、Casにカップリングされ得、したがって、標的ポリヌクレオチドを基材にカップリングする。
図4Jを参照して説明したプロセスフローは、図6A~図6B及び図7A~図7Gを参照して説明したような方法でタグの使用を含むように修正されてもよいことも理解されたい。例えば、操作4001及び4002に関連する任意の適切な時点で、Cas-gRNA RNPにそれぞれカップリングされたタグを使用して、標的ポリヌクレオチドを基材上にプルダウンすることができる。図7A~7Fを参照して説明されるような方法で、タグは、ポリヌクレオチドをCas-gRNA RNPと接触させる前にCas-gRNA RNPにカップリングされ得る。あるいはタグは、gRNA及び基材にカップリングしたタグパートナーにカップリングされてもよく、Cas-トランスポザーゼ融合タンパク質又は複合体は、gRNAと接触させられる。次いで、トランスポザーゼの活性を促進し、増幅アダプターを標的ポリヌクレオチドに付加するように、操作4003が行われ得る。
したがって、ポリヌクレオチドを任意の適切な位置対で切断して断片を形成することができ、Cas-gRNA RNP/トランスポザーゼ融合タンパク質を使用して、得られた断片の末端に任意の適切な増幅プライマーを結合させることができることが理解されよう。次いで、断片を増幅し、配列決定することができる。
標的化エピジェネティックアッセイのための組成物及び方法
本明細書におけるいくつかの例は、Cas-gRNA RNPを使用して、エピジェネティックな目的の断片を生成するためのポリヌクレオチド(DNAなど)の濃縮、及びそれらの断片に沿った遺伝子座におけるタンパク質のアッセイを提供する。アッセイのいくつかの非限定的な例が、特定のワークフロー操作及び順序付けと共に与えられるが、他の例も容易に想定され得る。本実施例では、断片に沿ったタンパク質は、オリゴヌクレオチドを使用して標識され得、これは続いて配列決定され、このオリゴヌクレオチドを使用してタンパク質が特徴付けられ得る。例えば、オリゴヌクレオチドの配列は、所与の断片の遺伝子座におけるタンパク質の存在についての情報を提供し得るか、所与の断片の遺伝子座におけるタンパク質の位置についての情報を提供し得るか、所与の断片の遺伝子座におけるタンパク質の量についての情報を提供し得るか、又はそのような情報の任意の適切な組み合わせを提供し得る。断片は濃縮されてもよく、例えば、所与のポリヌクレオチドから特異的に選択されてもよいが、そのポリヌクレオチドの他の部分及び他のポリヌクレオチドの部分は廃棄されてもよい。そのような遺伝子座関連プロテオーム解析を使用して、例示的に、全ゲノム配列決定を補完するゲノムワイドプロテオームアトラスを提供して、遺伝子型表現型間の関係の特徴付けを向上させるか、又は特定の遺伝子座に関連するエピジェネティック特徴をより良く特徴付け、研究又は臨床応用及び治療に重要なエピジェネティック機構を理解することができる。
例えば、図5A~5Kは、標的化エピジェネティックアッセイのための例示的な組成物及びプロセスフローにおける操作を概略的に示す。図5Aに示されるように、組成物501は、第1のCas-gRNA RNPを使用して標的化され得る(すなわち、Cas-gRNA RNPのgRNAがハイブリダイズし得る配列を含む)第1の部分配列511を含む標的ポリヌクレオチドP2(二本鎖DNAなど)と、第2のCas-gRNA RNPを使用して標的化され得る第2の部分配列512とを含み得る。標的ポリヌクレオチドP2は、例えば、図2A~2K、3A~3E、又は4A~4Jを参照して、本明細書の他の箇所でより詳細に説明されるような方法で生成される断片を含み得るか、又は染色体全体若しくはその一部を含み得る。タンパク質521、522、及びクロマチン523は、第1の部分配列511と第2の部分配列512との間の標的ポリヌクレオチドP2のそれぞれの遺伝子座にカップリングされ得る。任意選択的に、タンパク質521、522は、例えば、以下に記載されるような方法で対応する抗体によって選択的に標的化されるそれらの能力を保存しながら、それらを標的ポリヌクレオチドP2に沿って適所に残すなど、後のプロセッシング操作中のそれらの安定性を高めるために架橋され得る。
図5Bに示される例示的な組成物502では、標的ポリヌクレオチドP2は、流体中で、第1のCas-gRNA RNP 531及び第2のCas-gRNA RNP 532と接触させられ得る。第1のCas-gRNA RNP 531及び第2のCas-gRNA RNP 532は各々、第1の部分配列511と第2の部分配列512との間の標的ポリヌクレオチドP2の部分を選択的にプルダウンし、したがって、図5D~5Fを参照して以下でより詳細に説明されるような方法でポリヌクレオチドのその部分を濃縮するために使用され得るそれぞれのタグ533を含み得る。非限定的な例では、Casは、Cas9又は標的ポリヌクレオチドP2を切断し得る他の適切なCasを含む。第1及び第2のCas-gRNA RNP 531、532は、標的ポリヌクレオチドP2内の第1及び第2の部分配列511、512にハイブリダイズし、それぞれ第1及び第2の部分配列で標的ポリヌクレオチドを切断して断片を形成する。例示的に、図5Cに示される得られた組成物503は、そのそれぞれの遺伝子座にカップリングされた1つの第1のタンパク質521、2つの第2のタンパク質522、及びクロマチン523を有する断片540、並びにタグ533にそれぞれカップリングされ、部分配列511、512にそれぞれハイブリダイズされ、したがってタグ533を断片540にカップリングする第1及び第2のCas-gRNA RNP 531、532を含む。断片540は、任意の適切な長さ、例えば、約100塩基対~約1000塩基対、例えば、約500塩基対~約700塩基対、又は約200塩基対~約400塩基対、又は約100塩基対~約200塩基対、又は約1000塩基対~約3000塩基対(例示的に、約2000塩基対)の長さを有し得る。ポリヌクレオチドP2の残りの部分541、542は、任意の長さを有してもよく、いくつかの例では、断片540の除去後に染色体の残部を形成してもよい。
断片540は、タグ533を使用して濃縮され得る。例えば、図5Dに示されるように、第1及び第2のCas-gRNA RNP 531、532(それぞれタグ533にカップリングされている)がハイブリダイズした断片540、並びにポリヌクレオチドP2の残りの部分541、542を、それぞれのリンカーを介してタグパートナー551にカップリングした基材550と接触させてもよい。タグパートナー551は、タグ533に共有結合的又は非共有結合的にカップリングするように選択され得、図5Eに示されるような組成物を形成し、ここで、断片540は、タグ533及びタグパートナー551を介して基材550にカップリングされるが、残りの部分541、542は、基材550にカップリングされず、洗い流され得る。次いで、断片540は、例えば、Cas-gRNA RNP 531、532を変性させることによって(この場合、タンパク質521、522は、それらの変性を阻害するために予め架橋されていてもよい)、タグパートナー551からタグ533をデカップリングすることによって、タグパートナー551と基材との間のリンカーを切断することなどによって、基材550から遊離され得る。あるいは断片540は、その後の処理のために基材550にカップリングされたままであってもよい。いずれの例においても、図5Fに示される得られた濃縮断片540(具体的に示されていない基材550への任意のカップリング)は、図5G~5H又は5I~5Jを参照して説明されるような方法で更に分析され得る。
任意の適切なタグ533及びタグパートナー551が、断片540をプルダウンするために使用され得ることが理解されるであろう。例えば、タグパートナー551はSNAPタンパク質を含み得、タグ533はO-ベンジルグアニンを含み得る;タグパートナーはCLIPタンパク質を含み得、タグはO-ベンジルシトシンを含み得る;タグパートナーはSpyTagを含み得、タグはSpyCatcherを含み得る;タグパートナーはSpyCatcherを含み得、タグはSpyTagを含み得る;タグパートナーはビオチンを含み得、タグはストレプトアビジンを含み得る;タグパートナーはストレプトアビジンを含み得、タグはビオチンを含み得る;タグパートナーはNTAを含み得、タグはHisタグを含み得る;タグパートナーはHisタグを含み得、タグはNTAを含み得る;タグパートナーは、抗体(例えば抗FLAG抗体)を含み得、タグは、抗体が選択的である抗原(例えばFLAGタグ)を含み得る;タグパートナーは抗原(例えばFLAGタグ)を含み得、タグは、抗原に対して選択的な抗体(例えば抗FLAG抗体)を含み得る;又はタグパートナーは第1のオリゴヌクレオチドを含み得、タグは、第1のオリゴヌクレオチドに相補的であり、第1のオリゴヌクレオチドにハイブリダイズする第2のオリゴヌクレオチドを含み得る。タグ533はそれぞれ、例えば、図4F~4I又は7Gを参照して説明されたものと同様の方法で、任意の適切なカップリングを介して、例えば、共有結合を介して、又は非共有結合を介して、Cas-gRNA RNP 531、532にカップリングされ得る。同様に、タグパートナー551は、任意の適切な結合を介して、例えば、共有結合又は非共有結合を介して基材550にカップリングされ得る。
本明細書で提供されるように、対応するオリゴヌクレオチドを使用して、断片(この断片は、図5A~5Fを参照して説明されるような方法で調製及び濃縮され得る)のそれぞれの遺伝子座にカップリングしたタンパク質521、522のそれぞれをそれぞれ標識してもよく、次いで、そのようなオリゴヌクレオチドを配列決定してもよい。対応するオリゴヌクレオチドを用いて、タンパク質を同定することができ、遺伝子座を同定することができ、及び/又はタンパク質を定量化することができる。
ここで図5G~5Hを参照して説明されるいくつかの例では、タンパク質の各々をそれぞれ標識するために対応するオリゴヌクレオチドを使用することは、濃縮断片540を、異なるタンパク質に特異的な抗体の混合物と接触させることを含み得、抗体の各々は、タンパク質を特徴付けるような方法でタンパク質を標識するために使用され得る対応するオリゴヌクレオチドにカップリングされる。例えば、図5Gに示される組成物504は、対応する第1、第2、第3、及び第4のオリゴヌクレオチドにそれぞれカップリングされた複数の第1、第2、第3、及び第4の抗体551、552、553、554のそれぞれと接触している濃縮断片540を含む。抗体551、552、553、554の各々は、異なるタンパク質に特異的である。濃縮された断片540は、その断片に沿った遺伝子座に潜在的にカップリングされ得、エピジェネティックな対象であり得る、異なるタンパク質又は他のクロマチンに特異的な任意の適切な数及びタイプの異なる抗体と接触させられ得ることが理解されるであろう。濃縮断片540のそれぞれの遺伝子座にカップリングしたタンパク質に特異的な混合物中の任意の抗体について、それらの抗体及び対応するオリゴヌクレオチドは、抗体/標的結合を介してそれらのタンパク質に非共有結合的にカップリングされるようになり得る。図5Eに示される非限定的な例示的組成物505では、第1の抗体551は、第1のタンパク質521に特異的であり、それにカップリングされ、一方、第2の抗体552は、第2のタンパク質522に特異的であり、それにカップリングされる。複数の第2のタンパク質522が遺伝子座のそれぞれ1つにカップリングされ、混合物中の複数の第2の抗体552がその遺伝子座においてタンパク質にカップリングされる。この例では、濃縮断片540は、第3及び第4の抗体553、554が特異的であるタンパク質を含まず、したがって、これらの抗体(及びそれらのそれぞれのオリゴヌクレオチド)は、断片にカップリングされない。
カスタムオリゴヌクレオチドコンジュゲート抗体は、市販されているか、又は例えば、それらの各々の全内容が参照により本明細書に組み込まれる、以下の参考文献に記載されているような公知の技術を使用して調製することができる:Gong et al.,「Simple method to prepare oligonucleotide-conjugated antibodies and its application to multiplex protein detection in single cells」,Bioconjugate Chem.27:217-225(2016);及びStoeckius et al.,「Simultaneous epitope and transcriptome measurement in single cells」,Nature Methods 14:865-868(2017)。
抗体551、552にそれぞれカップリングされる第1及び第2のオリゴヌクレオチドは、配列決定され得、濃縮断片540内のタンパク質521、522の存在、及び任意選択的にその量を同定するためにそれぞれ使用され得る。いくつかの例では、第1及び第2のオリゴヌクレオチドは、例えば、タンパク質521、522及び抗体551、552を消化するプロテアーゼを適用することによって、断片540から遊離され、次いで増幅され、配列決定され得る。そのような配列決定は、任意の適切な方法で行われ得る。例えば、対応するオリゴヌクレオチドを配列決定することは、例えば、Illumina BeadArray(商標)技術(カリフォルニア州サンディエゴ)を使用して、対応するオリゴヌクレオチドをビーズアレイにハイブリダイズさせること、又は対応するオリゴヌクレオチドに対して合成による配列決定(SBS)を行うことを含み得る。オリゴヌクレオチドは、任意選択的に、増幅アダプター(例えば、P5及びP7アダプター、又はY字型アダプター)及び/又はUMIを含み得るか、あるいはそのような増幅アダプター及び/又はUMIは、増幅及び配列決定の前に、PCRなどの公知の技術を使用してオリゴヌクレオチドに付加され得る。
使用される特定の配列決定方法にかかわらず、対応するオリゴヌクレオチドのそれぞれの存在を使用して、濃縮断片540にカップリングしたタンパク質を同定し、任意選択的に定量化することができる。例えば、第1及び第2のオリゴヌクレオチドの存在は、ビーズアレイ又はSBSを使用して検出され得、そのような存在に基づいて、第1及び第2のタンパク質521、522が断片540中に存在したと推定され得る。対応するオリゴヌクレオチドのそれぞれの量もまた、タンパク質を定量化するために使用され得る。例えば、濃縮断片540は2つの第2のタンパク質522を含んでいたので、第1の抗体551の1つのコピー及び第1のオリゴヌクレオチドの1つのコピーに結合するようになる1つの第1のタンパク質521と比較して、第2の抗体552の2つのコピーが、第2のオリゴヌクレオチドの2つのコピーと共にそれに結合するようになる。第1のオリゴヌクレオチド(1コピー)及び第2のオリゴヌクレオチド(2コピー)の相対量は、濃縮断片540内の第1のタンパク質521(1コピー)及び第2のタンパク質522(2コピー)の相対量を示す。第3及び第4のオリゴヌクレオチドが存在しないことは、第3及び第4の抗体553、554がそれぞれ選択的であるタンパク質が、濃縮断片540中に存在しなかったことを示す。したがって、本発明の方法は、濃縮断片540、より具体的には濃縮断片540に沿った遺伝子座にカップリングしているタンパク質のエピジェネティック特徴のアッセイを提供する。
ここで図5I~5Jを参照して説明する他の例では、タンパク質の各々をそれぞれ標識するために対応するオリゴヌクレオチドを使用することは、断片を複数のトランスポザーゼと接触させることを含み得、トランスポザーゼの各々は、タンパク質を特徴付けるような方法でタンパク質を標識するために使用され得る対応するオリゴヌクレオチドにカップリングされる。例えば、図5Iに示される組成物506は、それぞれオリゴヌクレオチドを含む複数のトランスポザーゼ561と接触している濃縮断片540(図5A~5Fを参照して説明されるような方法で調製され得る)を含む。非限定的な例では、トランスポザーゼはTn5を含み得る。
濃縮断片のそれぞれの遺伝子座にカップリングしたタンパク質は、その遺伝子座においてトランスポザーゼの活性を阻害し得る。したがって、トランスポザーゼ561は、遺伝子座以外の位置で断片540にカップリングされるようになり得る。トランスポザーゼ561が断片540にカップリングされる位置で、トランスポザーゼは、対応するオリゴヌクレオチドを断片に結合し得る。そのようなプロセスは、断片540を部分断片に分割することができる。図5Jに示される組成物507の非限定的な例では、部分断片571は、第1のタンパク質521及びオリゴヌクレオチドを含み、部分断片572は、クロマチン523及びオリゴヌクレオチドを含み、部分断片573は、タンパク質522及びオリゴヌクレオチドを含む。これに関して、トランスポザーゼ561(図5Iに示される)は、タンパク質521、522又はクロマチン523の存在によって阻害されない(すなわち、所与のタンパク質又は断片の部分に特異的でない)任意の位置で断片540に結合し得るので、そのようなトランスポザーゼは、それらのそれぞれのオリゴヌクレオチドを任意のそのような位置に付加し得ることに留意されたい。
第2、第1、及び第3の断片571、572、573にそれぞれカップリングされたオリゴヌクレオチドは、例えば、図5G~5Hを参照して説明されるような方法で、配列決定され、タンパク質521、522及びクロマチン523の存在、及び任意選択的に量を同定するためにそれぞれ使用され得る。オリゴヌクレオチドの断片571、572、573におけるそれぞれの位置は、タンパク質及び/又はクロマチンのそれぞれの遺伝子座を同定するために使用され得る。例えば、図5I及び5Jに示される純粋に例示的な図では、タンパク質521は、任意のトランスポザーゼがそのタンパク質の遺伝子座において作用することを阻害し、タンパク質522は、任意のトランスポザーゼがそれらのタンパク質の遺伝子座において作用することを阻害し、クロマチン523は、任意のトランスポザーゼがそのクロマチンが位置する場所で作用することを阻害する。したがって、断片572、571、573中の第2、第1、及び第3のオリゴヌクレオチド中のタンパク質522、521及び/又はクロマチン523のそれぞれの位置は、オリゴヌクレオチドが付加された位置以外の位置であると理解され得る。
図5Kは、標的ポリヌクレオチドのそれぞれの遺伝子座にカップリングしたタンパク質を特徴付ける方法5000における操作の例示的なフローを示す。方法5000は、例えば図5A~図5Cを参照して説明されるような方法で、標的ポリヌクレオチドを第1及び第2のCas-gRNA RNPと接触させること(操作5001)を含み得る。任意選択的に、方法5000は、対応するオリゴヌクレオチドを使用して断片のそれぞれの遺伝子座にカップリングしたタンパク質の各々をそれぞれ標識する前に断片を濃縮することを含み得る。例えば、第1及び第2のCas-gRNA RNPはそれぞれ、例えば、図5B~5Cを参照して説明されるような方法で、断片が第1及び第2のCas-gRNA RNPを介してタグにカップリングされるようにタグにカップリングされ得る。濃縮することは、第1及び第2のCas-gRNA RNPを介してタグにカップリングした断片を、例えば、図5Dを参照して説明されるような方法で、タグパートナーにカップリングした基材と接触させることを含み得る。濃縮することは、例えば、図5Eを参照して説明されるような方法で、タグをタグパートナーにカップリングして、断片を基材にカップリングすることを更に含み得る。濃縮することは、例えば、図5Fを参照して説明されるような方法で、基材にカップリングされていない標的ポリヌクレオチドの任意の部分を除去することを更に含み得る。
方法5000は、第1及び第2のCas-gRNA RNPを標的ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることを含み得、タンパク質は、例えば、図5A~5Cを参照して説明されるような方法で、第1及び第2の部分配列間の標的ポリヌクレオチドのそれぞれの遺伝子座にカップリングされる(操作5002)。方法5000は、第1のCas-gRNA RNPを使用して第1の部分配列で、及び第2のCas-gRNA RNPを使用して標的ポリヌクレオチドを切断し、第2の部分配列において標的ポリヌクレオチドを切断して断片を形成することを含み得、タンパク質は、例えば、図5A~5Cを参照して説明されるような方法で、断片のそれぞれの遺伝子座にカップリングされる(操作5003)。方法5000は、例えば、図5G~図5Hを参照して説明されるような方法で、及び/又は図5I~図5Jを参照して説明されるような方法で、断片のそれぞれの遺伝子座にカップリングしたタンパク質の各々をそれぞれ標識するために対応するオリゴヌクレオチドを使用すること(操作5004)と、対応するオリゴヌクレオチドを配列決定すること(操作5005)とを含み得る。
図5G~5H及び5I~5Jを参照してそれぞれ記載されるようなプロセスフローは、任意の適切な長さのポリヌクレオチドを使用して行われ得、図5A~5Cを参照して説明されるようなプロセスフローを使用して生成された断片を使用して必ずしも行われる必要はないことが理解されるであろう。したがって、図5Kを参照して説明した方法5000の操作5001~5003は、任意選択的あると理解されるべきである。
したがって、図5A~5Kから、本明細書のいくつかの例では、Cas-gRNA RNPを使用して、タンパク質にカップリングしたポリヌクレオチド断片を生成及び濃縮することができ、それらのタンパク質の位置、量、及び/又は同一性を、本明細書に記載されるようなエピジェネティックアッセイを使用して特徴付けられ得ることが理解され得る。
Cas-gRNA RNPニッカーゼを使用するポリヌクレオチドの選択された断片の濃縮
本明細書で提供されるいくつかの方法は、インタクトなdsDNA断片の標的化配列決定のための長く面倒なワークフローの問題を解決する。本開示から明らかなように、Cas-gRNA RNPは、ポリヌクレオチド、例えば、dsDNAにおける標的領域の迅速かつ特異的な切断を提供し得る。ここで図8A~8Hを参照して説明されるように、Cas-gRNA RNPニッカーゼ及びポリメラーゼ伸長は、基材からの溶出によってdsDNA断片を選択的に濃縮するために使用され得る。そのような方法及び組成物は、インタクトな起源断片を回収するために使用され得る。これは、Cas-gRNA RNPによる完全なdsDNA切断が望ましくない場合がある用途、例えば、無細胞DNA(cfDNA)の配列決定において特に有用であり得る。これはまた、又は代替的に、配列決定ライブラリーの基礎となるサイズがCRISPR切断によって変化しないので有用であり得、これは、非常に短い産物の生成を低減又は回避することを意味する。
より具体的には、図8A及び図8Hは、Cas-gRNA RNPニッカーゼを使用して選択されたポリヌクレオチド断片を濃縮するための例示的な組成物及びプロセスフローにおける操作を概略的に示す。図8Aは、標的領域の選択的溶出のためのCRISPRニッカーゼ伸長の例示的なプロセスフローの概要を示す。プロセスフローの操作Aにおいて、dsDNA断片P4(任意選択的に本明細書の他の箇所に記載されるような方法で生成され得る)は、ビーズへの断片の結合を容易にするように3’官能化(「B」)され得る。例えば、断片は、図8Cを参照して以下に記載されるような方法を使用して3’ビオチン化され得る。断片P4のいくつかは、濃縮及び検出することが所望されるそれぞれの標的配列を含み得るが、他の断片は、そのような配列を必ずしも含まなくてもよい。例えば、図8Aに示される断片P4は、標的配列810を含むが、他の断片は、他の標的配列を含み得、又はそのような標的配列を含まなくてもよい。
図8 Aに示すプロセスフローの操作Bにおいて、3’官能化断片P4は、1つ以上の基材、例えば3’官能化断片P4にカップリングすることになるように官能化されたビーズにカップリングされ得る。非限定的な一例では、ビーズ820は、3’ビオチン化断片P4がカップリングされるストレプトアビジンを含み得る。図示の例では、dsDNA断片P4の官能基化された3’末端の各々が異なるビーズ820に結合されるが、他の例では、所与の断片P4の3’官能基化末端が互いに同じビーズに結合され得ることが理解されるであろう。ビーズ820は、溶液から引き出されてもよく(例えば、ビーズは、強磁性又は常磁性であってもよく、外部磁石を使用して溶液から引き出されてもよい)、次いで、ビーズは、洗浄されて、ビーズにカップリングした精製されたdsDNA断片P4を提供し、一方、任意の他のdsDNAは、実質的に洗い流されてもよい。
図8Aに示されるように、操作Cにおいて、ビーズ結合断片P4は、複数のCas-gRNA RNPニッカーゼ(本明細書ではCRISPRニッカーゼとも称される)と接触させられ得る。Cas-gRNA RNPニッカーゼの各々のgRNAは、dsDNAのそれぞれの一本鎖内の特定の領域(部分配列)を標的とすることができ、この領域は、ニッカーゼが、互いにオフセットされ、かつ濃縮することが望まれる二本鎖標的領域810の両側にある位置でそれぞれの鎖を切断するように互い違いにされ得る。例えば、図8Aの操作Cに示されるような方法で、第1のCas-gRNA RNPニッカーゼ851のgRNAは、標的配列810のフォワード(「fwd」)である領域を標的としてもよく、第2のCas-gRNA RNPニッカーゼ852のgRNAは、標的配列810のリバース(「rev」)である領域を標的としてもよい。したがって、第1及び第2のニッカーゼ851、852のガイド配列は、順方向及び逆方向において標的配列810に「隣接する」と考えられ得る。第1のCas-gRNA RNPニッカーゼ851は、ビーズ結合dsDNA断片P4の一方の鎖にニック(切断)を生成し、第2のCas-gRNA RNPニッカーゼ852は、ビーズ結合dsDNA断片P4の他方の鎖に、ニッカーゼ851によって生成された位置からずれた位置にニックを生成する。対応するCas-gRNA RNPニッカーゼが、dsDNA断片内の特定の配列に隣接する位置でそれぞれの鎖を切断するように、任意の適切な数のgRNAが設計され得ることが理解されるであろう。例えば、複数の異なるgRNA(例えば、1000~100,000個のgRNA、又は100,000個を超えるgRNA)を使用して、サンプル内の目的の多くの異なる配列を同時に濃縮することができる。gRNAは、必ずしも所与の標的配列810に「隣接する」必要はなく、むしろ標的配列当たり少なくとも2つのガイドが所与の断片P4内の対向する鎖に結合して、ニックを形成し得ることに留意されたい。
図8Aの操作Dに示されるように、Cas-gRNA RNPニッカーゼ851、852は、例えば、穏やかな熱及び/又はCas-gRNA RNPニッカーゼを破壊するための試薬、例えば、プロテイナーゼK、プロテアーゼ、又はSDS洗浄剤を使用して、ニックの3’末端を露出させるように除去される。各所与のdsDNA断片P4の鎖は互いにハイブリダイズしたままであるので、断片は、対応するビーズ820に実質的にカップリングしたままである。
次いで、dsDNAの鎖中の対向するニックに隣接する標的配列810は、選択的に溶液中に溶出され得るが、断片P4の残りの部分はビーズ820にカップリングしたままである。例えば、ニックが入った断片P4は、ポリメラーゼ及びヌクレオチド(具体的には図示せず)と接触させられ得る。図8Aの操作Eに示されるような方法で、ポリメラーゼは、ニックによって露出された3’末端から断片のそれぞれの鎖を伸長し得、そのような伸長は、結合された鎖を置換し得、標的配列810の溶出をもたらす。非標的化領域は、ビーズ820にカップリングしたままであり、例えば、磁気又は他の分離技術を使用して、溶出された標的配列810から分離される。ポリメラーゼ伸長は、断片P4内のどこにニックが生じたかにかかわらず、インタクトな配列810の溶出を生じる。
Cas 9ニッカーゼ及びポリメラーゼ伸長を使用してラムダDNA中の標的を濃縮して基材から溶出するためのワークフローの例
図8Aは、Cas9ニッカーゼを使用してラムダDNA中の標的を濃縮するために使用することができる例示的なワークフローを示す。ラムダゲノムの4つの領域を標的とする特異的ガイドRNA配列を使用する。図12~16は、以下でより詳細に説明するように、ワークフローの様々な工程後のライブラリー構造の概略図を提供する。表1は、ガイドRNA配列並びにそれらが標的とする領域を提供する。
Figure 2024510206000002
Cas9酵素にガイドRNA配列をロードする。ガイド配列を、1uMガイド、1uM Cas9ニッカーゼ(Integrated DNA Technologies、Alt-R(登録商標)S.p.Cas9 D10AニッカーゼV3、1081062)及び1×リン酸緩衝生理食塩水を含む最終体積50ulでCaspに別々にロードする。構成要素を室温で10分間放置し、次いで等量でプールして、Cas9ニッキングミックスを作製する。溶液を使用するまで氷上で保存する。
ビーズ連結トランスポソームを用いたタグ付け断片化によるライブラリー調製
3’末端によって小さな表面に付着したライブラリーを、ビーズ連結トランスポソームを使用して調製した。
工程1:500ngのラムダDNAを、10uLのTB1及び10uLのeBLTと共に、Illumina DNA Prep with Enrichmentキットからの50uLの総体積でインキュベートした。混合物を41℃に5分間加熱した。
工程2:10uLのST2を添加することによってTn5を除去し、37℃で5分間加熱した。
図12は、工程2の後のライブラリー構造を示す。要素1200は、DNAインサート中のPAM部位を示す。
工程3:反応プレートを磁気スタンド上に置き、ビーズをペレット化した。上清を除去し、150uLのTWBを添加することによってビーズを洗浄した。次いで磁石を除去し、溶液をピペッティングにより混合した。ビーズを再び磁石上でペレット化し、その後磁石を除去した。上清を廃棄した。
工程4:50uLのELM(Illumina DNA Prep PCR Freeキットから)を溶液に添加した。この溶液を37℃で15分間インキュベートして、インサートの3’末端とトランスポゾンの非転移鎖との間をギャップを充填し、ライゲーションした。
図13は、工程4後のライブラリー構造を示す。要素1200は、DNAインサート中のPAM部位を示す。
工程5:ビーズを磁石上でペレット化する。上清を除去し、TWBで洗浄した。
工程6:50μL容量中の1×NEBuffer 1(New England Biolabs)中の0.5μLのエキソヌクレアーゼIII(New England Biolabs、M0206)を添加することによって、バックグラウンドに寄与し得る任意の不完全にギャップ充填及びライゲーションされた断片を除去した。ピペットで混合し、37℃に10分間加熱することによって、ビーズを再懸濁した。
Cas9ニッキング反応
工程1:2uLのプールされ負荷されたCas9ニッカーゼを1×NEBuffer2.1(New England Biolabs)と共に20uLの総体積で添加することによって、上清を除去した。ピペットで混合し、37℃に30分間加熱することによって、ビーズを再懸濁した。
図14は、Cas9が各鎖上の標的断片にどのようにニックを入れるかを示す。
工程2:10uLのST2を添加し、37℃で5分間加熱することによって、Cas9を除去した。ビーズをペレット化し、TWBで2回洗浄した。上清を廃棄した。
図15は、この時点でのライブラリー構造を示し、各鎖に1つのニックを有する。要素1200は、DNAインサート中のPAM部位を示す。
ビーズから標的断片を溶出するためのポリメラーゼ伸長。
0.5uLのDNAポリメラーゼI(New England Biolabs、M0210)又はBsu DNAポリメラーゼ(New England Biolabs、M0330)を溶液に添加した。1×NEBuffer 2(New England Biolabs)を使用し、200uMの各dNTPを50uLの総容量で添加した。溶液を37℃で10時間撹拌した。
図16は、ポリメラーゼ伸長後のものを示す。示されるように、断片はもはや3’ビオチンを有さず、したがって溶液中に遊離される。要素1200は、DNAインサート中のPAM部位を示す。
精製及びPCR
工程1:ビーズをペレット化し、選択された標的断片を含有する40uLの上清を新しいチューブに移した。Illumina Purification Beads(IPB)を使用して、100uLのITBを添加し、十分に混合し、室温で5分間インキュベートすることによって、ビーズを精製した。ビーズを磁石上でペレット化し、180μLの80%エタノールで2回洗浄した。上清を除去し、2分間乾燥させ、次いで27μLの水に再懸濁した。溶液をよく混合し、ビーズをペレット化し、25μLの上清を新しいチューブに移した。
工程2:以下のPCRプログラムを使用して、20μLのEPM及び5μLのインデックスプライマーミックスを添加することによって、ライブラリーを増幅した。
- 98℃で1分間。
- 98℃で20秒間を12サイクル
- 60℃で30秒間
- 72℃で30秒間
- 10℃に冷却
配列決定
ライブラリーを、Qubitキット(dsDNA BR Assay Kit、Thermo Scientific)及び蛍光光度計を使用して定量化し、次いで、12pMのローディング濃度でMiSeq上で配列決定した。
図17は、4つの標的の濃縮後のラムダゲノムにわたる配列決定深度を示す。
図8Bは、図8Aを参照して説明されるような選択的溶出を引き起こすための断片P4に対する少なくとも2つのCRISPR事象の使用に関する更なる詳細を示す。図8Bに示す操作Aでは、ニッキング事象は生じておらず、したがって、断片P4は、ビーズ820にカップリングしたままである。図8Bに示される操作Bでは、図8Aを参照して説明される操作Cを参照して説明されるような方法で、2つのニッキング事象が生じており、ポリメラーゼを使用するニックのその後の伸長が、それぞれのビーズにカップリングした両方の末端を置換し、したがって標的配列810を溶出することが見られ得る。図8Cに示される操作Cでは、例えば、Cas-gRNA RNPニッカーゼが断片P4のオフターゲット配列811にニックを形成し、したがって、対応するニッカーゼは、配列811に隣接する断片P4の対向する部分にニックを形成しなかったので、単一のニッキング事象のみが生じている。ポリメラーゼを使用するニックのその後の3’伸長は、それぞれのビーズにカップリングした末端の1つを置換するが、他方の末端はビーズにカップリングしたままであり、したがって溶出されないことが見られ得る。したがって、図8Bから、標的配列810のいずれかの側の対向する鎖上でニックが入っている断片は、ニックが入っていない断片又は一本鎖上でのみニックが入っている断片と比較して優先的に溶出され得ることが理解され得る。gRNAは、対応するニッカーゼが標的配列810の3’側であるそれぞれの位置でニックを生成し得る領域に結合するように設計され得、したがって、ポリメラーゼ伸長を使用して首尾よく溶出され得るが、標的配列の5’である位置で生成された任意のニックは、例えば、図8Gを参照して以下により詳細に記載されるような方法で、鋳型鎖上のニックを越えて伸長することができない場合があることに留意されたい。Cas-gRNA RNPニッカーゼは、任意選択的に異なる鎖を標的化し得ることに留意されたい。図は、gRNAとハイブリダイズした鎖を標的とする単一のニッカーゼを示し得るが、他の鎖にニックを入れる別のニッカーゼを使用してもよい。これは、ゲノム中の両方の鎖が使用され得るので、ニッキングのための配列の改善された選択を提供し得る。
図8Cは、図8A~8Bを参照して説明されるようなニッキング及び伸長操作の前にPCR増幅を受けた配列決定ライブラリーからdsDNA断片を濃縮するための例示的なプロセスフローを示す。そのようなPCR増幅は、例えば、Cas-gRNA RNPニッカーゼ結合及びニッキング工程が100%効率的でない場合、及び/又は比較的少数のdsDNA断片が存在する場合、例えば、dsDNAが無細胞DNA(cfDNA)配列決定ライブラリーから得られる場合、感度を増強するために、及び/又は品質管理を行い、小パネルから配列決定するのに十分な材料を増幅するために有用であり得る。図8Cに示される操作Aにおいて、増幅アダプターは、任意の適切な方法(例えば、図1J、3D、4A~4J、6A~6B、又は7A~7Gを参照して説明されるような方法)を介して添加される。増幅アダプターは、任意選択的に、図1J及び3Dを参照して説明されるような方法でY字型であり得、それぞれリード1及びリード2配列決定プライマーを提供し得る。非限定的な一例では、増幅アダプターは、二本鎖ME、ME’領域に加えて、A14及びB15増幅アダプター(A14’及びB15’である相補体)を含み得る。例えば、図8Cの操作Aに示されるように、dsDNA断片P4の第1の鎖の3’末端は、ME’配列を介してB15’増幅アダプターにカップリングされ得、その鎖の5’末端は、ME配列を介してA14増幅アダプターにカップリングされ得る。断片P4の第2の鎖の3’末端は、ME’配列を介してB15’増幅アダプターにカップリングされ得、その鎖の5’末端は、ME配列を介してA14増幅アダプターにカップリングされ得る。しかしながら、任意の他の配列及び/又は増幅アダプター(例えば、UMI、サンプルインデックス、クラスター増幅プライマーなど)が鎖に付加され得ることが理解されるであろう。
増幅アダプターを有するライブラリーの調製に続いて、図8Cの操作Bに示されるように、PCR増幅を行って、最初の断片P4の両方の鎖を別々に増幅する。この操作の間、又は終了時に、断片は、図8Aの操作Aを参照して説明されたものと同様の方法で、3’末端で官能化(例えば、ビオチン化)され得る。例示的に、非テンプレート付加(例えば、Taqポリメラーゼを使用する)又はターミナルトランスフェラーゼを使用して、図8Cの操作Bに示されるように、増幅された鎖の3’末端にビオチン化ヌクレオチドを付加し得る。その後の操作は、図8Aを参照して説明したのと同様に行うことができる。例えば、図8Cの操作Cに示されるように、ライブラリー全体は、図8Aの操作Bを参照して説明されるような方法で、断片P4の3’官能基を介して、1つ以上の基材(ビーズ820等)にカップリングされてもよく、Cas-gRNA RNPニッカーゼは、図8Aの操作Cを参照して説明されるような方法で、それぞれの標的配列810に3’隣接するニックを生成するために使用される。図8Cの操作Dに示されるように、次いで、Cas-gRNA RNPニッカーゼは、図8Aの操作Dを参照して説明されるような方法で除去され得、ポリメラーゼは、ニックから伸長させ、図8Aの操作Eを参照して説明されるような方法で標的配列810の溶出を引き起こすように添加され得る。次いで、溶出された標的配列は、例えば、PCR又はクラスター増幅を使用して更に増幅され得、その増幅の間に、UMI、サンプルインデックス、及び/又はクラスター化アダプターが、例えば、そのような配列が図8Cの操作Aの間に添加されなかった場合、任意選択的に添加され得る。サンプルインデックスの非限定的な例としては、Illumina i5及びi7インデックスが挙げられる。クラスター化アダプターの非限定的な例としては、P5及びP7プライマーが挙げられる。任意の適切な配列がカップリングされた溶出断片は、標的化配列決定アッセイの一部として任意の適切なプラットフォーム(例えば、Illuminaの合成による配列決定プラットフォーム)で配列決定され得る。
PCRを使用して、適切なアダプターを断片P4にカップリングし、Cas-gRNA媒介溶出の前に断片を増幅することができるが、PCRは必ずしもそのように使用される必要はないことが理解されるであろう。例えば、図8Dは、PCRフリーの断片化及びライゲーションされた配列決定ライブラリーからの断片を濃縮するためのプロセスフローを示す。ここで、図8Dの操作Aにおいて、断片P4が生成され、増幅アダプター(例えば、ME/ME’領域及び5’増幅アダプター)が、例えば、図1J、3D、4A~4J、6A~6B、又は7A~7Gを参照して説明されるような任意の適切な方法を介して付加される。図8Dに例示される非限定的な例において、3’官能基(ビオチンなど)は、例えば、ME/ME’及び単一のA14アダプターを含む単純化されたアダプターを使用して、アダプターライゲーションによって付加され得る。アダプターは、図8Dの操作C及びDを参照して以下に更に記載されるような方法でポリメラーゼ伸長を失速させ得るウラシル(U)を含むように改変され得る。図8Dの操作Bにおいて、3’官能基は、図8Aの操作Bを参照して説明されるような方法で、ビーズ820等の基材にカップリングされ、Cas-gRNA RNPニッカーゼは、図8Aの操作Cを参照して説明されるような方法で、それぞれの標的配列810に3’隣接するニックを生成するために使用される。図8Dの操作Cに示されるように、次いで、Cas-gRNA RNPニッカーゼは、図8Aの操作Dを参照して説明されるような方法で除去され得、ポリメラーゼは、ニックから伸長させ、図8Aの操作Eを参照して説明されるような方法で標的配列810の溶出を引き起こすように添加され得る。しかしながら、修飾されたアダプター(例えば、A14-U)内のウラシルは、そのウラシルの位置でポリメラーゼを失速させる。図8Dの操作Cに示されるように、第2の配列決定プライマー(例えば、B15)を含むテンプレートスイッチオリゴヌクレオチドは、失速した伸長産物がプライミングオフし、溶出された標的断片に3’増幅アダプターを付加することを可能にする。次いで、溶出された標的断片810は、任意選択的に本明細書の他の箇所に記載されているような方法で、クラスター増幅アダプター(例えば、P5及びP7)、UMI、及び/又はサンプルインデックスの付加を含めて、PCR増幅され得る。しかしながら、例えば、図8Dに示されるプロセスフローの操作A及びDにおいて完全配列決定/クラスター増幅アダプター及びサンプルインデックスを追加することによって、PCRを含まないプロセスフローが適切に行われ得ることが理解されるであろう。図8Dを参照して説明される選択された操作に関する更なる詳細については、「Methods for Increasing Yield of Sequencing Libraries」と題される、その全内容が参照により本明細書に組み込まれる国際公開第2021/252617号を参照されたい。
図8A~図8Dを参照して説明されるようなプロセスフローは、任意のタイプのライブラリー、機器、又はワークフローと共に使用するために適切に適合され得ることが理解されるであろう。図8Eは、Illumina Nexteraワークフローと共に使用するためのプロセスフローの非限定的な例を示す。ここで、サンプルライブラリーは、Nexteraシステムを使用して同時断片化及び5’アダプター付加を介して調製され得る。Nexteraシステムは、図8Aの操作Bを参照して説明されるような方法で基材(例えば、ビーズ820)に結合されてもよく、その結果、初期断片化事象を使用して断片P4を基材に結合することができる。図8Eの操作Aに示されるように、例えば、ビオチン等の3’官能基を介してビーズ820にカップリングされたNexteraライブラリーが生成されてもよい。いくつかの例では、ライブラリーは、A14アダプター及びB15アダプターなどのそれぞれの増幅アダプターを含むトランスポソームの混合物を使用して生成することができ、この場合、断片P4の一部(例えば、約半分)は、いずれかの末端にA14アダプター及びB15アダプターを含み得る(本明細書に示すように)。他の断片は、必ずしもA14及びB15アダプターの両方を含まなくてもよく、例えば、B15アダプターを欠くが2つのA14アダプターを含み得、又はA14アダプターを欠くが2つのB15アダプターを含み得る。
Nextera断片化プロセスの結果として、各断片P4は、約9塩基対長である3’末端とME領域との間のギャップを含み得る。図8Eの操作Bに示されるように、ギャップは、例えば、ポリメラーゼ及びリガーゼを使用する伸長ライゲーションによってシールされ得る。ニックのシーリングは、ポリメラーゼによる任意の非特異的伸長及び溶出を阻害し得ることに留意されたい。あるいは望ましくない伸長及びその後のTdT又はポリメラーゼ、及びジデオキシ塩基による溶出を阻害するために、末端塩基を添加してもよい。次いで、図8Aの操作Cを参照して説明されるような方法で、Cas-gRNA RNPニッカーゼを基材上の断片に適用して、図8Eの操作Cに示すような方法で、標的配列810に隣接する標的化ニックを作製することができる。次に、図8Aの操作Eを参照して説明されるような方法で、ポリメラーゼを加えて、図8Eの操作Dに示すような方法で標的配列を溶出させることができる。溶出後、更なる増幅アダプター及び/又はサンプルインデックスは、本明細書の他の箇所に記載されるような方法で、例えば、配列決定の前にPCR又はクラスター増幅を使用して、断片にカップリングされ得る。これに関して、2つのB15アダプター又は2つのA14アダプターを有する任意の断片P4は、そのようなPCR増幅の間に増幅され得ず、したがって配列決定され得ない。図8Dの操作Dを参照して説明されるようなテンプレートスイッチ機構を使用して、A14アダプター及びB15アダプターの両方を提供するようにアダプターを交換することによって、そのようなB15-B15断片及びA14-A14断片の損失を減らすことができ、その結果、そのような断片を、PCR又はクラスター増幅を使用して増幅し、続いて配列決定し得ることが理解されるであろう。
図8Fは、図8Aの操作E、図8Bの操作B、図8Cの操作D、図8Dの操作C、及び図8Eの操作Dを参照して説明されるようなニック伸長溶出操作のためのポリメラーゼのオプションを示す。図8Fの例Aでは、鎖置換ポリメラーゼの使用は、標的配列810からの3’官能化(例えば、3’ビオチン化)鎖の置換をもたらし、標的化溶出をもたらす。図8Fの例Bでは、5’エキソヌクレアーゼ活性を有するポリメラーゼの使用を含むニックトランスレーションアプローチが、3’官能化(例えば、3’ビオチン化)鎖の5’から3’への分解を引き起こし、標的配列810の標的溶出をもたらす。
図8Gは、標的配列の3’側であるニックの使用(操作A)を、標的配列の5’側であるニックの使用(操作B)と比較する。操作Aから理解され得るように、標的配列810の3’側である2つのニッキング事象は、基材、例えば、ビーズ820からの標的配列の溶出をもたらす。操作Bから理解され得るように、標的配列810の5’である2つのニッキング事象は、ポリメラーゼをニックにおいて失速させ、標的配列を基材、例えば、ビーズ820に結合したままにすることができる。
多数の分離技術が、図8A~8Gを参照して説明されるようなプロセスフローと適合性があり、記載されるようなビーズの磁気分離の使用に限定されないことに留意されたい。例えば、基材は、充填カラム又はフローセルなどのフローシステム内に提供され得る。標的断片は、そのようなシステムにおいてフローを使用して溶出され得る。
断片P4は、任意の適切なタグを含むように官能化されてもよく、基材は、断片P4を基材にプルダウンするための任意の適切なタグパートナーを含むように官能化されてもよいことが更に理解されるであろう。例えば、タグパートナーはSNAPタンパク質を含み得、タグはO-ベンジルグアニンを含み得る;タグパートナーはCLIPタンパク質を含み得、タグはO-ベンジルシトシンを含み得る;タグパートナーはSpyTagを含み得、タグはSpyCatcherを含み得る;タグパートナーはSpyCatcherを含み得、タグはSpyTagを含み得る;タグパートナーはビオチンを含み得、タグはストレプトアビジンを含み得る;タグパートナーはストレプトアビジンを含み得、タグはビオチンを含み得る;タグパートナーはNTAを含み得、タグはHisタグを含み得る;タグパートナーはHisタグを含み得、タグはNTAを含み得る;タグパートナーは、抗体(例えば抗FLAG抗体)を含み得、タグは、抗体が選択的である抗原(例えばFLAGタグ)を含み得る;タグパートナーは抗原(例えばFLAGタグ)を含み得、タグは、抗原に対して選択的な抗体(例えば抗FLAG抗体)を含み得る;又はタグパートナーは第1のオリゴヌクレオチドを含み得、タグは、第1のオリゴヌクレオチドに相補的であり、第1のオリゴヌクレオチドにハイブリダイズする第2のオリゴヌクレオチドを含み得る。タグパートナーは、任意の適切な結合を介して、例えば、共有結合を介して、又は非共有結合を介して基材にカップリングされ得る。同様に、タグはそれぞれ、任意の適切なカップリングを介して、例えば共有結合を介して、又は非共有結合を介して断片P4に3’カップリングされ得る。
図8A~図8Gを参照して説明されるような組成物及び操作は、任意の適切な方法又は状況で使用することができる。例えば、図8Hは、二本鎖ポリヌクレオチドの断片を生成する例示的な方法8000における操作のフローを示す。方法8000は、特定のポリヌクレオチドに対して行われる操作を説明し得るが、方法は、説明される方法で同時に操作され得るいくつかの異なるポリヌクレオチドを含む混合物に適用され得ることが理解されるであろう。いくつかの例では、二本鎖ポリヌクレオチドは、dsDNAを含み得、任意選択的にcfDNAを含み得る。
方法8000は、二本鎖ポリヌクレオチドを基材にカップリングすること(操作8001)を含み得る。例えば、図8Aの操作A、図8Cの操作B、図8Dの操作A、又は図8Eの操作Aを参照して説明されるような方法で、二本鎖ポリヌクレオチドの3’末端は、官能化され得る(例えば、タグ又はタグパートナーにカップリングされ得る)。更に、図8Aの操作B、図8Cの操作C、図8Dの操作B、又は図8Eの操作Aを参照して説明されるような方法で、二本鎖ポリヌクレオチドの3’官能化末端は、基材、例えば、二本鎖ポリヌクレオチドのタグ又はタグパートナーにカップリングするようになるタグパートナー又はタグにカップリングする基材にカップリングすることができる。図8A~8Gを参照して説明されるいくつかの例は、基材としてストレプトアビジンビーズ及び3’官能基としてビオチンを含み得るが、基材及びタグ/タグパートナー対の多くの他の例が容易に想定され得る。
図8Hに示される方法8000はまた、第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)ニッカーゼを、二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることを含み得る(操作8002)。第1の部分配列は、二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であってもよく、第2の部分配列は、二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側であってもよい。例えば、第1のCas-gRNA RNPニッカーゼ851のgRNAは、図8Aの操作C、図8Bの操作B、図8Cの操作C、図8Dの操作B、図8Eの操作C、図8Fの例A、図8Fの例B、及び図8Gの例Aを参照して説明されるような方法で、「fwd」3’位置で二本鎖ポリヌクレオチドP4の第1の鎖に選択的にカップリングされ得、第2のCas-gRNA RNPニッカーゼ852のgRNAは、「rev」3’位置で二本鎖ポリヌクレオチドP4の第2の鎖に選択的にカップリングされ得る。ニッカーゼは、標的配列の3’側にあると考えられ得る。上記のように、ニッカーゼは、gRNAがハイブリダイズした鎖又は反対の鎖のいずれかを標的とし得る。
図8Hに示される方法8000はまた、第1のCas-gRNA RNPニッカーゼを使用して第1の部分配列において第1の鎖を切断することと、第2のCas-gRNA RNPニッカーゼを使用して第2の部分配列において第2の鎖を切断することとを含み得る(操作8003)。例えば、第1のCas-gRNA RNPニッカーゼ851のニッカーゼは、図8Aの操作C、図8Bの操作B、図8Cの操作C、図8Dの操作B、図8Eの操作C、図8Fの例A、図8Fの例B、及び図8Gの例Aを参照して説明されるような方法で、そのニッカーゼのgRNAがカップリングされる部分配列によって規定される位置で二本鎖ポリヌクレオチドP4の第1の鎖に選択的にニックを入れることができ、第2のCas-gRNA RNPニッカーゼ852のニッカーゼは、そのニッカーゼのgRNAがカップリングされる部分配列によって規定される位置で二本鎖ポリヌクレオチドP4の第2の鎖に選択的にニックを入れることができる。得られたニッカーゼは、標的配列の3’側にあると考えられ得る。切断のそのような2つの事例は、同時に行われてもよく、又は互いに異なる時間に行われてもよい。例えば、第1鎖及び第2鎖CRISPRニッカーゼ複合体の大きなプールを、サンプルと一度にインキュベートすることができる。操作8002及び8003は、任意の適切なCas-gRNA RNPニッカーゼ、例示的に、第1の突然変異D10A及び第2の突然変異H840Aを有する化膿レンサ球菌(S.Pyogenes)Cas9を使用して行われ得ることが理解されるであろう。
方法8000はまた、ポリメラーゼを使用して、それぞれの切断部から第1及び第2の鎖を伸長させ、基材から標的配列を溶出すること(操作8004)を含み得る。例えば、Cas-gRNA RNPニッカーゼは、図8Aの操作D及びE、図8Bの操作B、図8Cの操作D、図8Dの操作C、図8Eの操作D、図8Fの例A、図8Fの例B、及び図8Gの例Aを参照して説明したような方法で、操作8003で生成されたニックの3’末端を露出させるために除去されてもよく、二本鎖である標的配列を3’末端から伸長させるために適切なポリメラーゼが加えられてもよい。そのような伸長は、基材にカップリングしたままである基材にカップリングした二本鎖ポリヌクレオチドの部分を置換し、標的配列を溶出する。したがって、標的配列は基材から遊離される。操作8004は、任意の適切なポリメラーゼを使用して行われ得ることが理解されるであろう。例えば、ポリメラーゼは、図8Fの実施例Aを参照して説明されるような鎖置換ポリメラーゼ、例示的にはVent又はBsuを含み得る。又は、例えば、ポリメラーゼは5’エキソヌクレアーゼ活性を有してもよく、例示的にはTaq、Bst、又はDNAポリメラーゼIである。
方法8000はまた、溶出された標的配列を配列決定すること(操作8005)を含み得る。そのような配列決定は、任意の適切な方法で、及び任意の適切な機器、例えばIllumina,Inc.から市販されている機器を使用して行われ得る。配列決定の前の任意の適切な時点で、標的配列は、例えば図8Cの操作A~D、図8Dの操作A~D、又は図8Eの操作A~Dを参照して説明したような方法で、増幅アダプターに適切に結合され得る。そのような増幅アダプターは、操作8001、8002、8003、及び8004の任意の適切な操作の前又は後に付加され得る。更に、配列決定前の任意の適切な時点で、標的配列は、例えば、PCR又はクラスター増幅を使用して増幅され得る。そのような増幅は、操作8001、8002、8003、及び8004のうちの任意の適切なものの前又は後に実行され得る。
Cas-gRNA RNPを使用した選択されたポリヌクレオチド断片への増幅アダプターのライゲーション
本明細書で提供されるいくつかの方法は、インタクトなdsDNA断片の標的化配列決定のための長く面倒なワークフローの問題を解決する。本開示から明らかなように、Cas-gRNA RNPは、ポリヌクレオチド、例えば、dsDNAにおける標的領域の迅速かつ特異的なハイブリダイゼーションを提供し得る。ここで図9A~9Fを参照して説明されるように、Cas-gRNA RNP及び増幅アダプターを含む複合体は、増幅アダプターを選択された断片にライゲーションするために使用され得、その結果、これらの断片は続いて増幅及び配列決定され得るが、他の断片はそのようなアダプターにライゲーションされることにならず、したがって増幅及び配列決定されない。したがって、選択された断片は、簡素化された方法で濃縮及び配列決定され得る。これは、例えば、無細胞DNA(cfDNA)を配列決定する際に、アダプターライゲーション中に二本鎖ポリヌクレオチドを保存及び濃縮することが望ましい場合がある用途において特に有用であり得るが、以前から知られている濃縮アプローチは、一本鎖ポリヌクレオチドを含み得る。追加的又は代替的に、更なる精度のために、cfDNA分子の両方の鎖を二本鎖UMIで標識することが有用であり得る。
いくつかの以前に公知のライゲーションアプローチは、二本鎖ポリヌクレオチドと適合し得るが、そのようなアプローチは、選択された断片の任意の濃縮を提供し得ない。例えば、図9Aは、増幅アダプターをdsDNAライブラリーの断片にライゲーションするための以前から知られている例示的な組成物及びプロセスフローにおける操作を概略的に示す。操作Aに示すように、dsDNAライブラリーを断片化することができる。そのような断片化は、例えば、cfDNAの場合、自然に起こり得るか、機械的若しくは酵素的に行われ得るか、又はRNAライブラリーから生成され得る。得られた複数の断片は、図9Aの操作Bに示すような方法で端部修復を使用して鈍らせることができる不均一な端部を有することができる。次いで、5’末端は、図9Aの操作Cに示されるような方法でリン酸化され得る。次いで、図9Aの操作Dに示すような方法で、Aテーリングを使用して非鋳型Aヌクレオチドを3’末端に付加する。次いで、図9Aの操作Eに示されるような方法で、アダプターライゲーションを使用して、Y字型(フォーク型)増幅アダプターを断片にカップリングさせ得る。アダプターは、PCR増幅後に両方の元の鎖の同定を可能にする配列を有し得る。図9Aの操作Fに示されるように、断片は、次いで、PCRを使用して増幅されてもよく、その間、サンプルインデックスが追加されてもよい。次いで、断片を増幅し、配列決定することができる。図9Aに示されるプロセスフローから、操作A中に存在する実質的に各dsDNA断片は、最終的に、それにライゲーションされた増幅アダプターを有し得、したがって、増幅及び配列決定され得ることが理解される。状況次第では、所与のサンプル内の実質的に全てのdsDNA断片の配列を得ることが望ましい場合があるが、他の状況では、断片の小さな選択されたサブセット、例えばcfDNAの断片のみを配列決定することが望ましい場合がある。
図9Aを参照して説明される以前から公知のプロセスフローと比較して、図9B~9Fは、Cas-gRNA RNPを使用して増幅アダプターを選択されたポリヌクレオチド断片にライゲーションするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。操作Aに示すように、dsDNAライブラリーを断片化することができる。そのような断片化は、例えば、cfDNAの場合、自然に起こり得るか、機械的若しくは酵素的に行われ得るか、又はRNAライブラリーから生成され得る。断片のいくつかは、濃縮及び検出することが所望されるそれぞれの標的配列を含み得るが、他の断片は、そのような配列を必ずしも含まなくてもよい。例えば、図9Aに示される断片P5は、標的配列910を含むが、他の断片は、他の標的配列を含み得、又はそのような標的配列を含まなくてもよい。
図9Aを参照して説明されたものと同様の方法で、得られた複数の断片は、図9Aの操作Bに示すような方法で端部修復を使用して鈍らせることができる不均一な端部を有することができる。次いで、5’末端は、図9Aの操作Cに示されるような方法でリン酸化され得る。次いで、図9Aの操作Dに示すような方法で、Aテーリングを使用して非鋳型Aヌクレオチドを3’末端に付加する。次いで、図9Cを参照して以下により詳細に記載されるような方法で、Y字型(フォーク状)増幅アダプターは、標的配列910を含む断片に選択的にカップリングされ得るが、そのようなアダプターは、図9Bの操作Eに示されるような方法で、その配列を欠く任意の断片に付加されない。アダプターは、PCR増幅後に両方の元の鎖の同定を可能にする配列を有し得る。例えば、アダプターは二本鎖UMIを含み得る。次いで、図9Bの操作Fに示すように、アダプターがライゲーションされた断片は、PCRを使用して増幅されてもよく、その間にサンプルインデックスが追加されてもよいが、アダプターがライゲーションされなかった断片は増幅されない。次いで、増幅された断片は配列決定され得るが、アダプターがライゲーションされなかった断片は配列決定されない。図9Aに示されるプロセスフローから、実質的に、標的配列910を含む操作Aにおいて存在するポリヌクレオチド断片のみが、最終的にそれにライゲーションされた増幅アダプターを有し得、したがって、増幅及び配列決定され得ることが理解される。したがって、図9Bに示されるプロセスフローは、所与のサンプル内の断片のサブセット、例えばcfDNAの断片を選択的に配列決定する合理化された様式を提供する。
図9Cは、アダプターが、標的配列910を含む断片P6に選択的にカップリングされ得る方法に関する更なる詳細を概略的に示す。図9Cに示されるように、操作Aにおいて、断片P6を、リンカー953を介して増幅アダプター952にカップリングした酵素的に不活性化されたCas-gRNA RNP 951をそれぞれ含む第1及び第2の複合体950、950’と接触させることができる。例えば、複数の複合体950、950’を、断片化されたAテールサンプルdsDNAと混合することができる。Cas-gRNA RNP951の各々のgRNAは、dsDNAのそれぞれの一本鎖内の特定の領域(部分配列)を標的とすることができ、この領域は、Cas-gRNA RNPが、互いにオフセットされ、かつ濃縮することが望まれる二本鎖標的領域910の両側にある位置でそれぞれの鎖にハイブリダイズするように互い違いにされ得る。例えば、図9Cの操作Aに示されるような方法で、複合体950のCas-gRNA RNP 951のgRNAは、標的配列910のフォワード(「fwd」)である領域を標的としてもよく、複合体950’のCas-gRNA RNP 951のgRNAは、標的配列910のリバース(「rev」)である領域を標的としてもよい。したがって、第1及び第2の複合体950、950’のガイド配列は、順方向及び逆方向において標的配列910に「隣接する」と考えられ得る。複合体の対応するCas-gRNA RNPニッカーゼが、dsDNA断片内の特定の配列に隣接する位置でそれぞれの鎖でハイブリダイズするように、任意の適切な数のgRNAが設計され得ることが理解されるであろう。例えば、複数の異なるgRNA(例えば、1000~100,000個のgRNA、又は100,000個を超えるgRNA)を使用して、サンプル内の目的の多くの異なる配列を同時に濃縮することができる。gRNAは、必ずしも所与の標的配列910に「隣接する」必要はなく、むしろ標的配列当たり少なくとも2つのガイドが所与の断片P6内の対向する鎖に結合し得ることに留意されたい。gRNA及び対応する複合体は、そのようなgRNAが標的とする配列を欠く任意の断片に結合しなくてもよい。各断片が各末端にアダプターを受容するために少なくとも2つのCas-gRNA RNPを使用することは、特異性に役立つと予想されることに留意されたい。
いくつかの例では、複合体950、950’のアダプター952は、図3D、図8C、又は図8Dを参照して説明されるものと同様のY字型アダプター対であり得るか、又はそれを含み得る。任意選択的に、アダプターは、図9Dを参照して説明されるような方法でUMIを含み得る。追加的又は代替的に、アダプターは、断片上の任意のAテールにハイブリダイズし得る不対Tsを含み得る。これに関して、Cas-gRNA RNP 951の断片のそれぞれの部分配列への特異的結合は、比較的迅速かつ強力であることが予想され、したがって、断片のAテールへのT塩基アダプター対合の非特異的結合よりも有利であることに留意されたい。この選択性は、Cas-gRNA RNP 951をそれぞれの部分配列に高温でハイブリダイズさせることによって高められ得る。更に、複合体950、950’の濃度を低下させることによって望ましくないバックグラウンドライゲーションを減少させることができ、標準的なライゲーション条件と比較して有意に減少させることができる。例えば、これまでに公知の方法では、アダプターは、通常、テンプレートに対して大過剰(例えば、テンプレートに対して10~1000倍)であるが、本実施例では、アダプター952は、テンプレートよりも有意に低い濃度(例えば、テンプレートに対して0.001~0.1倍)で提供され得、その結果、全断片の小部分のみが標的化されるので、低いバックグラウンドを提供する。
図9Cに示される操作Aから、第1及び第2の複合体950、950’のgRNAが所与の断片のそれぞれの部分配列にハイブリダイズする場合、それらの複合体のアダプター952は、その断片の末端に近接することが更に理解されるであろう。したがって、図9Cの操作Bに示すように、複合体及び断片が操作B中に接触するリガーゼ(具体的には図示せず)を使用して、第1の複合体950の増幅アダプター952を断片P6の第1の末端にライゲーションすることができ、第2の複合体950’の増幅アダプター952を断片P6の第2の末端にライゲーションすることができる。リガーゼは更に、アダプターと断片の末端との間の結合をシールすることができる。非限定的な一例では、リガーゼは、T4 DNAリガーゼを含み得る。Cas-gRNA RNP 951のgRNAが特異的である部分配列に隣接する標的配列を含む断片P6のそれぞれの末端へのアダプター952のライゲーションに続いて、Cas-gRNA RNP 951を加熱殺菌して除去するか、又はプロテイナーゼK、SDS、若しくはプロテアーゼなどの適切な試薬を使用して除去してもよい。任意の残りのリンカー953は、アダプター952にカップリングしたままであり得、したがって、図9Cに示されるような方法で、標的配列910を含む断片にカップリングしたままであり得る。次いで、アダプター(単数又は複数)952にカップリングした断片は、本明細書中の他の箇所に記載されるような方法で増幅及び配列決定され得る。標的配列910を欠く任意の断片は、アダプター952にカップリングされなくてもよく、したがって増幅及び配列決定されなくてもよい。したがって、標的配列910を含む断片が濃縮される。
図9Cに示された操作は、任意の適切な順序で行われ得ることが理解されるであろう。いくつかの例では、Cas-gRNA RNP 951は、それぞれの部分配列にハイブリダイズされ、したがって、リガーゼが添加され、それらのアダプターをその断片の末端にライゲーションするために使用される前に行われる別個の操作において、アダプター952を対応する断片P6の末端に近接させる。他の例では、Cas-gRNA RNP 951は、リガーゼがそれらのアダプターをその断片の末端に比較的迅速にライゲーションし得るように、リガーゼの存在下でそれぞれの部分配列にハイブリダイズする。あるいはそのような例では、ライゲーション操作をCas-gRNA RNPハイブリダイゼーション操作から分離するための「スイッチ」として一定期間後にATPを添加してもよく、その結果、ライゲーションが行われる前に(新たに添加されたATPによって活性化されるリガーゼの存在下で)ハイブリダイゼーションが実質的に行われる得る(不活性リガーゼの存在下で)。
追加的又は代替的に、いくつかの例では、標的配列910を含む断片は、図8A~8Hを参照して説明されたものと同様の方法で、基材に選択的にカップリングされ得る。例えば、gRNA、Cas-gRNA RNP 951、又はアダプター952などの複合体950、950’の任意の適切な部分は、官能化され得、次いで、そのような官能化を介して基材にカップリングされ得る。例えば、複合体は、タグ又はタグパートナーにカップリングされ得、基材は、複合体を基材にカップリングするように反応するタグパートナー又はタグにカップリングされ得る。標的配列910を含まず、したがって複合体950、950’に結合しない任意の断片もまた、基材にカップリングせず(例えば、基材においてタグパートナー又はタグと反応するタグ又はタグパートナーを欠いているため)、洗い流され得る。例示的に、タグパートナーはSNAPタンパク質を含み得、タグはO-ベンジルグアニンを含み得る;タグパートナーはCLIPタンパク質を含み得、タグはO-ベンジルシトシンを含み得る;タグパートナーはSpyTagを含み得、タグはSpyCatcherを含み得る;タグパートナーはSpyCatcherを含み得、タグはSpyTagを含み得る;タグパートナーはビオチンを含み得、タグはストレプトアビジンを含み得る;タグパートナーはストレプトアビジンを含み得、タグはビオチンを含み得る;タグパートナーはNTAを含み得、タグはHisタグを含み得る;タグパートナーはHisタグを含み得、タグはNTAを含み得る;タグパートナーは、抗体(例えば抗FLAG抗体)を含み得、タグは、抗体が選択的である抗原(例えばFLAGタグ)を含み得る;タグパートナーは抗原(例えばFLAGタグ)を含み得、タグは、抗原に対して選択的な抗体(例えば抗FLAG抗体)を含み得る;又はタグパートナーは第1のオリゴヌクレオチドを含み得、タグは、第1のオリゴヌクレオチドに相補的であり、第1のオリゴヌクレオチドにハイブリダイズする第2のオリゴヌクレオチドを含み得る。タグパートナーは、任意の適切な結合を介して、例えば、共有結合を介して、又は非共有結合を介して基材にカップリングされ得る。同様に、タグはそれぞれ、任意の適切なカップリングを介して、例えば共有結合を介して、又は非共有結合を介して複合体950、950’にカップリングされ得る。
複合体950、950’は、任意の適切な方法で調製され得ることが理解されるであろう。図9Bを参照して上述したように、複合体950、950’は、特定の部分配列を標的とするgRNAを含み、リンカー953を介してアダプター952にカップリングされているCas-gRNA RNP 951を含み得る。図9Dは、複合体950の例示的な構成を概略的に示す。図9Dに示される例A及び例Bの両方において、Cas-gRNA 951のCasは、gRNAが相補的である配列において標的ポリヌクレオチドを切断しないように操作され得、例えば、dCas9を含み得る。図9Dに示される例A及び例Bの両方において、Y字型増幅アダプター952は、図8A~8Hを参照して説明されたものと同様の方法で、リード1(A14)アダプター及びリード2(B15)アダプター並びにME/ME’領域を含み得る。任意選択的に、アダプター952は、断片のAテールにハイブリダイズするための不対Tを含み得る。あるいはアダプター952を平滑末端にライゲーションしてもよい。追加的又は代替的に、アダプター952は、図9Dに示されるような二本鎖二重鎖UMIを含み得る。図9Dに示される例Aでは、アダプター952は、リンカー953、例えば、タンパク質ベースのリンカーを介して、Cas-gRNA RNP 951のCasタンパク質にコンジュゲートされる。例えば、Casタンパク質及びテザー953は、本明細書の他の箇所に記載されるような方法で、又はAird et al.,「Increasing Cas-9 mediated homology-directed repair efficiency through covalent tethering of DNA repair template」,Communications Biology 1,54(2018),doi.org/10.1038/s42003-018-0054-2に記載されるような方法で、共発現され得るか、又は発現後に互いに適切にカップリングされ得る。図9Dに示される例Bでは、アダプター952は、本明細書の他の箇所に記載されるような方法で、リンカー953、例えば、オリゴヌクレオチドベースのリンカーを介して、Cas-gRNA RNP 951のgRNAにカップリングされる。しかしながら、リンカー953は、任意の適切なタンパク質、ポリヌクレオチド、又はポリマー(例えば、PEG)を含み得ることが理解されるであろう。
所望の標的配列910を含む断片を濃縮するために、複数の異なる部分配列が使用され得ることが更に理解されるであろう。例えば、図9Eの操作Aは、複数のgRNA(「ガイド」)が、断片P6の標的配列910の上及びその周囲にタイル状に配置されるように設計され得る方法を示す。断片内のそれぞれの部分配列に結合すると、そのようなgRNAを含む複合体950は、図9Eの操作Bに示されるような方法で、標的配列910の一部又は全部にわたってその断片を飽和させ得る。この戦略は、複合体950をその配列にカップリングさせる可能性を高め、したがって、それぞれのアダプター952をそれらの末端へのライゲーションのためにその断片の末端に十分に近接して配置することによって、ランダムに断片化された及び/又は標的配列910内に切断を含み得る断片を濃縮するのに役立ち得、その結果、断片はその後増幅され、配列決定され得る。例えば、リンカー953の長さに基づいて、アダプター952は、それぞれの複合体のCas-gRNA RNPがカップリングされる部分配列の規定された数の塩基対内、例えば、約5~30塩基対、又は約10~25塩基対、又は約15~20塩基対内にある断片末端にライゲーションされ得る。
図9Fは、二本鎖ポリヌクレオチドの断片を生成する例示的な方法9000における操作のフローを示す。図9Fに示される方法9000は、第1及び第2の複合体を二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせること(操作9001)を含み得る。第1及び第2の複合体の各々は、増幅アダプターにカップリングしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み得る。例えば、図9Cの操作Aを参照して説明されるような方法で、複合体950、950’はそれぞれ、増幅アダプター952にカップリングしたCas-gRNA RNP 951を含み得る。非限定的な例では、Cas-gRNA RNPはdCas 9を含み得る。
任意選択的に、各複合体は、Cas-gRNA RNPを増幅アダプターにカップリングするリンカー953を更に含み得る。いくつかの例では、複合体は、図9Dを参照して説明されるような方法で調製されてもよい。例えば、リンカーは、Cas-gRNA RNPのCasにカップリングされ得る。又は、例えば、リンカーは、gRNAにカップリングされ得る。いくつかの例では、リンカーは、タンパク質、ポリヌクレオチド、又はポリマーを含み得る。いくつかの例では、増幅アダプターはY字型である。追加的又は代替的に、増幅アダプターはそれぞれ、固有の分子識別子を含み得る。追加的又は代替的に、方法9000は、ハイブリダイズの前に二本鎖ポリヌクレオチドをAテーリングすることを更に含み得、増幅アダプターは、Aテールとハイブリダイズするための不対Tを含む。あるいは増幅アダプターを平滑末端にライゲーションしてもよい。
複合体950、950’のgRNAは、増幅アダプターがそのような末端にライゲーションされ得るポリヌクレオチドのそれぞれの末端に十分に近い位置で、二本鎖ポリヌクレオチドP6のそれぞれの鎖上の部分配列に、例えば、隣接する標的配列910にハイブリダイズするように選択され得る。いくつかの例では、第1の部分配列は、二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、第2の部分配列は、二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側である。
図9Fに示される方法9000は、ハイブリダイズされた第1及び第2の複合体の増幅アダプターを、二本鎖ポリヌクレオチドの第1及び第2の末端にそれぞれライゲーションすること(操作9002)を更に含み得る。例えば、図9Cの操作Bを参照して説明されるような方法で、複合体950、950’のそれぞれの部分配列へのハイブリダイゼーションは、対応する増幅アダプター952を、ポリヌクレオチドのそれぞれの末端に十分に近接させ、そこにライゲーションさせる。ライゲーションは、リガーゼを使用することを含み得る。図9Cの操作Bを参照して説明されるような方法で、リガーゼは、任意選択的に、ハイブリダイズ中に存在し得る。リガーゼは、ハイブリダイズ中に不活性であってもよく、ATPを使用してライゲーションのために活性化されてもよい。あるいはリガーゼは、ハイブリダイズ後に加えてもよい。
図9Fに図示される方法9000は、例えば、図9Cの操作Cを参照して説明されるような方法で、二本鎖ポリヌクレオチドから第1及び第2の複合体のCas-gRNA RNPを除去すること(操作9003)を更に含み得る。複合体がリンカー953を含む例では、リンカーは、例えば、図9Cを参照して説明されるような方法で、Cas-gRNA RNPが除去されるとき、任意選択的に増幅アダプターにカップリングしたままであってもよい。
図9Fに示される方法9000は、例えば、本明細書の他の箇所に記載されるような方法で、増幅アダプターがライゲーションされた二本鎖ポリヌクレオチドを配列決定すること(操作9004)を含み得る。
5’オーバーハングを有する断片の生成、及びそれへのアダプターのカップリング
いくつかの例では、本明細書で提供される方法及び組成物は、標的化増幅及び/又は標的化配列決定のための長く面倒なワークフローの問題を解決する。本開示から明らかであるように、Cas-gRNA RNPは、標的濃縮方法の一部としてポリヌクレオチドの断片を生成するために使用され得る。増幅アダプターは、本明細書の他の箇所に記載されているような方法で、いくつかの追加の工程を使用して、例えば末端修復、Aテーリング、及びアダプターライゲーションを使用して付加され得る。ここで図10A~10Cを参照して説明されるように、Cas-gRNA RNPを使用して、5’オーバーハングを有する断片を生成することができ、この断片に、5’オーバーハングも有する増幅アダプターを、比較的少ない単純な工程で容易にライゲーションすることができる。本明細書で提供されるように、断片化による迅速なCas-gRNA RNPベースの濃縮と合理化されたアダプター付加との組み合わせは、標的配列決定用途のためのより迅速かつより容易な完全なワークフローを提供する。特に、特定のタイプのCas-gRNA RNPを使用して、末端修復又はAテーリングを必要とせずに、アダプターライゲーションの準備ができている断片を生成することができる。
図10A及び図10Cは、Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。最初に図10Aを参照すると、操作Aにおいて、ポリヌクレオチドP8は、濃縮し、増幅し、配列決定することが望ましい標的配列1010を含み得る。例示的に、標的配列1010は、約150~600塩基対長、又は本明細書に例示されるような任意の他の長さであり得る。本明細書の他の箇所で提供されるものと同様の方法で、操作Bにおいて、ポリヌクレオチドP8は、標的配列1010に隣接するポリヌクレオチドP8中の第1の(「fwd」)配列及び第2の(「rev」)配列に特異的にハイブリダイズするガイドRNA配列を有する第1のCas-gRNA RNP 1051及び第2のCas-gRNA RNP 1051’と接触させられ得る。第1及び第2のCas-gRNA RNP1051、1051’はそれぞれ、ポリヌクレオチドの第1及び第2の配列を切断して、標的配列を間に持つ第1及び第2の末端を有する断片を生成するためのものであり得る。例えば、図10Aの操作Cに示すように、第1のCas-gRNA RNP 1051は、ポリヌクレオチドP8中の第1の配列(「fwd」)にハイブリダイズしてもよく、第2のCas-gRNA RNP 1051’は、ポリヌクレオチド中の第2の配列(「rev」)にハイブリダイズしてもよい。本明細書の他の箇所に記載されるような方法で、第1及び第2のCas-gRNA RNP 1051、1051’は、標的配列1010に隣接する位置でポリヌクレオチドP8を切断して、標的配列1010を含む断片を生成してもよい。任意選択的に、図10Bを参照して説明されるような方法で、操作Cにおいて生成される断片の第1の末端は、任意選択的に、少なくとも1つの塩基の第1の5’オーバーハングを有し得、断片の第2の末端は、任意選択的に、少なくとも1つの塩基の第2の5’オーバーハングを有し得る。すなわち、例えば、図10Bを参照して説明されるような、そのようなオーバーハングを生成する特定のタイプのCas-gRNA RNPが任意選択的に使用されてもよい。
図10Aの操作Dに示されるように、そして図10Bを参照して以下に記載される方法で、増幅アダプター(例えば、Y字型アダプターにおけるA14配列及びB15配列)は、断片の第1の末端及び第2の末端にライゲーションされ得る。任意選択的に、図10Bを参照して説明されるような方法で、第1の増幅アダプターは、任意選択的に、断片の第1の末端における5’オーバーハングに相補的な5’オーバーハングを有し得、第2の増幅アダプターは、断片の第2の末端における5’オーバーハングに相補的な5’オーバーハングを有し得る。図10Aの操作Eに示すように、アダプターがカップリングされた断片は、サンプルインデックス(i7及びその相補体)並びに配列決定アダプター(例えば、P5及びP7アダプター並びにその相補体)を付加するように増幅され得る(例えば、PCRを使用する)。増幅中、各断片は、標的領域の「上部」及び「下部」の鎖が分岐アダプター構造のライゲーションに起因して異なる配向を生成することから、双方向シーケンシングリードで使用するための双方向アンプリコンを生成する。これは、2つのシーケンシングリードが、標的配列1010のいずれかの末端から行われ得ることを意味し、追加のカバレッジを提供する。増幅はまた、多重化配列決定における使用のために、更なるクラスター化配列(例えば、P5、P7)及びサンプルインデックス配列(例えば、i5、i7)を加える。図10A~10Bに示されるアダプター配列(例えば、A14、B15、ME)は、Illumina配列決定に使用され得る例であるが、所望に応じて任意の他の適切な配列に切り替えられ得る。次いで、増幅及び配列決定アダプターがカップリングされた、得られた濃縮断片を配列決定して、標的配列1010を同定することができる。
単一のポリヌクレオチドP8並びに対応する第1及び第2のCas-gRNA RNP 1051、1051’が図10Aに示されているが、このアプローチは、例えば、複数の異なるポリヌクレオチドを、第1及び第2の複数のCas-gRNA RNPと、それらのポリヌクレオチドを有する標的配列に隣接するポリヌクレオチドのうちの選択されたものにおける第1又は第2の配列に特異的にハイブリダイズするそれぞれのガイドRNA配列と接触させることによって、本明細書の他の箇所に提供されるような方法で容易にスケーリングされ得ることが理解されるであろう。
図10Bは、Cas-gRNA RNPを使用して5’オーバーハングを有する断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。図10Bの操作Aで図示される組成物では、第1のCas-gRNA RNP 1051は、ポリヌクレオチドP8中の第1の配列にハイブリダイズされ、第2のCas-gRNA RNP 1051’は、第1の配列から少なくとも標的配列1010だけ離間しているポリヌクレオチド中の第2の配列にハイブリダイズされる。第1のCas-gRNA RNPは、第1の鎖上のポリヌクレオチドP8を部位1011で切断し、部位1011から5’方向に少なくとも1塩基、例えば、2~5塩基、又は約5塩基オフセットされた部位1012で第2の鎖上のポリヌクレオチドP8を切断するように構成及び使用され得る。同様に、第2のCas-gRNA 1051’は、第1の鎖上のポリヌクレオチドP8を部位1011’で切断し、部位1011’から5’方向に少なくとも1塩基、例えば、2~5塩基、又は約5塩基オフセットされた第2の鎖上の部位1012’で切断するように構成され、使用され得る。Cas-gRNA RNP 1051、1051’は、dsDNA切断後に少なくとも1つの塩基の一本鎖5’オーバーハング領域を残す任意の適切なCas-gRNA RNPを含み得る。例示的にCasは、Cas12a、例えば、Cas12a(Cpf1又はC2c1)若しくはFnCas12a、又はTeng et al.,「Enhanced mammalian genome editing by new Cas12a orthologs with optimized crRNA scaffolds」,Genome Biology 20:15(2019)(その全内容が参照により本明細書に組み込まれる)に記載されているようなCas12aオルソログを含み得る。
図10Bの操作Bに示される組成物において、操作Aによって生成された断片1050の第1の末端は、少なくとも1塩基の第1の5’オーバーハング1015を有し得、断片の第2の末端は、少なくとも1塩基の第2の5’オーバーハング1016を有し得る。例えば、第1及び第2の5’オーバーハングは各々、約2~5塩基長、例示的には約5塩基長であり得る。オーバーハングは、必ずしもそうである必要はないが、互いに同じ長さであってもよい。断片の第1の末端において、オーバーハング1015を含む鎖は5’リン酸基を含み得、他方の鎖は3’OH基を含み得る。同様に、断片の第2の末端において、オーバーハング1016を含む鎖は5’リン酸基を含み得、他方の鎖は3’OH基を含み得る。第1及び第2の5’オーバーハング1015、1016は、例えば、第1及び第2のCas-gRNA RNP 1051、1051’のgRNAがそれぞれハイブリダイズするポリヌクレオチドP8中の特定の配列の結果として、互いに異なる配列を有し得る。
図10Bの操作Cに示される組成物において、断片1050は、5’オーバーハング1015、1016にそれぞれ相補的であるそれぞれの5’オーバーハング1065、1066を含むアダプター1060、1060’と接触させられる。5’オーバーハング1065、1066は、互いに同じ長さを有してもよく、又は互いに異なる長さを有してもよい。図10Bに示される非限定的な例において、「fwd」アダプター1060の5’オーバーハング1065は、断片1050の5’オーバーハング1015中の複数の塩基に相補的な複数の塩基を含み得るか、又は本質的にそれらからなり得る。5’オーバーハング1065は、5’オーバーハング1015と同じ長さを有してもよく、例えば、約2~5塩基長であってもよく、例えば、約5塩基長であってもよい。「rev」アダプター1060の5’オーバーハング1066は、断片1050の複数の塩基5’オーバーハング1016に相補的な複数の塩基を含み得るか、又は本質的にそれらからなり得る。5’オーバーハング1066は、5’オーバーハング1016と同じ長さを有してもよく、例えば、約2~5塩基長であってもよく、例えば、約5塩基長であってもよい。アダプター1060、1060’は、例えば、本明細書の他の場所に記載されるような、任意の他の適切な配列を含み得る。例えば、各アダプター1060、1060’は、任意選択のUMIを有するY字型アダプター対を含み得る。図10Bに示す非限定的な例では、アダプター1060、1060’は、フォワード増幅アダプター(例えば、A14、A14’)、リバース増幅アダプター(例えば、B15、B15’)を含み、任意選択的にME/ME’配列及び/又はUMI/UMI’配列を含み得る。
断片1050の第1及び第2の5’オーバーハング1015、1016は、互いに異なる配列を有し得るので、アダプター1060、1060’のオーバーハング1065、1066も同様に、互いに異なり、それぞれの断片オーバーハング1015、1016に相補的な配列を有し得る。例えば、増幅アダプター1060は、第1の5’オーバーハング1015に相補的であり、第2の5’オーバーハング1016に相補的でない5’オーバーハング1065を有し得、増幅アダプター1060’は、第2の5’オーバーハング1016に相補的であり、第1の5’オーバーハング1015に相補的でない5’オーバーハングを有し得る。したがって、増幅アダプター1060は、5’オーバーハング1015に特異的にハイブリダイズしてもよく、増幅アダプター1060’は、5’オーバーハング1016に特異的にハイブリダイズしてもよい。例示的に、5’オーバーハング1015は、5’オーバーハング1065の5塩基配列GCTGAがハイブリダイズすることができる5塩基配列CGACTを含み得、5’オーバーハング1016は、オーバーハング1066の5塩基配列AACGTがハイブリダイズすることができる5塩基配列TTGCAを含み得る。これらの5塩基配列は、純粋に例示的であることが意図されることが理解されるであろう。
アダプター1060、1060’は、任意の適切な方法で断片1050にライゲーションされて、図10Bの操作Dに示されるような、アダプターがカップリングされた断片を形成し得る。例えば、図10Bの操作Cで示される組成物は、第1の増幅アダプター1060を断片1050の第1の末端にライゲーションするため、及び第2の増幅アダプター1060’を断片1050の第2の末端にライゲーションするための少なくとも1つのリガーゼを含み得る。非限定的な一例では、リガーゼは、T4 DNAリガーゼを含み得るが、他の適切なリガーゼが使用され得ることが理解されるであろう。そのようなライゲーションに続いて、図10Bの操作Eに示すように、アダプターがカップリングされた断片は、サンプルインデックス(i7及びその相補体)並びに配列決定アダプター(例えば、P5及びP7アダプター並びにその相補体)を付加するように増幅され得る(例えば、PCRを使用する)。次いで、増幅及び配列決定アダプターがカップリングされた、得られた濃縮断片を配列決定して、標的配列1010を同定することができる。
単一のポリヌクレオチドP8、対応する第1及び第2のCas-gRNA RNP 1051、1051’、及び対応するアダプター1060、1060’が図10Bに示されているが、このアプローチは、本明細書の他の箇所で提供されるような方法で容易にスケーリングされ得ることが理解されるであろう。例えば、図10Bを参照して説明された操作Aは、複数のポリヌクレオチド断片を生成するために使用され得る。図10Bの操作Bに示すように、断片の各々は、標的配列を間に持つ第1及び第2の末端を有してもよく、第1の末端は少なくとも1つの塩基の第1の5’オーバーハングを有し、第2の末端は少なくとも1つの塩基の第2の5’オーバーハングを有する。第1及び第2の5’オーバーハングは、互いに、かつ他の断片の第1及び第2の5’オーバーハングとは異なる配列を有し得る。複数の断片は、図10Bの操作Cを参照して説明されるような方法で、複数の第1の増幅アダプター及び複数の第2の増幅アダプターと接触させられ得る。第1の増幅アダプターの各々は、対応する断片の第1の5’オーバーハングに相補的であり、その断片の第2の5’オーバーハングに相補的でなく、他の断片の第1又は第2の5’オーバーハングに相補的でない第3の5’オーバーハングを有し得る。第2の増幅アダプターの各々は、対応する断片の第2の5’オーバーハングに相補的であり、その断片の第1の5’オーバーハングに相補的でなく、他の断片の第1又は第2の5’オーバーハングに相補的でない第4の5’オーバーハングを有し得る。増幅アダプターに関する「第3」又は「第4」の5’オーバーハングという用語の使用は、増幅アダプターのいずれかが3つ又は4つの5’オーバーハングを有することを示唆するのではなく、これらのそれぞれのオーバーハングを断片の第1及び第2のオーバーハングから区別するのを助けることを意図している。リガーゼは更に、例えば、図10Bの操作Dを参照して説明されるような方法で、第1及び第3の5’オーバーハングが相補的である第1の末端に第1の増幅アダプターをライゲーションするために、並びに第2及び第4の5’オーバーハングが相補的である第2の末端に第2の増幅アダプターをライゲーションするために使用され得る。
図10Cは、ポリヌクレオチドの断片を生成する例示的な方法10000における操作のフローを示す。方法10000は、第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)をポリヌクレオチド中の第1の配列にハイブリダイズさせること(操作10001)を含み得、第2のCas-gRNA RNPを、第1の配列から少なくとも標的配列だけ離間しているポリヌクレオチド中の第2の配列にハイブリダイズさせること(操作10002)を含み得る。例えば、図10Aの操作C及び図10Bの操作Aを参照して説明されるような方法で、第1及び第2のCas-gRNA RNPは、標的配列1010に隣接するように選択され得る。操作10001及び10002は、互いに同時に実行され得ることに留意されたい。方法10000はまた、第1及び第2の配列を第1及び第2のCas-gRNA RNPで切断して、第1及び第2の末端並びに標的配列を間に持つ断片を生成することを含み得、第1の末端は少なくとも1つの塩基の第1の5’オーバーハングを有し、第2の末端は少なくとも1つの塩基の第2の5’オーバーハングを有する(操作10003)。例えば、CasはCas12aを含み得る。図10Bを参照して説明されるような方法で、相補的5’オーバーハングを有する第1の増幅アダプターは、断片の第1の末端にライゲーションされてもよく、相補的5’オーバーハングを有する第2の増幅アダプターは、断片の第2の末端にライゲーションされてもよい。
したがって、任意の適切な数のポリヌクレオチド中の標的配列は、Cas-gRNA RNPを使用して、目的の標的配列に特異的に隣接し、5’オーバーハングを有する断片を生成し、次いで、断片が選択的に増幅され得るように、相補的な5’オーバーハングを有する増幅アダプターを断片のオーバーハングに特異的にカップリングさせるプロセスによって濃縮され得ることが理解されるであろう。2つの特異性の層(Cas-gRNA RNPを介して、及び増幅アダプター上の相補的5’オーバーハングライゲーションを介して)は、特に高レベルの濃縮を提供することができ、これは、得られた断片を配列決定する場合に有用であり得る。
アダプター及びポリメラーゼ伸長を含む3’オーバーハングを有する断片の生成
いくつかの例では、本明細書で提供される方法及び組成物は、標的化増幅及び/又は標的化配列決定のための長く面倒なワークフローの問題を解決する。本開示から明らかであるように、Cas-gRNA RNPは、標的濃縮方法の一部としてポリヌクレオチドの断片を生成するために使用され得る。増幅アダプターは、本明細書の他の箇所に記載されているような方法で、いくつかの追加の工程を使用して、例えば末端修復、Aテーリング、及びアダプターライゲーションを使用して付加され得る。ここで図11A~11Gを参照して説明されるように、gRNAがプライマー結合部位及び増幅アダプター部位を含む修飾gRNAを含むCas-gRNA RNPを使用して、増幅アダプターを含む3’オーバーハングを有する断片を生成してもよい。本明細書で提供されるように、断片化による迅速なCas-gRNA RNPベースの濃縮と合理化されたアダプター付加との組み合わせは、標的配列決定用途のためのより迅速かつより容易な完全なワークフローを提供する。特に、Cas-gRNA RNPは、末端修復、A-テーリング、又はアダプターのフルセットのライゲーションを必要とせずに、増幅に必要なアダプターの少なくともサブセットを含む断片を生成するために使用され得る。
図11A~11Gは、Cas-gRNA RNPを使用して断片を生成し、それにアダプターをカップリングするための例示的な組成物及びプロセスフローにおける操作を概略的に示す。まず図11Aを参照すると、操作Aにおいて、プライマー結合部位1101、増幅アダプター部位1102、及びCRISPRプロトスペーサー1103を含む少なくとも1つのgRNA 1100が提供される。図11Aに示される非限定的な例では、増幅アダプター部位1102は、プライマー1101とCRISPRプロトスペーサー1103との間に位置する。プライマー結合部位1101は、例えば、プライマー結合部位及びCRISPRプロトスペーサーが、本明細書でより詳細に記載されるような方法でポリヌクレオチドの相補鎖にハイブリダイズし得るように、CRISPRプロトスペーサー1103の少なくとも一部におおよそ相補的であり得る。gRNAは、任意選択的に、増幅アダプター部位1102とCRISPRプロトスペーサー1103との間に位置し得るループ1104及び/又は1105を含み得る。ループ及びCRISPRプロトスペーサーを含む伸長gRNAに関する更なる詳細については、その全内容が参照により本明細書に組み込まれるAnzalone et al.,「Search-and-replace genome editing without double-strand breaks or donor DNA」、Nature 576:149-157(2019)を参照されたい。
図11Aの操作Bに示されるように、操作AのgRNAのCRISPRプロトスペーサー1103は、第1のCas-gRNA RNP 1150のCasタンパク質1151によって結合され得る。図11Aの操作Bに示されるような方法で、プライマー結合部位1101及び増幅アダプター部位1102は、Casタンパク質の外側に伸長してもよい。Casタンパク質1151は、二本鎖ポリヌクレオチド切断を行うように構成されてもよく、例えば、Cas9、Cas12a、又はCas12fを含み得る。Cas-gRNA RNP 1150は、ポリヌクレオチドP9と複合体を形成してもよく、第1のCRISPRプロトスペーサー1103は、ポリヌクレオチドP9の第1の鎖にハイブリダイズしており、第1のプライマー結合部位1101は、ポリヌクレオチドの第2の鎖にハイブリダイズしている。第1及び第2の鎖は、第1のCRISPRプロトスペーサー1103の配列に基づくそれぞれの位置で第1のCas-gRNA RNPによって切断され得る。そのような切断は、例えば、ポリヌクレオチドP9の第1の鎖への少なくとも第1のCRISPRプロトスペーサー1103のハイブリダイゼーションの後に行われ得る。いくつかの例では、そのような切断に続いて、第1のプライマー結合部位1101は、ポリヌクレオチドP9の第2の鎖にハイブリダイズする。
Cas-gRNA RNP 1150のgRNA 1100は、本明細書の特定の他の例において使用され得るgRNAと比較して比較的長い3’伸長を含み、第2のポリヌクレオチド鎖の切断された3’末端に増幅アダプターを付着させるために使用され得るプライマー結合部位1101及びアダプター部位1102を含むことに留意されたい。より具体的には、図11Aの操作Cに示されるように、プライマー結合部位1101が、Cas 1151によって切断された3’末端付近の第2の鎖の部分1155にハイブリダイズする場合、アダプター部位1102は、プライマー結合部位1101と部分1155との間の二本鎖の3’側の位置に配置される。ポリメラーゼ(例えば、逆転写酵素(RT))は、二本鎖の部分1155をプライマーとして使用する操作Cに含まれ得、このプライマーから、3’末端がアダプター部位1102の配列に基づいて伸長される。したがって、ポリメラーゼは、Casタンパク質1151によって引き起こされた第2の鎖の切断部においてアダプター部位1102のアンプリコン1156を生成してもよく、アンプリコンは増幅アダプターとして使用されてもよい。ポリメラーゼ(例えば、RT)は、任意選択的に、例えば、Anzalone et al.に記載されているものと同様の方法で、Casタンパク質1151にカップリングされてもよい。例えば、RT及びCasタンパク質1151は、第1の融合タンパク質の構成要素であってもよく、又は他の方法で互いに適切にカップリングされてもよい。代替的に、RTは、任意の適切な操作中、例えば、図11Aに示される操作B又は操作C中に追加され得る。
操作BでのポリヌクレオチドP9の二本鎖切断及び操作Cでの増幅アダプター1156の生成に続いて、RT及びCasタンパク質1151は、例えば、熱又は任意の他の方法(例えば、プロテイナーゼK、プロテアーゼ、又はSDSなどの試薬の使用)を使用してポリヌクレオチドP9から解離され得、図11Aの操作Dに図示される断片1160を生じる。断片1160は、増幅アダプター1156を含むか、又は本質的にそれからなる3’オーバーハングを含み得る。次いで、5’増幅アダプター1157を、アダプター1156の反対側の断片1160の切断5’末端にカップリングさせることができる。例えば、増幅アダプター1157は、アダプター1156の対応する部分配列に相補的であり、したがってハイブリダイズする部分配列1158を含み得る。ハイブリダイズされた増幅アダプター1157は、断片1160の切断された5’末端に対してDNAリガーゼでシールされ、新たな5’末端を形成し得る。
図11Aは、ポリヌクレオチドが第1の領域で切断され得、増幅アダプターが得られた切断端に付加され得る方法を詳述するが、ポリヌクレオチドはまた、第2の領域で切断され得、増幅アダプターが得られた切断端に付加され得ることが理解されるべきである。すなわち、切断のセットは、増幅及び配列決定に適切な断片を形成するために使用され得る。断片は標的配列を含み得、切断工程及び増幅工程は、本明細書の他の箇所に記載されるものと同様の方法で標的配列を濃縮し得る。
例えば、図11Bの操作Aに示されるように、ポリヌクレオチドP9は、図11Aを参照して説明されるものと同様に構成された第1のCas-gRNA RNP 1150、及び第2のgRNA 1150’を含む第2のCas-gRNA RNP 1100’と接触させられ得る。第2のgRNA 1100’は、ガイドRNA 1100について記載したのと同様に構成された、第2のプライマー結合部位1101’、第2の増幅アダプター部位1102’、及び第2のCRISPRプロトスペーサー1103’を含み得る。本明細書の他の箇所に記載されるものと同様の方法で、第1及び第2のCRISPRプロトスペーサー1103、1103’は、標的配列1110に隣接する配列を標的化し得る。図11Bに例示されるように、第2のCRISPRプロトスペーサー1103’は、第1の鎖(すなわち、第1のCRISPRプロトスペーサー1103がハイブリダイズする鎖と反対の鎖)にハイブリダイズしてもよく、第2のプライマー結合部位1101’は、第2の鎖(すなわち、プライマー結合部位1101がハイブリダイズする鎖と反対の鎖)にハイブリダイズする。図11Aを参照して説明されたものと同様の方法で、第2のCasタンパク質1151’は、第2のCRISPRプロトスペーサー1103’に結合し、任意選択的に、Cas9又は二本鎖ポリヌクレオチドに切断部を生成し得る他の適切なCasタンパク質を含み得る。
図11Aを参照して説明されるものと同様の方法で、ポリヌクレオチドP9の第1及び第2の鎖は、第1のCRISPRプロトスペーサー1103の配列に基づいてそれぞれの位置で第1のCas-gRNA RNP 1150によって切断され得、また、第2のCRISPRプロトスペーサー1103’の配列に基づいてそれぞれの位置で第2のCas-gRNA RNP 1150’によって切断され得る。図11Bの操作Aから理解され得るように、第2のCas-gRNA RNPによる第1及び第2の鎖の切断部は、第1のCas-gRNA RNPによる第1及び第2の鎖の切断部から少なくとも標的配列1110だけ離間している。図11Bの操作Bにおいて、図11Aの操作Cを参照して説明されるような方法で、第1のポリメラーゼ(例えば、RT)は、第1のCasタンパク質1151によって引き起こされる第1の鎖の切断部に増幅アダプター部位1102のアンプリコンを作製するために提供されてもよく、第2のポリメラーゼ(例えば、RT)は、第2のCasタンパク質によって引き起こされる第2の鎖の切断部に増幅アダプター部位1102’のアンプリコンを作製するために提供されてもよい。いくつかの例では、第2のポリメラーゼ(例えば、RT)を第2のCasタンパク質にカップリングさせてもよい。例えば、第2のポリメラーゼ及び第2のCasタンパク質1151’は、任意選択的に第2の融合タンパク質の構成要素であってもよい。
図11Bに示す操作Cでは、Cas-gRNA RNP 1150、1150’及びポリメラーゼを除去して、第1及び第2の末端と、第1及び第2の末端の間に位置する標的配列1110とを含む部分二本鎖ポリヌクレオチド断片1170を得ることができる。第1の末端は、第1の増幅アダプター1102(例えば、A14’及び任意選択のME’配列又は第1のアダプター部位1156に含まれていた他の適切な配列)を含み得る第1の3’オーバーハング1115を含み得る。第2の末端は、第2の増幅アダプター1156’(例えば、A14’及び任意選択のME’配列又は第2のアダプター部位に含まれていた他の適切な配列)を含み得る第2の3’オーバーハング1115’を含み得る。図11Bの操作Dに示されるように、次いで、5’増幅アダプター1157が、アダプター1156の反対側で、断片1170の切断5’末端にカップリングされ得る。例えば、増幅アダプター1157は、アダプター1156の対応するME’(又は他の)配列に相補的であり、したがってそれにハイブリダイズするME(又は他の)配列を含み得る。同様に、増幅アダプター1157’は、アダプター1156’の対応するME’(又は他の)配列に相補的であり、したがってハイブリダイズするME(又は他の)配列を含み得る。ハイブリダイズした増幅アダプター1157、1157’は、断片1160の切断された5’末端に対してDNAリガーゼでシールされて、新しい5’末端を形成し得る。
図11Bの操作Eに示すように、アダプター1156、1157、1156’、1157’がカップリングされた断片は、サンプルインデックス(i5及びi7及びその相補体)並びに配列決定アダプター(例えば、P5及びP7アダプター並びにその相補体)を付加するように増幅され得る(例えば、PCRを使用する)。増幅中、各断片は、標的領域の「上部」及び「下部」の鎖が分岐アダプター構造のライゲーションに起因して異なる配向を生成することから、双方向シーケンシングリードで使用するための双方向アンプリコンを生成する。これは、2つのシーケンシングリードが、標的配列1110のいずれかの末端から行われ得ることを意味し、追加のカバレッジを提供する。増幅はまた、多重化配列決定における使用のために、更なるクラスター化配列(例えば、P5、P7)及びサンプルインデックス配列(例えば、i5、i7)を加える。図11Bに示されるアダプター配列(例えば、A14、B15、ME)は、Illumina配列決定に使用され得る例であるが、所望に応じて任意の他の適切な配列に切り替えられ得る。次いで、増幅及び配列決定アダプターがカップリングされた、得られた濃縮断片を配列決定して、標的配列1110を同定することができる。
単一のポリヌクレオチドP9並びに対応する第1及び第2のCas-gRNA RNP 1150、1150’が図11A~図11Bに示されているが、このアプローチは、例えば、複数の異なるポリヌクレオチドを、第1及び第2の複数のCas-gRNA RNPと、それらのポリヌクレオチドを有する標的配列に隣接するポリヌクレオチドのうちの選択されたものにおける第1又は第2の配列に特異的にハイブリダイズするそれぞれのガイドRNA配列(特にCRISPRプロトスペーサー)と接触させることによって、本明細書の他の箇所に提供されるような方法で容易にスケーリングされ得ることが理解されるであろう。
図11Bは、濃縮される断片の両端に増幅アダプターを付加するためのプロセスフローの非限定的な例を示し、他のプロセスフローが適切に使用され得ることが理解されるであろう。図11Cは、Cas-gRNA RNP 1150が、図11Aの操作A及びB並びに図11Bの操作Aを参照して説明されるような方法で、ポリヌクレオチドP10における切断部を生成するために使用される、操作Aを含む例を示す。図11Cの操作Bでは、ポリメラーゼ(例えば、RT)を使用して、図11Aの操作C及び図11Bの操作Bを参照して説明されるような方法で、gRNA 1100のプライマー結合部位1101にハイブリダイズされる鎖の部分をプライマーとして使用し、アダプター部位1102を鋳型として使用して、Cas-gRNA RNP 1150によって切断された3’末端を伸長して、切断された3’末端にカップリングされ、アダプター部位1102に相補的な配列を有するアンプリコンを生成する。図11Cの操作Cでは、Cas-gRNA RNP及びポリメラーゼが除去され、図11Aの操作D及び図11Bの操作Cを参照して説明されるような方法で、3’アダプター(例えば、A14’及びME’配列)が露出される。
図11Cの操作Dにおいて、ポリヌクレオチドは、5’アダプターを含むトランスポソーム(例えば、Tn5又はTn7)と接触されてもよく、トランスポソームは、ポリヌクレオチドを切断し、本明細書の他の箇所に記載されるような方法で、その切断された5’末端にアダプターを付加してもよい。この例では、トランスポソーム活性は非特異的である可能性があり、したがってランダムな位置でポリヌクレオチドをタグ付けする可能性があることに留意されたい。この操作は、操作AからCのいずれかと同時に、その前に、又はその後に実行することができる。次いで、トランスポソームは、図11Cの操作Eに示されるように除去されてもよく、結果として生じる断片は、5’及び3’アダプター(例えば、B15及びA14’)を含む第1の鎖と、増幅アダプターを欠く第2の鎖とを含んでもよいが、この鎖は、タグメンテーション中にトランスポソームによって付加されたME’配列を含み得る。断片は、図11Cの操作Fに示されるように、サンプルインデックス(i5及びi7及びその相補体)並びに配列決定アダプター(例えば、P5及びP7アダプター並びにその相補体)を付加するように増幅され得る(例えば、PCRを使用する)。増幅の間、A14及びB15を含む断片は指数関数的に増幅する。次いで、増幅及び配列決定アダプターがカップリングされた、得られた濃縮断片を配列決定して、標的配列1110を同定することができる。
図11Dは、図11Cを参照して説明した方法で行うことができる操作A、B、及びCも含む代替例を示す。図11Dの操作Dにおいて、ポリヌクレオチドは、図4A~4J又は図6A~6Bを参照して説明されるようなCas-gRNA RNP/トランスポザーゼ融合タンパク質と接触させられ得る。Cas-gRNA RNPは、ポリヌクレオチド中の特定の配列にハイブリダイズするが、ポリヌクレオチドを切断しないように不活性化され得る(例えば、dCas9又はCas12kを含み得る)。融合タンパク質のCas-gRNA RNPがポリヌクレオチドにハイブリダイズすることに応答して、融合タンパク質のトランスポザーゼは、5’増幅アダプターを含むようにポリヌクレオチドをタグ付けし得る。流体及び/又は生化学的条件は、任意選択的にCas-gRNA RNPがポリヌクレオチドにハイブリダイズした後までトランスポザーゼの活性を阻害するように、本明細書の他の箇所に記載されているような方法で制御され得る。この例では、トランスポソーム活性は非特異的であり得るが、Cas-gRNA RNPは配列特異的であり、したがって、操作B中の切断とは反対側で標的配列に隣接するように選択された位置でポリヌクレオチドをタグ付けし得ることに留意されたい。この操作は、図11Dの操作A~Cのいずれかと同時に、その前に、又はその後に実行され得る。次いで、トランスポソームは、図11Dの操作Eに示されるように除去されてもよく、結果として生じる断片は、5’及び3’アダプター(例えば、B15及びA14’)を含む第1の鎖と、増幅アダプターを欠く第2の鎖とを含んでもよいが、この鎖は、タグメンテーション中にトランスポソームによって付加されたME’配列を含み得る。断片は、図11Dの操作Fに示されるように、サンプルインデックス(i5及びi7及びその相補体)並びに配列決定アダプター(例えば、P5及びP7アダプター並びにその相補体)を付加するように増幅され得る(例えば、PCRを使用する)。増幅の間、A14及びB15を含む断片は指数関数的に増幅する。次いで、増幅及び配列決定アダプターがカップリングされた、得られた濃縮断片を配列決定して、標的配列1110を同定することができる。
図11E及び図11Fはそれぞれ、図11C及び図11Dのプロセスフローを使用して生成され得る断片を示す。図11Cに示されるように、非特異的タグメンテーションは、ポリヌクレオチドの長さに沿ってランダムな位置で行われ得、ある範囲の断片サイズ及び標的配列1110を含まない断片のサブセットをもたらす。比較すると、図11Dに示されるように、Cas-gRNA RNP/トランスポザーゼ融合タンパク質を使用する特異的タグメンテーションは、標的配列1110を含む実質的に均一なサイズの断片を生じ得る。
上記から、種々の異なる技術を使用して、合理化された方法での増幅及び配列決定における使用に適切なアダプターを有する断片を生成し得ることが理解される。方法11000は、方法における工程のフローを示す。方法は、Cas-gRNA RNPを、第1鎖及び第2鎖を含むポリヌクレオチドと接触させること(操作11001)を含み得る。Cas-gRNAは、プライマー、増幅アダプター部位、及びCRISPRプロトスペーサーを含むガイドRNAを含み得る。Cas-gRNAはまた、CRISPRプロトスペーサーに結合するCasタンパク質を含み得る。方法11000はまた、CRISPRプロトスペーサーを第1の鎖にハイブリダイズさせること(操作11002)を含み得る。方法11000はまた、プライマーを第2の鎖にハイブリダイズさせることを含み得る(操作11003)。gRNA、Casタンパク質、そのようなCas-gRNA RNPのポリヌクレオチドとの接触、及びポリヌクレオチドの選択された領域への特定のgRNA構成要素のハイブリダイゼーションの非限定的な例は、図11A~11Dを参照して提供される。
任意選択的に、方法11000は、例えば、図11A~11Dを参照して説明されるような方法で、CRISPRプロトスペーサーの配列に基づくそれぞれの位置で、Cas-gRNA RNPによって第1及び第2の鎖を切断することを含み得る。任意選択的に、方法11000は、例えば、図11A~11Dを参照して説明されるような方法で、第1の逆転写酵素を使用して、第1のCasタンパク質によって引き起こされた第2の鎖の切断部に増幅アダプター部位のアンプリコンを生成することを更に含み得る。
任意選択的に、方法11000は、ポリヌクレオチドを第2のCas-gRNA RNPと接触させることを含み得る。第2のCas-gRNA RNPは、第2のプライマー、第2の増幅アダプター部位、及び第2のCRISPRプロトスペーサーを含む第2のガイドRNA;並びに第2のCRISPRプロトスペーサーに結合する第2のCasタンパク質を含み得る。方法11000は、第2のCRISPRプロトスペーサーを第1の鎖にハイブリダイズさせることと、第2のプライマーを第2の鎖にハイブリダイズさせることとを含み得る。第2のCas-gRNA RNPは、任意選択的に、第2のCRISPRプロトスペーサーの配列に基づいて、それぞれの位置で第1及び第2のものを切断し得る。第2のCas-gRNA RNPによる第1及び第2の鎖の切断部は、第1のCas-gRNA RNPによる第1及び第2の鎖の切断部から少なくとも標的配列だけ離間している可能性がある。第2の逆転写酵素を使用して、第2のCasタンパク質によって引き起こされた第2の鎖の切断部に増幅アダプター部位のアンプリコンを生成してもよい。第1及び第2のCas-gRNA RNP並びに第1及び第2の逆転写酵素は、第1の末端及び第2の末端を有する部分二本鎖ポリヌクレオチド断片を生成することができ、第1の末端は第1の3’オーバーハングを含み、第2の末端は第2の3’オーバーハングを含み、標的配列が、例えば、図11Bを参照して説明されるような方法で、第1の末端と第2の末端との間に位置する。第1の3’オーバーハングは、第1の増幅アダプター部位のアンプリコンを含んでいてもよく、第2の3’オーバーハングは、第2の増幅アダプター部位のアンプリコンを含んでいてもよい。方法11000は、例えば、図11Bを参照して説明されるように、第3の増幅アダプターを第1の末端で第5’基にライゲーションすることと、第4の増幅アダプターを第2の末端の5’基にライゲーションすることと、第1、第2、第3、及び第4の増幅アダプターを使用して断片を増幅することと、増幅された断片を配列決定することとを更に含み得る。
更なる考察
本明細書で提供されるプロセスフローの任意の適切な態様は、互いに任意の適切な組み合わせで実行され得ることが理解されるであろう。例えば、図1Kを参照して説明した方法1000の任意の適切な操作、図2Jを参照して説明した方法2000の任意の適切な操作、図2Kを参照して説明した方法2010の任意の適切な操作、図3Eを参照して説明した方法3000の任意の適切な操作、図4Jを参照して説明した方法4000の任意の適切な操作、図5Kを参照して説明した方法5000の任意の適切な操作、図6A~6Bを参照して説明した任意の適切な操作、図7A~7Gを参照して説明した任意の適切な操作、図8Hを参照して説明した方法8000の任意の適切な操作、図9Fを参照して説明した方法9000の任意の適切な操作、図10Cを参照して説明した方法10000の任意の適切な操作、及び/又は図11Gを参照して説明した方法11000の任意の適切な操作である。純粋に例示的な一例として、方法1000は、サンプルから1つの種の遺伝物質を実質的に除去するために使用され得、方法2000、2010、3000、4000、8000、9000、10000、又は11000からの操作は、配列決定のために残りのポリヌクレオチドを調製するために使用され得、方法5000からの操作は、これらのポリヌクレオチドに対してエピジェネティックアッセイを行うために使用され得る。更に別の純粋に例示的な例として、方法1000は、サンプルから1つの種の遺伝物質を実質的に除去するために使用されてもよく、方法5000からの操作は、残りのポリヌクレオチドに対してエピジェネティックアッセイを行うために使用されてもよい。更に別の純粋に例示的な例として、方法2000、2010、3000、4000、8000、9000、10000、及び/又は11000からの操作を使用して、配列決定のためのポリヌクレオチドを調製することができ、方法5000からの操作を使用して、それらのポリヌクレオチドに対してエピジェネティックアッセイを行うことができる。エピジェネティックアッセイの結果は、ポリヌクレオチドの配列と比較され得る。
したがって、本開示は、遺伝子座を標的とするエピジェネティック同定のための方法であって、それに関連するエピジェネティックタンパク質を有するポリヌクレオチドを含む組成物を提供すること;ポリヌクレオチドを、ポリヌクレオチドの別個の第1の標的領域及び第2の標的領域にそれぞれ特異的にハイブリダイズする第1のCas-gRNA RNP及び第2のCas-gRNA RNPとハイブリダイズさせ、ポリヌクレオチドを切断して、それらの間にハイブリダイズしたポリヌクレオチドの断片を提供すること(第1及び/又は第2のRNPは、それに結合した標識を有する);並びにハイブリダイズしたポリヌクレオチド断片及びRNPを、標識に結合する捕捉エレメントで精製し、それによって、組成物を、それに関連するエピジェネティックタンパク質を有するポリヌクレオチドについて濃縮すること、を含み得る方法を提供することが理解され得る。
いくつかの例では、本開示は、ポリヌクレオチドからRNPを除去することを更に提供する。いくつかの例では、本開示は、ポリヌクレオチド及び関連するエピジェネティックタンパク質をアッセイすることを更に提供する。いくつかの例では、本開示は、遺伝子座を標的とする高マルチプレックスプロテオームオリゴ連結抗体アッセイ、及び/又は遺伝子座を標的とするATAC配列決定アッセイ、及び/又はChIP配列決定アッセイを用いて、ポリヌクレオチド及び関連するエピジェネティックタンパク質をアッセイすることを提供する。いくつかの例では、本開示は、エピジェネティックタンパク質の遺伝子座特異的指標を提供する。
いくつかの例では、本開示は、2つ以上のエピジェネティックタンパク質の遺伝子座特異的同定を提供する。いくつかの例では、本開示は、Cas-gRNA RNP及び第2のCas-gRNA RNPの2対以上のポリヌクレオチドをハイブリダイズさせることを提供し、それらのポリヌクレオチドの異なる第1の標的領域及び第2の標的領域にそれぞれ特異的にハイブリダイズし、ポリヌクレオチドを切断して、それらの間にハイブリダイズしたポリヌクレオチドの複数の断片を提供する。いくつかの例では、Cas-gRNA RNPの各対の第1及び/又は第2のRNPは、ハイブリダイズしたポリヌクレオチド断片を精製するためにそれに結合した標識及び標識に結合する捕捉エレメントを有するRNPを有し、それによって、それに関連するエピジェネティックタンパク質を有するポリヌクレオチドのための組成物を濃縮する。
いくつかの例では、本開示は、同じ染色体上の2つ以上のエピジェネティックタンパク質の遺伝子座特異的同定を提供する。いくつかの例では、本開示は、Cas-gRNA RNPの対を、同じゲノムであるが異なる染色体上のポリヌクレオチドにハイブリダイズさせることを提供する。いくつかの例では、本開示は、ゲノム中の2つ以上のエピジェネティックタンパク質についての遺伝子座特異的指標を提供する。
いくつかの例では、本開示は、ポリヌクレオチド及び関連するエピジェネティックタンパク質を、エピジェネティックタンパク質に対応するオリゴヌクレオチド標識で標識された抗エピジェネティックタンパク質抗体と接触させるステップを含む、遺伝子座を標的とする高マルチプレックスプロテオームオリゴ連結抗体アッセイを用いて、ポリヌクレオチド及び関連するエピジェネティックタンパク質をアッセイするステップを提供する。
いくつかの例では、本開示は、例えば、図5I~5Jを参照して説明されるように、遺伝子座を標的とするATAC配列アッセイを用いてポリヌクレオチド及び関連するエピジェネティックなタンパクをアッセイすることを提供する。
これまでに公知のATAC配列決定は、アッセイの単純さ及びクロマチン接近可能性の広範なゲノムワイドな評価に起因して、NGSベースのエピジェネティック研究が可能である。しかしながら、これまでのATACシーケンシングは、各DNA部位に結合したタンパク質を直接同定することも、研究及び臨床マーカーに重要な結合部位及びエピジェネティック変化を深く解明することもできなかった(例えば、液体生検)。これまでに公知のChIP配列決定法は、目的のタンパク質に結合した抗体によって指向されるTn5-プロテインAタグメンテーションを含む方法を使用して、特定のタンパク質のDNA結合部位を直接分解する。以前から知られているエピジェネティックアッセイに関する更なる詳細については、例えば、それらの各々の内容全体が参照により本明細書に組み込まれる、以下の参照文献を参照されたい:Kaya-Okur et al.,「CUT&Tag for efficient epigenomic profiling of small samples and single cells」,Nat Comm 10:1930,1-10(2019);Wang et al.,「CoBATCH for high-throughput single-cell epigenomic profiling」,Mol Cell 76(1):206-216.e7(2019);Ai et al.,「Profiling chromatin states using single cell itCHIP-seq」,Nat Cell Biol 21:1164-1172(2019);及びCarter et al.,「Mapping histone modifications in low cell number and single cells using antibody-guided chromatin tagmentation(ACT-seq)」,Nat Comm 10:3747,1-5(2019)。
いくつかの例では、本開示は、例えば、図3A~3Eを参照して説明されるように、外因性の固有の分子識別子(UMI)を有するポリヌクレオチド断片を増強することを提供する。いくつかの例では、本開示は、外因性のUMIを用いた標的配列決定ライブラリーの生成を提供する。いくつかの例では、UMIは、例えば、図4A~4Jを参照して説明されるように、断片末端に多様性を生じさせるために重複するDNA結合フットプリントを有する複数のCasヌクレアーゼを標的化することによって、ポリヌクレオチド断片の末端に作製される。これに関して、多様な断片末端自体は、断片末端にカップリングされ得る別個のUMI配列とは区別されるように、UMIを提供すると考えることができる。多様な断片末端は、Cas9媒介性のネガティブ濃縮、CRISPR-DS、又は他のデュアルCas9ベースのCRISPR標的化LP法などの任意の適切な配列決定又はアッセイ技術と併せて使用され得ることが理解されるであろう。
いくつかの例では、本開示は、ゲノムDNA出発物質から、Cas-gRNA RNPが結合し、エキソヌクレアーゼ(III、VII)からポリヌクレオチド領域を切断し、保護する、Cas9媒介性のネガティブ濃縮方法を提供する。あるいはdCas9を使用してエキソヌクレアーゼ活性を遮断し、より柔軟な配列標的化を可能にすることができ、標的化領域をエキソヌクレアーゼ活性に曝露しないので、任意のdCas9配向が可能である。図4A~4Jを参照して説明されるようなCasヌクレアーゼフットプリント重複は、1つのCasヌクレアーゼのみが各断片末端に作用し得ることを確実にし得る。いくつかの例では、本開示は、非ランダムなUMI Yアダプターを使用する標準的なライゲーションベースのLP(ER、Aテール、リグ)を提供する。いくつかの例では、本開示は、標的化PCRフリーを可能にする全長アダプターの使用を提供する。いくつかの例では、方法はまた、UMIなしで使用することができ、分子を分解するために非ランダムな固有の断片末端に依存する。方法は、ほとんどのアッセイ適用のための適切な断片末端複雑性を達成するために、より多くのCas9スタガリングカットを含む。いくつかの例では、本開示は、断片末端座標及びUMIの組み合わせを使用して、分子を一意的に同定することを提供する。
いくつかの例では、本開示は、例えば、図1A~1Jを参照して説明されるような方法で、CRISPR/Casを使用して宿主反復要素を切断し、次いでエキソヌクレアーゼを使用してそれらを分解する、Cas-gRNA RNP媒介DNA脱宿主化を提供する。いくつかの例では、本開示は、Cas-gRNA RNPのプログラム可能なヌクレアーゼ活性を活用して、典型的にはゲノムポリヌクレオチドの>50%を構成し、ヒトゲノム全体に分布している反復要素を標的化することを提供する。いくつかの例では、本開示は、各ヒト染色体を2回以上特異的に切断するために、Cas-gRNA RNPのセット(例えば、10~1,000,000個のCas-gRNA RNP)を使用することを提供する。いくつかの例では、本開示は、切断されていない非宿主/微生物DNA断片を保持しながら、宿主DNA断片を選択的に分解するための方法を提供する。
図1A~1Kを参照して説明されるようないくつかの例では、本開示は、(a)エキソヌクレアーゼ処理から末端を保護するためにサンプル混合物中のDNAを修飾することと、(b)宿主(例えば、ヒト)反復要素を標的とするCas-gRNA RNPでポリヌクレオチドを切断し、保護されていない宿主DNA断片末端を露出させることと、(c)1つ以上のエキソヌクレアーゼを適用して、保護されていないDNA末端を有する宿主DNAを選択的に分解することとを含む、Cas-gRNA RNP DNA脱宿主化のための方法を提供する。いくつかの例では、操作(a)において、直鎖状非宿主DNAのエキソヌクレアーゼ媒介分解を阻害するために、DNAサンプルは、Cas-gRNA RNPの前に、以下の方法のうちの1つ以上で前処理される。いくつかの例では、本開示は、ヘアピンアダプター又はエキソヌクレアーゼ活性に耐性の塩基修飾を含むDNAアダプター(例えば、ホスホロチオエート結合又は3’リン酸は、ExoIIIを含む多くのエキソヌクレアーゼ活性に対する保護を提供する)などを用いて、エキソヌクレアーゼ保護DNAアダプターをDNA分子の末端にライゲーションすることによって、直鎖状非宿主DNAのエキソヌクレアーゼ媒介性分解を阻害することを提供する。いくつかの例では、本開示は、5’リン酸のみでdsDNAに5’→3’作用するラムダエキソヌクレアーゼ活性から保護するために、DNA断片5’末端を脱リン酸化することによって直鎖状非宿主DNAのエキソヌクレアーゼ媒介分解を阻害することを提供する。この例では、宿主DNA部位でのCas-gRNA RNP切断は、ラムダエキソヌクレアーゼ切断のための基材である5’リン酸を曝露する。いくつかの例では、本開示は、エキソヌクレアーゼ保護修飾ヌクレオチドのターミナルトランスフェラーゼ3’付加でヌクレオチドを保護することによって、直鎖状非宿主DNAのエキソヌクレアーゼ媒介性分解を阻害することを提供する。いくつかの例では、Taq DNAポリメラーゼは、ホスホロチオエート結合ヌクレオチドを組み込むdsDNAに非鋳型ヌクレオチドを付加するために使用される。
いくつかの例では、本開示は、Cas-gRNA RNPヌクレアーゼを使用してDNAを正確な位置で切断し、例えば、図2A~2Kを参照して説明されるように、DNA断片化の長さ及び均一性を制御することを含む、その後の遺伝子座標的エピジェネティック同定などのために、ゲノムDNAを均一に断片化する方法を提供する。方法は、二重鎖配列決定(DS)を使用して固有の分子を分解することを含むことができ、本明細書では全ゲノムDNA分析に使用することができる。二重sgRNAプールは、メタゲノム/混合サンプルに適用される場合、宿主DNA枯渇のために使用することができる。例えば、その全内容が参照により本明細書に組み込まれるCrawford et al.,「Depletion of abundant sequences by hybridization(DASH):using Cas9 to remove unwanted high-abundance species in sequencing libraries and molecular counting applications」,Genome Biology 17:41,1-13(2016)に記載されているように、ビオチン化/タグ化Cas9を有するレガシーリボソーム-スタイルプルダウン-ロードsgRNAプール、又はライブラリー調製後の宿主ライブラリー分子の低インプット適合性「DASH」型枯渇Cas9切断が使用されてもよい。
ライブラリー調製後の宿主ライブラリー分子のCas-gRNA RNP切断によるサイズ制御された全ゲノム断片化のための例示的な方法は、図2A~2Kを参照して説明される。複数のCas-gRNA RNP消化に基づく標的化ゲノム断片化アプローチは、同様の長さのDNA断片を生成する。これらの断片は、単純なサイズ選択によって濃縮することができ、標的濃縮をもたらす。更に、均一な長さの断片は、PCR増幅バイアスを有意に減少させ得、リード有用性を高め得る。本開示は、配列決定エラーを補正するために二本鎖分子タグ付けを使用する、二重鎖配列決定による標的濃縮を提供する。CRISPR-DS技術は、小さなゲノム領域の効率的な標的濃縮、均一なカバレッジ、超精密配列決定、及び低減されたDNAインプットを可能にする。いくつかの例では、本開示は、複数のCas-gRNA RNPを標的化領域に標的化することによってDNA断片末端多様性を生成するためのUMIアプローチに関連して、このCRISPR-DS標的化アプローチを利用して、所与の数のUMIを用いて分解可能なライブラリー複雑性を増加させ、個々のCas切断部位のシーケンシングカバレッジを増加させることができることを提供する。
Cas-gRNA RNP切断は、主に平滑末端を生じるが、小さなオーバーハングも生じることが知られている。ライブラリー調製の末端修復操作中のエキソヌクレアーゼ活性は、切断部位/その付近の配列情報の喪失をもたらし得る。いくつかの例では、例えば図3A~3Eを参照して説明されるような方法で、複数のガイドRNAを用いて標的における切断部位をスタガリングすることは、局所的なカバレッジ損失を減少させ得る。Cas-gRNA RNP標的化の高い配列特異性のために、切断部位又はその付近の塩基の同一性は、確実に推論可能であることに留意されたい。
いくつかの例では、本明細書で提供される方法は、標的ポリヌクレオチド及びトランスポゾン末端組成物が転位反応を受けて混合物を生成する条件下で、少なくとも1つのトランスポザーゼ及びオリゴヌクレオチドを含む少なくとも1つのトランスポゾン末端組成物を標的ポリヌクレオチドを含むサンプルに適用することを含み、標的ポリヌクレオチドは断片化されて複数の標的ポリヌクレオチド断片を生成し、したがってオリゴヌクレオチド配列を複数の標的ポリヌクレオチド断片の各々に組み込む。
更なるコメント
本開示の実施は、別段の指示がない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、生化学及び免疫学の従来の技術を使用することができ、これらは当業者の技術の範囲内である。そのような技術は、例えば、以下の文献に十分に説明されている:Molecular Cloning:A Laboratory Manual,2nd ed.(Sambrook et al.,1989);Oligonucleotide Synthesis (M.J.Gait,ed.,1984);Animal Cell Culture(R.I.Freshney,ed.,1987);Methods in Enzymology(Academic Press,Inc.);Current Protocols in Molecular Biology(F.M.Ausubel et al.,eds.,1987、及び定期的な更新);PCR:ポリメラーゼ連鎖反応(Mullis et al.,eds.,1994);Remington,The Science and Practice of Pharmacy,20th ed.,(Lippincott,Williams & Wilkins 2003)、並びにRemington,The Science and Practice of Pharmacy,22th ed.,(Pharmaceutical Press and Philadelphia College of Pharmacy at University of the Sciences 2012)。
本明細書に記載されている全ての特許及び刊行物は、それぞれの独立した特許及び刊行物が参照により組み込まれることが具体的かつ個別に示された場合と同程度に、参照により本明細書に組み込まれる。
様々な例示的な例が上に記載されているが、様々な変更及び改変が、本発明から逸脱することなく、本明細書において行われ得ることは、当業者に明白であろう。添付の特許請求の範囲は、本発明の真の趣旨及び範囲内に収まる、このような変更及び改変の全てを包含することが意図される。
本明細書に記載されている利益を実現するため、本明細書に記載されている本開示の態様の各々の任意のそれぞれの特徴/例は、任意の適切な組み合わせで一緒に実施されてもよいこと、及びこれらの態様のいずれか1つ以上からの任意の特徴/例は、任意の適切な組み合わせで、本明細書に記載されている他の態様の特徴のいずれかと一緒に実施されてもよいことを理解すべきである。

Claims (443)

  1. 第1の種に由来する第1の二本鎖ポリヌクレオチドと第2の種に由来する第2の二本鎖ポリヌクレオチドとの混合物を処理する方法であって、前記方法は、
    前記第1の二本鎖ポリヌクレオチドの末端及び前記第2の二本鎖ポリヌクレオチドの任意の末端を保護することと、
    前記第1及び第2の二本鎖ポリヌクレオチドの末端を保護した後、前記第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成することと、
    前記第1の二本鎖ポリヌクレオチドを前記自由末端から保護末端に向かって分解することと
    を含む、方法。
  2. 前記第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成することが、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を、前記第1の二本鎖ポリヌクレオチド内に存在し、かつ前記第2の二本鎖ポリヌクレオチド内に存在しない配列にハイブリダイズさせることと、前記Cas-gRNA RNPで前記配列を切断することとを含む、請求項1に記載の方法。
  3. 前記配列が哺乳動物特異的反復要素を含む、請求項2に記載の方法。
  4. 前記哺乳動物特異的反復要素がヒト特異的反復要素を含む、請求項3に記載の方法。
  5. 前記第1の二本鎖ヌクレオチドが、前記第1の種に由来する複数の染色体を含む、請求項1に記載の方法。
  6. 前記第2の種が、細菌、真菌、又はウイルスである、請求項1から5のいずれか一項に記載の方法。
  7. 前記第1及び第2の二本鎖ポリヌクレオチドの末端を保護することが、ヘアピンアダプターを前記末端にライゲーションすることを含む、請求項1から6のいずれか一項に記載の方法。
  8. 前記第1及び第2の二本鎖ポリヌクレオチドの末端を保護することが、前記末端を5’脱リン酸化することを含む、請求項1から6のいずれか一項に記載の方法。
  9. 前記第1及び第2の二本鎖ポリヌクレオチドの末端を保護することが、前記末端に修飾塩基を付加することを含む、請求項1から6のいずれか一項に記載の方法。
  10. 前記修飾塩基がホスホロチオエート結合を含む、請求項9に記載の方法。
  11. 前記修飾塩基がターミナルトランスフェラーゼを用いて付加される、請求項9又は10に記載の方法。
  12. 前記第1の二本鎖ポリヌクレオチドを分解することが、エキソヌクレアーゼを使用して行われる、請求項1から11のいずれか一項に記載の方法。
  13. 前記自由末端が3’末端を含む、請求項1から12のいずれか一項に記載の方法。
  14. 前記第1の二本鎖ポリヌクレオチドを分解することが、エキソヌクレアーゼIIIを使用して行われる、請求項13に記載の方法。
  15. 前記自由末端が5’末端を含む、請求項1から12のいずれか一項に記載の方法。
  16. 前記第1の二本鎖ポリヌクレオチドを分解することが、ラムダエキソヌクレアーゼを使用して行われる、請求項15に記載の方法。
  17. 続いて、前記増幅アダプターを前記混合物中の任意の残りの二本鎖ポリヌクレオチドの末端にライゲーションすることを更に含む、請求項1から16のいずれか一項に記載の方法。
  18. 前記増幅アダプターが固有の分子識別子(UMI)を含む、請求項17に記載の方法。
  19. 続いて、前記二本鎖ポリヌクレオチドを増幅及び配列決定することを更に含む、請求項17又は請求項18に記載の方法。
  20. 前記第1の二本鎖ポリヌクレオチドが、二本鎖DNAを含む、請求項1から19のいずれか一項に記載の方法。
  21. 前記第2の二本鎖ポリヌクレオチドが、二本鎖DNAを含む、請求項1から20のいずれか一項に記載の方法。
  22. 前記第2の二本鎖ポリヌクレオチドが、環状DNAを含む、請求項1から21のいずれか一項に記載の方法。
  23. 前記CasがCas9を含む、請求項1から22のいずれか一項に記載の方法。
  24. 組成物であって、
    第1の種に由来する第1の二本鎖ポリヌクレオチドであって、前記第1の二本鎖ポリヌクレオチドの末端は保護されている、第1の種に由来する第1の二本鎖ポリヌクレオチドと、
    第2の種に由来する第2の二本鎖ポリヌクレオチドであって、前記第2の二本鎖ポリヌクレオチドの任意の末端は保護されている、第2の種に由来する第2の二本鎖ポリヌクレオチドと、
    前記第1の二本鎖ポリヌクレオチド内に存在し、かつ前記第2の二本鎖ポリヌクレオチド内に存在しない配列にハイブリダイズしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)であって、前記Cas-gRNA RNPは、前記第1の二本鎖ポリヌクレオチド内に自由末端を選択的に生成するように配列を切断するためのものである、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と
    を含む、組成物。
  25. 前記配列が哺乳動物特異的反復要素を含む、請求項24に記載の組成物。
  26. 前記哺乳動物特異的反復要素がヒト反復要素を含む、請求項25に記載の組成物。
  27. 前記第2の種が、細菌、真菌、又はウイルスである、請求項24から26のいずれか一項に記載の組成物。
  28. 前記第1及び第2の二本鎖ポリヌクレオチドの末端が、ヘアピンアダプターを使用して保護されている、請求項24から27のいずれか一項に記載の組成物。
  29. 第1及び第2の二本鎖ポリヌクレオチドの末端が、5’脱リン酸化を使用して保護されている、請求項24から28のいずれか一項に記載の組成物。
  30. 前記第1及び第2の二本鎖ポリヌクレオチドの末端が、修飾塩基を使用して保護されている、請求項24から29のいずれか一項に記載の組成物。
  31. 前記修飾塩基がホスホロチオエート結合を含む、請求項30に記載の組成物。
  32. 前記自由末端が3’末端を含む、請求項24から31のいずれか一項に記載の組成物。
  33. 前記自由末端が5’末端を含む、請求項24から31のいずれか一項に記載の組成物。
  34. 前記第1の二本鎖ポリヌクレオチドが、二本鎖DNAを含む、請求項24から33のいずれか一項に記載の組成物。
  35. 前記第2の二本鎖ポリヌクレオチドが、二本鎖DNAを含む、請求項24から34のいずれか一項に記載の組成物。
  36. 前記第2の二本鎖ポリヌクレオチドが、環状DNAを含む、請求項24から35のいずれか一項に記載の組成物。
  37. 前記CasがCas9を含む、請求項24から36のいずれか一項に記載の組成物。
  38. 第1の種に由来する第1の二本鎖ポリヌクレオチドと第2の種に由来する第2の二本鎖ポリヌクレオチドとの混合物を処理する方法であって、前記方法は、
    前記混合物中の前記第1の二本鎖ポリヌクレオチドを選択的に一本鎖にすることと、
    続いて、増幅プライマーを前記混合物中の任意の残りの二本鎖ポリヌクレオチドに選択的にライゲーションすることと、
    続いて、増幅プライマーがライゲーションされた前記混合物中の任意の二本鎖ポリヌクレオチドを増幅することと
    を含む、方法。
  39. 組成物であって、
    第1の種から、実質的に一本鎖ポリヌクレオチドのみと、
    第2の種から、実質的に二本鎖ポリヌクレオチドのみと、
    前記第2の二本鎖ポリヌクレオチドの末端にライゲーションされ、かつ前記第1の二本鎖ポリヌクレオチドのいずれの末端にも実質的にライゲーションされていない増幅プライマーと
    を含む、組成物。
  40. 全ゲノム(WG)の断片を生成する方法であって、前記方法は、
    前記WGの第1のサンプル内で、
    CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)の第1のセットを、おおよそ第1の塩基対数だけ互いに離間している前記WG内の第1の配列にハイブリダイズさせることと、
    Cas-gRNA RNPの第2のセットを、おおよそ第2の塩基対数だけ互いに離間している前記WG内の第2の配列にハイブリダイズさせることと、
    前記第1のサンプル内のCas-gRNA RNPの前記第1及び第2のセットで前記第1及び第2の配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対をそれぞれ有するWG断片の第1のセットを生成することと
    を含む、方法。
  41. 前記第1の塩基対数が、前記第2の塩基対数とおおよそ同じである、請求項40に記載の方法。
  42. 前記第1の塩基対数が約100~約2000であり、前記第2の塩基対数が約100~約2000である、請求項40又は41に記載の方法。
  43. 前記第1の塩基対数が約500~約700であり、前記第2の塩基対数が約500~約700である、請求項42に記載の方法。
  44. 前記WG断片の第1のセットの前記WG断片内の塩基対数が、約20%未満変動する、請求項40から43のいずれか一項に記載の方法。
  45. 前記WGの第2のサンプル内で、
    前記Cas-gRNA RNPの第1のセットを前記WG内の第1の配列にハイブリダイズさせることと、
    前記Cas-gRNA RNPの第2のセットを前記WG内の第2の配列にハイブリダイズさせることと、
    Cas-gRNA RNPの第3のセットを、おおよそ第3の塩基対数だけ互いに離間している前記WG内の第3の配列にハイブリダイズさせることと、
    前記Cas-gRNA RNPの第1、第2、及び第3のセットで前記第1、第2、及び第3の配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片の第2のセットを生成することと
    を更に含む、請求項40から44のいずれか一項に記載の方法。
  46. 前記第3の塩基対数が、前記第1の塩基対数と異なる、請求項45に記載の方法。
  47. 前記第3の塩基対数が、前記第2の塩基対数と異なる、請求項45又は請求項46に記載の方法。
  48. 前記第3の塩基対数が約100~約2000である、請求項45から47のいずれか一項に記載の方法。
  49. 前記第3の塩基対数が約200~約400である、請求項48に記載の方法。
  50. 前記WG断片の第2のセットの前記WG断片内のおおよその塩基対数が、前記WG断片の第1のセットの前記WG断片内のおおよその塩基対数とは異なる、請求項45から49のいずれか一項に記載の方法。
  51. 前記WG断片の第2のセットの前記WG断片内の塩基対数が、約20%未満変動する、請求項45から50のいずれか一項に記載の方法。
  52. 前記WGの第3のサンプル内で、
    前記Cas-gRNA RNPの第1、第2、又は第3のセットを、前記WG内の第1、第2、又は第3の配列にそれぞれハイブリダイズさせることと、
    前記Cas-gRNA RNPの第1、第2、又は第3のセットで前記第1、第2、又は第3の配列をそれぞれ切断して、各々が互いにおおよそ同じ数の塩基対を有する前記WG断片の第3のセットを生成することと
    を更に含む、請求項45から51のいずれか一項に記載の方法。
  53. 前記WG断片の第3のセットの前記WG断片内のおおよその塩基対数が、前記WG断片の第1のセットの前記WG断片内のおおよその塩基対数と異なる、請求項52に記載の方法。
  54. 前記WG断片の第3のセットの前記WG断片内のおおよその塩基対数が、前記WG断片の第2のセットの前記WG断片内のおおよその塩基対数とは異なる、請求項52又は請求項53に記載の方法。
  55. 前記WG断片の第3のセットの前記WG断片内の塩基対数が、約20%未満変動する、請求項52から54のいずれか一項に記載の方法。
  56. 増幅アダプターを、前記WG断片の第3のセットの前記WG断片の末端にライゲーションすることと、
    前記増幅アダプターがライゲーションされた前記WG断片の第3のセットの前記WG断片のアンプリコンを生成することと、
    前記WG断片の第3のセットの前記WG断片のアンプリコンを配列決定することと
    を更に含む、請求項52から55のいずれか一項に記載の方法。
  57. 前記WG断片の第2及び第3のセットの前記WG断片のアンプリコンを、配列決定のために一緒に混合する、請求項56に記載の方法。
  58. 前記WG断片の第1及び第3のセットの前記WG断片のアンプリコンを、増幅及び配列決定のために一緒に混合する、請求項56又は請求項57に記載の方法。
  59. 前記WG断片の第3のセットの前記WG断片内の塩基対数が、約100~約1000である、請求項52から58のいずれか一項に記載の方法。
  60. 前記WG断片の第3のセットの前記WG断片内の塩基対数が、約500~約700である、請求項52から59のいずれか一項に記載の方法。
  61. 前記Cas-gRNA RNPの第3のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項52から60のいずれか一項に記載の方法。
  62. 増幅アダプターを、前記WG断片の第2のセットの前記WG断片の末端にライゲーションすることと、
    前記増幅アダプターがライゲーションされた前記WG断片の第2のセットの前記WG断片のアンプリコンを生成することと、
    前記WG断片の第2のセットの前記WG断片のアンプリコンを配列決定することと
    を更に含む、請求項45から61のいずれか一項に記載の方法。
  63. 前記WG断片の第1及び第2のセットの前記WG断片のアンプリコンを、増幅及び配列決定のために一緒に混合する、請求項62に記載の方法。
  64. 前記WG断片の第2のセットの前記WG断片内の塩基対数が、約100~約1000である、請求項45から63のいずれか一項に記載の方法。
  65. 前記WG断片の第2のセットの前記WG断片内の塩基対数が、約100~約200である、請求項40から64のいずれか一項に記載の方法。
  66. 増幅アダプターを、前記WG断片の第1のセットの前記WG断片の末端にライゲーションすることと、
    前記増幅アダプターがライゲーションされた前記WG断片の第1のセットの前記WG断片のアンプリコンを生成することと、
    前記WG断片の第1のセットの前記WG断片のアンプリコンを配列決定することと
    を更に含む、請求項40から65のいずれか一項に記載の方法。
  67. 前記増幅アダプターが固有の分子識別子(UMI)を含む、請求項40から66のいずれか一項に記載の方法。
  68. 前記WG断片の第1のセットの前記WG断片内の塩基対数が、約100~約1000である、請求項40から67のいずれか一項に記載の方法。
  69. 前記WG断片の第1のセットの前記WG断片内の塩基対数が、約200~約400である、請求項40から68のいずれか一項に記載の方法。
  70. 前記Cas-gRNA RNPの第1のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項40から69のいずれか一項に記載の方法。
  71. Cas-gRNA RNPの前記第2のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項40から70のいずれか一項に記載の方法。
  72. 前記WGが二本鎖DNAを含む、請求項40から71のいずれか一項に記載の方法。
  73. 前記CasがCas9を含む、請求項40から72のいずれか一項に記載の方法。
  74. 組成物であって、
    全ゲノム(WG)のサンプルと、
    おおよそ第1の塩基対数だけ互いに離間している前記WG内の第1の配列にハイブリダイズされたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)の第1のセットと、
    おおよそ第2の塩基対数だけ互いに離間している前記WG内の第2の配列にハイブリダイズされたCas-gRNA RNPの第2のセットと
    を含み、
    前記Cas-gRNA RNPの第1及び第2のセットはそれぞれ、前記サンプル内の第1及び第2の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものである、組成物。
  75. 前記第1の塩基対数が、前記第2の塩基対数とおおよそ同じである、請求項74に記載の組成物。
  76. 前記第1の塩基対数が約100~約2000であり、前記第2の塩基対数が約100~約2000である、請求項74又は請求項75に記載の組成物。
  77. 前記第1の塩基対数が約500~約700であり、前記第2の塩基対数が約500~約700である、請求項76に記載の組成物。
  78. 前記WG断片内の塩基対数が約20%未満変動する、請求項74から77のいずれか一項に記載の組成物。
  79. 前記WG断片内の塩基対数が、約100塩基対~約1000塩基対である、請求項74から78のいずれか一項に記載の組成物。
  80. 前記WG断片内の塩基対数が、約200塩基対~約400塩基対である、請求項74から79のいずれか一項に記載の組成物。
  81. 前記Cas-gRNA RNPの第1のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項74から80のいずれか一項に記載の組成物。
  82. Cas-gRNA RNPの前記第2のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項74から81のいずれか一項に記載の組成物。
  83. 前記WGが二本鎖DNAを含む、請求項74から82のいずれか一項に記載の組成物。
  84. 前記CasがCas9を含む、請求項74から83のいずれか一項に記載の組成物。
  85. 組成物であって、
    全ゲノム(WG)のサンプルと、
    おおよそ第1の塩基対数だけ互いに離間している前記WG内の第1の配列にハイブリダイズされたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)の第1のセットと、
    おおよそ第2の塩基対数だけ互いに離間している前記WG内の第2の配列にハイブリダイズされたCas-gRNA RNPの第2のセットと、
    おおよそ第3の塩基対数だけ互いに離間している前記WG内の第3の配列にハイブリダイズされたCas-gRNA RNPの第3のセットと
    を含み、
    前記Cas-gRNA RNPの第1、第2及び第3のセットはそれぞれ、前記サンプル内の第1、第2、及び第3の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものである、組成物。
  86. 前記第1の塩基対数が、前記第2の塩基対数とおおよそ同じである、請求項85に記載の組成物。
  87. 前記第1の塩基対数が約100~約2000であり、第2の塩基対数が約100~約2000であり、第3の塩基対数が約100~約2000である、請求項85又は請求項86に記載の組成物。
  88. 前記第1の塩基対数が約500~約700であり、前記第2の塩基対数が約500~約700であり、前記第3の塩基対数が約200~約400である、請求項87に記載の組成物。
  89. 前記第3の塩基対数が、前記第1の塩基対数と異なる、請求項85から88のいずれか一項に記載の組成物。
  90. 前記第3の塩基対数が、前記第2の塩基対数と異なる、請求項85から89のいずれか一項に記載の組成物。
  91. 前記WG断片内の塩基対数が約20%未満変動する、請求項85から90のいずれか一項に記載の組成物。
  92. 前記WG断片内の塩基対数が約100~約1000である、請求項85から91のいずれか一項に記載の組成物。
  93. 前記WG断片内の塩基対数が約100~約200である、請求項92に記載の組成物。
  94. 前記Cas-gRNA RNPの第1のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項85から93のいずれか一項に記載の組成物。
  95. Cas-gRNA RNPの前記第2のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項85~94のいずれか一項に記載の組成物。
  96. 前記Cas-gRNA RNPの第3のセットが、少なくとも約1,000,000個の異なるCas-gRNA RNPを含む、請求項85から95のいずれか一項に記載の組成物。
  97. 前記WGが二本鎖DNAを含む、請求項85から96のいずれか一項に記載の組成物。
  98. 前記CasがCas9を含む、請求項85から97のいずれか一項に記載の組成物。
  99. 全ゲノム(WG)の断片を生成する方法であって、前記方法は、
    CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)のセットを、おおよそ塩基対数だけ互いに離間している前記WG内の配列にハイブリダイズさせることと、
    前記配列を前記Cas-gRNA RNPのセットでそれぞれ切断して、各々が互いにおおおよそ同じ数の塩基対を有するWG断片のセットを生成することと
    を含む、方法。
  100. 前記塩基対数が約100~約1000である、請求項99に記載の方法。
  101. 前記塩基対数が、約500~約700、又は約200~約400、又は約100~約200である、請求項99又は請求項100に記載の方法。
  102. 前記WG断片のセットの前記WG断片内の塩基対数が、約20%未満変動する、請求項99から101のいずれか一項に記載の方法。
  103. 前記WG断片のセットの前記WG断片内の塩基対数が、約100~約1000である、請求項99から102のいずれか一項に記載の方法。
  104. 前記WG断片のセットの前記WG断片内の塩基対数が、約100~約200、又は約200~約400、又は約500~約700である、請求項99~103のいずれか一項に記載の方法。
  105. 増幅アダプターを、前記WG断片のセットの前記WG断片の末端にライゲーションすることと、
    前記増幅アダプターがライゲーションされた前記WG断片のセットの前記WG断片のアンプリコンを生成することと、
    前記WG断片のセットの前記WG断片のアンプリコンを配列決定することと
    を更に含む、請求項99から104のいずれか一項に記載の方法。
  106. 前記増幅アダプターが固有の分子識別子(UMI)を含む、請求項105に記載の方法。
  107. 前記WGが二本鎖DNAを含む、請求項99から106のいずれか一項に記載の方法。
  108. 前記CasがCas9を含む、請求項99から107のいずれか一項に記載の方法。
  109. 組成物であって、
    全ゲノム(WG)のサンプルと、及び
    おおよそ塩基対数だけ互いに離間しているWG内の配列にハイブリダイズされたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)のセットと
    を含み、
    前記Cas-gRNA RNPのセットはそれぞれ、前記サンプル内の配列を切断して、各々が互いにおおよそ同じ数の塩基対を有するWG断片を生成するためのものである、組成物。
  110. 前記塩基対数が約100~約1000である、請求項109に記載の組成物。
  111. 前記塩基対数が、約500~約700、又は約200~約400、又は約100~約200である、請求項109又は請求項110に記載の組成物。
  112. 前記WG断片のセットの前記WG断片内の塩基対数が、約20%未満変動する、請求項109から111のいずれか一項に記載の組成物。
  113. 前記WG断片のセットの前記WG断片内の塩基対数が、約100~約1000である、請求項109から112のいずれか一項に記載の組成物。
  114. 前記WG断片のセットの前記WG断片内の塩基対数が、約100~約200、又は約200~約400、又は約500~約700である、請求項109~113のいずれか一項に記載の組成物。
  115. 前記WGが二本鎖DNAを含む、請求項109から114のいずれか一項に記載の組成物。
  116. 前記CasがCas9を含む、請求項109から115のいずれか一項に記載の組成物。
  117. 各々が互いにおおよそ同じ数の塩基対を有する少なくとも約1,000,000個のWG断片のセットを含み得る、組成物。
  118. 前記塩基対数が約100~約200である、請求項117に記載の組成物。
  119. 前記塩基対数が約200~約400である、請求項117に記載の組成物。
  120. 前記塩基対数が約500~約700である、請求項117に記載の組成物。
  121. 前記WGが二本鎖DNAを含む、請求項117から120のいずれか一項に記載の組成物。
  122. 前記WG断片のセットの前記WG断片内の塩基対数が、約20%未満変動する、請求項117から121のいずれか一項に記載の組成物。
  123. 前記WG断片のセットの前記WG断片内の塩基対数が、約10%未満変動する、請求項117から122のいずれか一項に記載の組成物。
  124. 前記WG断片のセットの前記WG断片内の塩基対数が、約5%未満変動する、請求項117から123のいずれか一項に記載の組成物。
  125. 請求項99から108のいずれか一項に記載の方法を使用して調製される、請求項117から124のいずれか一項に記載の組成物。
  126. 配列を有する標的ポリヌクレオチドの分子を切断する方法であって、前記方法は、
    流体中で、前記標的ポリヌクレオチドの第1及び第2の分子を、複数の第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と接触させることと、
    前記第1のCas-gRNA RNPのうちの1つを前記第1の分子中の第1の部分配列にハイブリダイズさせることと、
    前記第2のCas-gRNA RNPのうちの1つを前記第2の分子中の第2の部分配列にハイブリダイズさせることであって、前記第2の部分配列が前記第1の部分配列と部分的にのみ重複する、ことと、
    前記第1のCas-gRNA RNPのうちの1つによって、前記第1の分子中の前記第2の部分配列への前記第2のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することと、
    前記第2のCas-gRNA RNPのうちの1つによって、前記第2の分子中の前記第1の部分配列への前記第1のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することと、
    前記第1の部分配列において前記第1の分子を切断することと、
    前記第2の部分配列において前記第2の分子を切断することと
    を含む、方法。
  127. 前記第1の分子における切断部が、前記標的ポリヌクレオチドの配列中で、前記第2の分子における切断部とは異なる位置にある、請求項126に記載の方法。
  128. 前記第1の分子における切断部が、前記標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ前記第2の分子における切断部からオフセットしている、請求項126又は請求項127に記載の方法。
  129. 前記第1の分子を、前記第1のCas-gRNA RNPのうちの1つを使用して切断し、前記第2の分子を、前記第2のCas-gRNA RNPのうちの1つを使用して切断する、請求項126から128のいずれか一項に記載の方法。
  130. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項126から129のいずれか一項に記載の方法。
  131. 前記Casが、Cas9又はdCas9を含む、請求項126から130のいずれか一項に記載の方法。
  132. 前記流体中で、前記標的ポリヌクレオチドの第1及び第2の分子を複数の第3及び第4のCas-gRNA RNPと接触させることと、
    前記第3のCas-gRNA RNPのうちの1つを前記第1の分子中の第3の部分配列にハイブリダイズさせることと、
    前記第3のCas-gRNA RNPのうちの1つによって、前記第1の分子中の第4の部分配列への前記第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することであって、前記第4の部分配列が前記第3の部分配列と部分的にのみ重複する、ことと、
    前記第3のCas-gRNA RNPのうちの1つを使用して前記第3の部分配列において前記第1の分子を切断して、第1の断片を生成することと
    を更に含む、請求項126から131のいずれか一項に記載の方法。
  133. 前記流体中で、前記標的ポリヌクレオチドの第1及び第2の分子を複数の第3及び第4のCas-gRNA RNPと接触させることと、
    前記第4のCas-gRNA RNPのうちの1つを前記第1の分子中の第4の部分配列にハイブリダイズさせることと、
    前記第4のCas-gRNA RNPのうちの1つによって、前記第1の分子中の前記第3の部分配列への前記第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することと、
    前記第4のCas-gRNA RNPのうちの1つを使用して前記第4の部分配列において前記第1の分子を切断して、第1の断片を生成することと
    を更に含む、請求項126から132のいずれか一項に記載の方法。
  134. 前記第3のCas-gRNA RNPのうちの1つを前記第2の分子中の前記第3の部分配列にハイブリダイズさせることと、
    前記第3のCas-gRNA RNPのうちの1つによって、前記第2の分子中の前記第4の部分配列への前記第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することと、
    前記第3のCas-gRNA RNPのうちの1つを使用して前記第3の部分配列において前記第2の分子を切断して、第2の断片を生成することと
    を更に含む、請求項132又は133に記載の方法。
  135. 前記第4のCas-gRNA RNPのうちの1つを前記第2の分子中の第4の部分配列にハイブリダイズさせることと、
    前記第4のCas-gRNA RNPのうちの1つによって、前記第2の分子中の前記第3の部分配列への前記第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害することと、
    前記第4のCas-gRNA RNPのうちの1つを使用して前記第4の部分配列において前記第2の分子を切断して、第2の断片を生成することと
    を更に含む、請求項132又は133に記載の方法。
  136. 前記第1のCas-gRNA RNPのうちの1つ及び前記第3又は第4のCas-gRNA RNPのうちの1つが前記第1の分子にハイブリダイズしている間に、前記第1のCas-gRNA RNPのうちの1つと前記第3又は第4のCas-gRNA RNPのうちの1つとの間にない前記第1の分子の任意の部分を分解することを更に含む、請求項132から135のいずれか一項に記載の方法。
  137. 前記第2のCas-gRNA RNPのうちの1つ及び前記第3又は第4のCas-gRNA RNPのうちの1つが前記第2の分子にハイブリダイズしている間に、前記第2のCas-gRNA RNPのうちの1つと前記第3又は第4のCas-gRNA RNPのうちの1つとの間にない前記第2の分子の任意の部分を分解することを更に含む、請求項134から136のいずれか一項に記載の方法。
  138. 前記分解がエキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して行われる、請求項136又は請求項137に記載の方法。
  139. 前記第1の分子を、前記第3又は第4のCas-gRNA RNPのうちの1つを使用して切断し、前記第2の分子を、前記第3又は第4のCas-gRNA RNPのうちの1つを使用して切断する、請求項134から138のいずれか一項に記載の方法。
  140. 前記第1及び第2の断片が、互いに異なる塩基対数を含む、請求項134から139のいずれか一項に記載の方法。
  141. 前記第1の断片が約100塩基対~約1000塩基対の長さを有し、前記第2の断片が約100塩基対~約1000塩基対の長さを有する、請求項134から140のいずれか一項に記載の方法。
  142. 前記第1の断片が約500塩基対~約700塩基対の長さを有し、前記第2の断片が約500塩基対~約700塩基対の長さを有する、請求項134から141のいずれか一項に記載の方法。
  143. 前記第1の断片が約200塩基対~約400塩基対の長さを有し、前記第2の断片が約200塩基対~約400塩基対の長さを有する、請求項134から142のいずれか一項に記載の方法。
  144. 前記第1の断片が約100塩基対~約200塩基対の長さを有し、前記第2の断片が約100塩基対~約200塩基対の長さを有する、請求項134から143のいずれか一項に記載の方法。
  145. 標的ポリヌクレオチドを配列決定する方法であって、前記方法は、
    請求項134から144のいずれか一項に記載の方法を使用して、前記標的ポリヌクレオチドの第1及び第2の断片を生成することと、
    増幅アダプターを前記第1及び第2の断片の末端にライゲーションすることと、
    前記増幅アダプターがライゲーションされた前記第1及び第2の断片のアンプリコンをそれぞれ生成することと、
    前記第1及び第2の断片のアンプリコンを配列決定することと
    を含む、方法。
  146. 前記第1、第2、第3、及び第4の部分配列を使用することと、前記第1の断片のアンプリコンを前記第1の分子に由来するものとして同定することと、前記第2の断片のアンプリコンを前記第2の分子に由来するものとして同定することとを更に含む、請求項145に記載の方法。
  147. 前記アンプリコンを生成する前に、固有の分子識別子(UMI)を前記第1及び第2の断片の末端にライゲーションすることと、
    前記UMIを使用することと、前記第1の断片のアンプリコンを前記第1の分子に由来するものとして同定することと、前記第2の断片のアンプリコンを前記第2の分子に由来するものとして同定することとを更に含む、請求項145又は146に記載の方法。
  148. 前記UMIは、前記増幅アダプターと同じ操作で、前記第1及び第2の断片の末端にカップリングされ、ライゲーションされる、請求項147に記載の方法。
  149. 組成物であって、
    配列を有する標的ポリヌクレオチドの第1及び第2の分子と、
    複数の第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と
    を含み、
    前記第1のCas-gRNA RNPのうちの1つが、前記第1の分子中の第1の部分配列にハイブリダイズしており、前記第1の分子中の第2の部分配列への前記第2のCas-gRNA RNPのうちのいずれかのハイブリダイゼーションを阻害し、前記第2の部分配列が前記第1の部分配列と部分的にのみ重複しており、
    前記第2のCas-gRNA RNPのうちの1つが、前記第2の分子中の第2の部分配列にハイブリダイズしており、前記第2の分子中の第1の部分配列への第1のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害する、組成物。
  150. 前記第1の分子における切断部が、前記標的ポリヌクレオチドの配列中で、前記第2の分子における切断部とは異なる位置にある、請求項149に記載の組成物。
  151. 前記第1の分子における切断部が、前記標的ポリヌクレオチドの配列中で、約2塩基対~約10塩基対だけ前記第2の分子における切断部からオフセットしている、請求項149又は請求項150に記載の組成物。
  152. 前記第1のCas-gRNA RNPのうちの1つが、前記第1の分子を切断するためのものであり、前記第2のCas-gRNA RNPのうちの1つが、前記第2の分子を切断するためのものである、請求項149から151のいずれか一項に記載の組成物。
  153. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項149から152のいずれか一項に記載の組成物。
  154. 前記Casが、Cas9又はdCas9を含む、請求項149から153のいずれか一項に記載の組成物。
  155. 複数の第3及び第4のCas-gRNA RNP
    を更に含み、
    前記第3のCas-gRNA RNPのうちの1つが、前記第1の分子中の前記第3の部分配列にハイブリダイズしており、前記第1の分子中の前記第4の部分配列への前記第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害し、前記第3の部分配列において前記第1の分子を切断して第1の断片を生成するためのものであり、前記第4の部分配列が前記第3の部分配列と部分的にのみ重複している、請求項149から154のいずれか一項に記載の組成物。
  156. 複数の第3及び第4のCas-gRNA RNP
    を更に含み、
    前記第4のCas-gRNA RNPのうちの1つが、前記第1の分子中の前記第4の部分配列にハイブリダイズしており、前記第1の分子中の前記第3の部分配列への前記第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害し、前記第4の部分配列において前記第1の分子を切断して第1の断片を生成するためのものであり、前記第4の部分配列が前記第3の部分配列と部分的にのみ重複している、請求項149から154のいずれか一項に記載の組成物。
  157. 前記第3のCas-gRNA RNPのうちの1つが、前記第2の分子中の前記第3の部分配列にハイブリダイズしており、前記第2の分子中の前記第4の部分配列への前記第4のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害し、前記第3の部分配列において前記第2の分子を切断して第2の断片を生成するためのものである、請求項155又は156のに記載の組成物。
  158. 前記第4のCas-gRNA RNPのうちの1つが、前記第2の分子中の前記第4の部分配列にハイブリダイズしており、前記第2の分子中の前記第3の部分配列への前記第3のCas-gRNA RNPのいずれかのハイブリダイゼーションを阻害し、前記第4の部分配列において前記第2の分子を切断して第2の断片を生成するためのものである、請求項155又は156のに記載の組成物。
  159. 前記第1のCas-gRNA RNPのうちの1つと前記第3又は第4のCas-gRNA RNPのうちの1つとの間にない前記第1の分子の任意の部分を分解するためのエキソヌクレアーゼを更に含む、請求項155から158のいずれか一項に記載の組成物。
  160. 前記第2のCas-gRNA RNPのうちの1つと前記第3又は第4のCas-gRNA RNPのうちの1つとの間にない前記第2の分子の任意の部分を分解するためのエキソヌクレアーゼを更に含む、請求項157から159のいずれか一項に記載の組成物。
  161. 前記エキソヌクレアーゼが、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを含む、請求項159又は請求項160に記載の組成物。
  162. 前記第3又は第4のCas-gRNA RNPのうちの1つが、前記第1の分子を切断するためのものであり、前記第3又は第4のCas-gRNA RNPのうちの1つが、前記第2の分子を切断するためのものである、請求項158から161のいずれか一項に記載の組成物。
  163. 前記第1及び第2の断片が、互いに異なる塩基対数を含む、請求項158から162のいずれか一項に記載の組成物。
  164. 前記第1の断片が約100塩基対~約1000塩基対の長さを有し、前記第2の断片が約100塩基対~約1000塩基対の長さを有する、請求項158から163のいずれか一項に記載の組成物。
  165. 前記第1の断片が約500塩基対~約700塩基対の長さを有し、前記第2の断片が約500塩基対~約700塩基対の長さを有する、請求項158~164のいずれか一項に記載の組成物。
  166. 前記第1の断片が約200塩基対~約400塩基対の長さを有し、前記第2の断片が約200塩基対~約400塩基対の長さを有する、請求項158から164のいずれか一項に記載の組成物。
  167. 前記第1の断片が約100塩基対~約200塩基対の長さを有し、前記第2の断片が約100塩基対~約200塩基対の長さを有する、請求項158から164のいずれか一項に記載の組成物。
  168. 組成物であって、
    配列を有する標的ポリヌクレオチドの第1及び第2の分子
    を含み、
    前記第1の分子は、第1の部分配列に第1の末端を有し、
    前記第2の分子は、第2の部分配列に第1の末端を有し、前記第1の部分配列は、前記第2の部分配列と部分的にのみ重複する、組成物。
  169. 前記第1の分子における前記第1の末端が、前記標的ポリヌクレオチドの配列中で、前記第2の分子の第1の末端とは異なる位置にある、請求項168に記載の組成物。
  170. 前記第1の分子における前記第1の末端が、前記標的ポリヌクレオチドの配列中、約2塩基対~約10塩基対だけ前記第2の分子の第1の末端からオフセットしている、請求項168又は請求項169に記載の組成物。
  171. 前記第1の分子が、第3の部分配列に第2の末端を更に有し、
    前記第2の分子が、前記第3の部分配列又は第4の部分配列に第2の末端を更に有し、前記第3の部分配列が、前記第4の部分配列と部分的にのみ重複する、請求項168から170のいずれか一項に記載の組成物。
  172. 前記第1の分子における前記第2の末端が、前記標的ポリヌクレオチドの配列中で、前記第2の分子の第2の末端とは異なる位置にある、請求項171に記載の組成物。
  173. 前記第1の分子における前記第2の末端が、前記標的ポリヌクレオチドの配列中、約2塩基対~約10塩基対だけ前記第2の分子の第2の末端からオフセットしている、請求項171又は請求項172に記載の組成物。
  174. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項168から173のいずれか一項に記載の組成物。
  175. 前記第1及び第2の分子が、互いに異なる塩基対数を含む、請求項168から174のいずれか一項に記載の組成物。
  176. 前記第1の分子が約100塩基対~約1000塩基対の長さを有し、前記第2の分子が約100塩基対~約1000塩基対の長さを有する、請求項168から175のいずれか一項に記載の組成物。
  177. 前記第1の断片が約500塩基対~約700塩基対の長さを有し、前記第2の断片が約500塩基対~約700塩基対の長さを有する、請求項168から176のいずれか一項に記載の組成物。
  178. 前記第1の断片が約200塩基対~約400塩基対の長さを有し、前記第2の断片が約200塩基対~約400塩基対の長さを有する、請求項168から176のいずれか一項に記載の組成物。
  179. 前記第1の断片が約100塩基対~約200塩基対の長さを有し、前記第2の断片が約100塩基対~約200塩基対の長さを有する、請求項168から176のいずれか一項に記載の組成物。
  180. 配列を有する標的ポリヌクレオチドの断片を生成する方法であって、前記方法は、
    流体中で、前記標的ポリヌクレオチドを第1及び第2の融合タンパク質と接触させることであって、
    前記第1の融合タンパク質は、第1の増幅アダプターがカップリングされた第1のトランスポザーゼにカップリングした第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含み、
    前記第2の融合タンパク質は、第2の増幅アダプターがカップリングされた第2のトランスポザーゼにカップリングした第2のCas-gRNA RNPを含む、ことと、
    前記第1及び第2のCas-gRNA RNPの活性を促進し、前記第1及び第2のトランスポザーゼの活性を阻害しながら、
    前記第1のCas-gRNA RNPを前記標的ポリヌクレオチド中の第1の部分配列にハイブリダイズさせることと、
    前記第2のCas-gRNA RNPを前記標的ポリヌクレオチド中の第2の部分配列にハイブリダイズさせることと、次いで、
    前記第1及び第2のトランスポザーゼの活性を促進しながら、
    前記第1のトランスポザーゼを使用して、前記第1の増幅アダプターを前記標的ポリヌクレオチド中の第1の位置に付加することと、
    前記第2のトランスポザーゼを使用して、前記標的ポリヌクレオチド中の第2の位置に前記第2の増幅アダプターを付加することと
    含む、方法。
  181. 前記流体の第1の条件を使用して、前記Cas-gRNA RNPの活性が促進され、トランスポザーゼの活性が阻害される、請求項180記載の方法。
  182. 前記流体の前記第1の条件が、前記Cas-gRNA RNPの活性のために十分な量のカルシウムイオン、マンガンイオン、又はカルシウムイオンとマンガンイオンとの両方の存在を含む、請求項181記載の方法。
  183. 前記流体の前記第1の条件が、前記トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む、請求項181又は請求項182に記載の方法。
  184. 前記流体の第2の条件を使用して、前記トランスポザーゼの活性を促進させる、請求項180から183のいずれか一項に記載の方法。
  185. 前記流体の第2の条件が、前記トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む、請求項184に記載の方法。
  186. 前記第1の融合タンパク質のCas-gRNA RNPが前記第1の部分配列にハイブリダイズし、前記第2の融合タンパク質のCas-gRNA RNPが前記第2の部分配列にハイブリダイズしている間に、前記第1の融合タンパク質のCas-gRNA RNPと前記第2の融合タンパク質のCas-gRNA RNPとの間にない前記標的ポリヌクレオチドの任意の部分を分解することを更に含む、請求項180から185のいずれか一項に記載の方法。
  187. 前記分解がエキソヌクレアーゼIII又はエキソヌクレアーゼVIIを使用して行われる、請求項188に記載の方法。
  188. 前記標的ポリヌクレオチドを前記第1及び第2の融合タンパク質から遊離させて、一方の末端に前記第1の増幅アダプターを有し、他方の末端に前記第2の増幅アダプターを有する前記標的ポリヌクレオチドの断片を提供することを更に含む、請求項180から187のいずれか一項に記載の方法。
  189. 前記遊離は、プロテイナーゼK、ドデシル硫酸ナトリウム(SDS)、又はプロテイナーゼKとSDSとの両方を使用して行われる、請求項188に記載の方法。
  190. 前記断片が、約100塩基対~約1000塩基対の長さを有する、請求項188又は請求項189に記載の方法。
  191. 前記断片が、約500塩基対~約700塩基対の長さを有する、請求項188から190のいずれか一項に記載の方法。
  192. 前記断片が、約200塩基対~約400塩基対の長さを有する、請求項188から190のいずれか一項に記載の方法。
  193. 前記断片が、約100塩基対~約200塩基対の長さを有する、請求項188から190のいずれか一項に記載の方法。
  194. 前記CasがdCas9を含む、請求項180から193のいずれか一項に記載の方法。
  195. 前記トランスポザーゼがTn5を含む、請求項180から194のいずれか一項に記載の方法。
  196. 前記第1の増幅アダプターがP5アダプターを含み、前記第2の増幅アダプターがP7アダプターを含む、請求項180から195のいずれか一項に記載の方法。
  197. 前記第1の増幅アダプターが第1の固有の分子識別子(UMI)を含み、前記第2の増幅アダプターが第2のUMIを含む、請求項180から196のいずれか一項に記載の方法。
  198. 前記第1の位置が前記第1の部分配列の約10塩基以内であり、前記第2の位置が前記第2の部分配列の約10塩基以内である、請求項180から197のいずれか一項に記載の方法。
  199. 前記第1及び第2の融合タンパク質の各々において、前記Cas-gRNA RNPが、共有結合を介して前記トランスポザーゼにカップリングされる、請求項180から198のいずれか一項に記載の方法。
  200. 前記第1及び第2の融合タンパク質の各々において、前記Cas-gRNA RNPが、非共有結合を介して前記トランスポザーゼにカップリングされる、請求項180から198のいずれか一項に記載の方法。
  201. 前記Cas-gRNA RNPが、抗体に共有結合的にカップリングされ、前記トランスポザーゼは、前記抗体が非共有結合的にカップリングされる抗原に共有結合的にカップリングされるか、又は前記Cas-gRNA RNPは、抗原に共有結合的にカップリングされ、前記トランスポザーゼは、前記抗原が非共有結合的にカップリングされる抗体に共有結合的にカップリングされる、請求項200に記載の方法。
  202. 前記Cas-gRNAが、前記gRNAと前記第1又は第2の増幅アダプターとの間のハイブリダイゼーションを介してトランスポザーゼに非共有結合的にカップリングされる、請求項200に記載の方法。
  203. 前記Cas-gRNAが、前記gRNAと前記トランスポザーゼ内のオリゴヌクレオチドとの間のハイブリダイゼーションを介して前記トランスポザーゼに非共有結合的にカップリングされる、請求項200に記載の方法。
  204. 前記第1の融合タンパク質において、前記第1の部分配列にハイブリダイズするgRNAの一部が、約15~約18ヌクレオチドの長さを有し、
    前記第2の融合タンパク質において、前記第2の部分配列にハイブリダイズするgRNAの一部が、約15~約18ヌクレオチドの長さを有する、請求項180から203のいずれか一項に記載の方法。
  205. 前記第1及び第2の融合タンパク質が、前記標的ポリヌクレオチドに対しておおよそ化学量論比である、請求項180から204のいずれか一項に記載の方法。
  206. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項180から205のいずれか一項に記載の方法。
  207. 標的ポリヌクレオチドを配列決定する方法であって、前記方法は、
    請求項188から206又は294から302のいずれか一項に記載の方法を使用して前記標的ポリヌクレオチドの断片を生成することと、
    前記断片のアンプリコンを生成することと、
    アンプリコンを配列決定することと
    を含む、方法。
  208. 組成物であって、
    配列を有する標的ポリヌクレオチドと、
    第1の増幅アダプターがカップリングされた第1のトランスポザーゼにカップリングした第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含む第1の融合タンパク質であって、前記第1のCas-gRNA RNPが前記標的ポリヌクレオチド中の第1の部分配列にハイブリダイズされている、第1の融合タンパク質と
    を含む、組成物。
  209. 第2の増幅アダプターがカップリングされた第2のトランスポザーゼにカップリングした第2のCas-gRNA RNPを含む第2の融合タンパク質であって、前記第2のCas-gRNA RNPが前記標的ポリヌクレオチド中の第2の部分配列にハイブリダイズされている、第2の融合タンパク質と
    を更に含む、請求項208に記載の組成物。
  210. 前記第1のCas-gRNA RNPの活性を促進し、前記第1のトランスポザーゼの活性を阻害する条件を有する流体を更に含む、請求項208又は請求項209に記載の組成物。
  211. 前記流体の条件が、前記第1のCas-gRNA RNPの活性のために十分な量のカルシウムイオン、マンガンイオン、又はカルシウムイオンとマンガンイオンとの両方の存在を含む、請求項210に記載の組成物。
  212. 前記流体の条件が、前記第1のトランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む、請求項210又は請求項211に記載の組成物。
  213. 前記第1のトランスポザーゼの活性を促進する条件を有する流体を更に含み、前記第1のトランスポザーゼが前記第1の増幅アダプターを前記標的ポリヌクレオチド中の第1の位置に付加する、請求項208又は請求項209に記載の組成物。
  214. 前記第2のトランスポザーゼを使用して、前記標的ポリヌクレオチド中の第2の位置に前記第2の増幅アダプターを付加する、請求項213に記載の組成物。
  215. 前記流体の条件が、前記第1のトランスポザーゼの活性のために十分な量のマグネシウムイオンが存在することを含む、請求項214に記載の組成物。
  216. 前記標的ポリヌクレオチドを前記第1及び第2の融合タンパク質から遊離させて、一方の末端に前記第1の増幅アダプターを有し、他方の末端に前記第2の増幅アダプターを有する前記標的ポリヌクレオチドの断片を提供するための薬剤を更に含む、請求項214に記載の組成物。
  217. 前記薬剤が、プロテイナーゼK、ドデシル硫酸ナトリウム(SDS)、又はプロテイナーゼKとSDSとの両方を含む、請求項216に記載の組成物。
  218. 前記断片が、約100塩基対~約1000塩基対の長さを有する、請求項216又は請求項217に記載の組成物。
  219. 前記断片が、約500塩基対~約700塩基対の長さを有する、請求項216から218のいずれか一項に記載の組成物。
  220. 前記断片が、約200塩基対~約400塩基対の長さを有する、請求項216から218のいずれか一項に記載の組成物。
  221. 前記断片が、約100塩基対~約200塩基対の長さを有する、請求項216から218のいずれか一項に記載の組成物。
  222. 前記第1及び第2のCas-gRNA RNPの間にない前記標的ポリヌクレオチドの任意の部分を分解するためのエキソヌクレアーゼを更に含む、請求項209から221のいずれか一項に記載の組成物。
  223. 前記エキソヌクレアーゼが、エキソヌクレアーゼIII又はエキソヌクレアーゼVIIを含む、請求項222に記載の組成物。
  224. 前記CasがdCas9を含む、請求項208から223のいずれか一項に記載の組成物。
  225. 前記トランスポザーゼがTn5を含む、請求項208から224のいずれか一項に記載の組成物。
  226. 前記第1のアダプターがP5アダプターを含み、前記第2のアダプターがP7アダプターを含む、請求項209から225のいずれか一項に記載の組成物。
  227. 前記第1の増幅アダプターが第1の固有の分子識別子(UMI)を含み、前記第2の増幅アダプターが第2のUMIを含む、請求項209から226のいずれか一項に記載の組成物。
  228. 前記第1の位置が前記第1の部分配列の約10塩基以内であり、前記第2の位置が前記第2の部分配列の約10塩基以内である、請求項209から227のいずれか一項に記載の組成物。
  229. 前記第1のCas-gRNA RNPが、共有結合を介して前記第1のトランスポザーゼにカップリングされている、請求項208から228のいずれか一項に記載の組成物。
  230. 前記第1のCas-gRNA RNPが、非共有結合を介して前記第1のトランスポザーゼにカップリングされている、請求項208から229のいずれか一項に記載の組成物。
  231. 前記第1のCas-gRNA RNPが、抗体に共有結合的にカップリングされ、第1のトランスポザーゼは、前記抗体が非共有結合的にカップリングされる抗原に共有結合的にカップリングされるか、又は前記第1のCas-gRNA RNPが、抗原に共有結合的にカップリングされ、第1のトランスポザーゼは、前記抗原が非共有結合的にカップリングされる抗体に共有結合的にカップリングされる、請求項230に記載の組成物。
  232. 前記第1のCas-gRNAが、前記gRNAと前記第1の増幅アダプターとの間のハイブリダイゼーションを介して前記第1のトランスポザーゼに非共有結合的にカップリングされている、請求項231に記載の組成物。
  233. 前記第1のCas-gRNAが、前記gRNAと前記第1のトランスポザーゼ内のオリゴヌクレオチドとの間のハイブリダイゼーションを介して前記第1のトランスポザーゼに非共有結合的にカップリングされている、請求項231に記載の組成物。
  234. 前記第1の融合タンパク質において、前記第1の部分配列にハイブリダイズするgRNAの一部が、約15~約18ヌクレオチドの長さを有する、請求項208から233のいずれか一項に記載の組成物。
  235. 前記第1の融合タンパク質が、前記標的ポリヌクレオチドに対しておおよそ化学量論比である、請求項208から234のいずれか一項に記載の組成物。
  236. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項208から235のいずれか一項に記載の組成物。
  237. 標的ポリヌクレオチドのそれぞれの遺伝子座にカップリングしたタンパク質を特徴付ける方法であって、前記方法は、
    前記標的ポリヌクレオチドを、第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と接触させることと、
    前記第1及び第2のCas-gRNA RNPを前記標的ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることであって、前記タンパク質が前記第1及び第2の部分配列間の前記標的ポリヌクレオチドのそれぞれの遺伝子座にカップリングされている、ことと、
    前記第1のCas-gRNA RNPを使用して前記第1の部分配列において前記標的ポリヌクレオチドを切断し、前記第2のCas-gRNA RNPを使用して前記第2の部分配列において前記標的ポリヌクレオチドを切断して断片を形成することであって、前記タンパク質が前記断片のそれぞれの遺伝子座にカップリングされている、ことと、
    対応するオリゴヌクレオチドを使用して、前記断片のそれぞれの遺伝子座にカップリングした前記タンパク質の各々をそれぞれ標識することと、
    対応するオリゴヌクレオチドを配列決定することと
    を含む、方法。
  238. 前記対応するオリゴヌクレオチドを使用して前記断片のそれぞれの遺伝子座にカップリングしたタンパク質の各々をそれぞれ標識する前に前記断片を濃縮することを更に含む、請求項237に記載の方法。
  239. 前記断片が前記第1及び第2のCas-gRNA RNPを介してタグにカップリングされるように、前記第1及び第2のCas-gRNA RNPがそれぞれタグにカップリングされており、
    前記濃縮が、
    前記第1及び第2のCas-gRNA RNPを介して前記タグにカップリングした前記断片を、タグパートナーにカップリングした基材と接触させ、
    前記タグを前記タグパートナーにカップリングさせて前記断片を前記基材にカップリングすることと、
    前記基材にカップリングされていない前記標的ポリヌクレオチドの任意の部分を除去することと
    を含む、請求項238に記載の方法。
  240. 前記対応するオリゴヌクレオチドを使用して前記タンパク質を同定することを更に含む、請求項237から239のいずれか一項に記載の方法。
  241. 前記対応するオリゴヌクレオチドを使用して前記遺伝子座を同定することを更に含む、請求項237から240のいずれか一項に記載の方法。
  242. 前記対応するオリゴヌクレオチドを使用して前記タンパク質を定量化することを更に含む、請求項237から241のいずれか一項に記載の方法。
  243. 前記対応するオリゴヌクレオチドを使用して前記タンパク質の各々をそれぞれ標識することが、
    前記断片を、異なるタンパク質に特異的な抗体の混合物と接触させることであって、前記抗体の各々が、対応するオリゴヌクレオチドにカップリングされている、ことと、
    前記断片のそれぞれの遺伝子座にカップリングした前記タンパク質に特異的である混合物中の任意の抗体について、それらの抗体及び前記対応するオリゴヌクレオチドをそれらのタンパク質にカップリングさせることと
    を含む、請求項237から242のいずれか一項に記載の方法。
  244. 複数のタンパク質が前記遺伝子座のそれぞれ1つにカップリングされており、前記混合物中の複数の抗体がその遺伝子座において前記タンパク質にカップリングされている、請求項243に記載の方法。
  245. 前記対応するオリゴヌクレオチドを配列決定することが、前記対応するオリゴヌクレオチドをビーズアレイにハイブリダイズさせることを含む、請求項243又は請求項244に記載の方法。
  246. 前記対応するオリゴヌクレオチドを配列決定することが、前記対応するオリゴヌクレオチドに対して合成による配列決定を行うことを含む、請求項243又は請求項244に記載の方法。
  247. 前記対応するオリゴヌクレオチドが、固有の分子識別子(UMI)を含む、請求項243から246のいずれか一項に記載の方法。
  248. 前記対応するオリゴヌクレオチドのそれぞれの存在を使用して前記タンパク質を同定することを含む、請求項243から247のいずれか一項に記載の方法。
  249. 前記対応するオリゴヌクレオチドのそれぞれの量を使用して前記タンパク質を定量化することを含む、請求項243から248のいずれか一項に記載の方法。
  250. 前記対応するオリゴヌクレオチドを使用して前記タンパク質の各々をそれぞれ標識することが、
    前記断片を複数のトランスポザーゼと接触させることであって、前記トランスポザーゼの各々が対応するオリゴヌクレオチドにカップリングされている、ことと、
    前記断片のそれぞれの遺伝子座にカップリングした前記タンパク質によって、前記遺伝子座において前記トランスポザーゼの活性を阻害することと、
    前記遺伝子座以外の位置で、トランスポザーゼを使用して、前記対応するオリゴヌクレオチドを前記断片に付加することと
    を含む、請求項237から242のいずれか一項に記載の方法。
  251. 前記対応するオリゴヌクレオチドを配列決定することが、前記対応するオリゴヌクレオチドが付加された前記断片に対して合成による配列決定を行うことを含む、請求項250に記載の方法。
  252. 前記対応するオリゴヌクレオチドの断片内のそれぞれの位置を使用して、前記タンパク質のそれぞれの遺伝子座を同定することを含む、請求項250又は請求項251に記載の方法。
  253. 前記トランスポザーゼが前記断片を部分断片に分割し、前記合成による配列決定が前記部分断片に対して行われる、請求項250から252のいずれか一項に記載の方法。
  254. 前記対応するオリゴヌクレオチドが増幅アダプターを含む、請求項250から253のいずれか一項に記載の方法。
  255. 前記増幅アダプターがP5アダプター及びP7アダプターを含む、請求項254に記載の方法。
  256. 前記増幅アダプターが固有の分子識別子(UMI)を含む、請求項254又は請求項255に記載の方法。
  257. 前記CasがCas9を含む、請求項237から256のいずれか一項に記載の方法。
  258. 前記断片が、約100塩基対~約1000塩基対の長さを有する、請求項237から257のいずれか一項に記載の方法。
  259. 前記断片が、約500塩基対~約700塩基対の長さを有する、請求項237から258のいずれか一項に記載の方法。
  260. 前記断片が、約200塩基対~約400塩基対の長さを有する、請求項237から259のいずれか一項に記載の方法。
  261. 前記断片が、約100塩基対~約200塩基対の長さを有する、請求項237から260のいずれか一項に記載の方法。
  262. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項237から261のいずれか一項に記載の方法。
  263. 組成物であって、
    標的ポリヌクレオチドの断片であって、タンパク質が前記断片のそれぞれの遺伝子座にカップリングされている、標的ポリヌクレオチドの断片と、
    異なるタンパク質に特異的な抗体の混合物であって、前記抗体の各々が、対応するオリゴヌクレオチドにカップリングされている、抗体の混合物と
    を含み、
    前記断片のそれぞれの遺伝子座にカップリングした前記タンパク質に特異的である前記混合物中の任意の抗体について、それらの抗体及び前記対応するオリゴヌクレオチドが、それらのタンパク質にカップリングされている、組成物。
  264. 複数のタンパク質が前記遺伝子座のそれぞれ1つにカップリングされ、前記混合物中の複数の抗体がその遺伝子座において前記タンパク質にカップリングされる、請求項263に記載の方法。
  265. 前記対応するオリゴヌクレオチドが、固有の分子識別子(UMI)を含む、請求項263又は請求項264に記載の組成物。
  266. 前記対応するオリゴヌクレオチドのそれぞれの存在が、前記タンパク質を同定するために使用可能である、請求項263から265のいずれか一項に記載の組成物。
  267. 前記対応するオリゴヌクレオチドのそれぞれの量が、前記タンパク質を定量化するために使用可能である、請求項263から266のいずれか一項に記載の組成物。
  268. 前記断片が、約100塩基対~約1000塩基対の長さを有する、請求項263から267のいずれか一項に記載の組成物。
  269. 前記断片が、約500塩基対~約700塩基対の長さを有する、請求項263から268のいずれか一項に記載の組成物。
  270. 前記断片が、約200塩基対~約400塩基対の長さを有する、請求項263から268のいずれか一項に記載の組成物。
  271. 前記断片が、約100塩基対~約200塩基対の長さを有する、請求項263から268のいずれか一項に記載の組成物。
  272. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項263から271のいずれか一項に記載の組成物。
  273. 組成物であって、
    標的ポリヌクレオチドの断片であって、タンパク質が前記断片のそれぞれの遺伝子座にカップリングされている、標的ポリヌクレオチドの断片と、
    複数のトランスポザーゼであって、前記トランスポザーゼの各々が対応するオリゴヌクレオチドにカップリングされている、複数のトランスポザーゼと、
    前記遺伝子座において前記トランスポザーゼの活性を阻害する前記断片のそれぞれの遺伝子座にカップリングしたタンパク質と、
    前記遺伝子座以外の位置で前記断片に前記対応するオリゴヌクレオチドを付加するトランスポザーゼと
    を含む、組成物。
  274. 前記対応するオリゴヌクレオチドの断片内のそれぞれの位置が、前記タンパク質のそれぞれの遺伝子座を同定するために使用可能である、請求項273に記載の組成物。
  275. 前記トランスポザーゼが前記断片を部分断片に分割する、請求項273又は請求項274に記載の組成物。
  276. 前記対応するオリゴヌクレオチドが増幅アダプターを含む、請求項273から275のいずれか一項に記載の組成物。
  277. 前記増幅アダプターがP5アダプター及びP7アダプターを含む、請求項276に記載の組成物。
  278. 前記増幅アダプターが固有の分子識別子(UMI)を含む、請求項276又は請求項277に記載の組成物。
  279. 前記トランスポザーゼがTn5を含む、請求項273から278のいずれか一項に記載の組成物。
  280. 前記断片が、約100塩基対~約1000塩基対の長さを有する、請求項273から279のいずれか一項に記載の組成物。
  281. 前記断片が、約500塩基対~約700塩基対の長さを有する、請求項273から280のいずれか一項に記載の組成物。
  282. 前記断片が、約200塩基対~約400塩基対の長さを有する、請求項273から280のいずれか一項に記載の組成物。
  283. 前記断片が、約100塩基対~約200塩基対の長さを有する、請求項273から280のいずれか一項に記載の組成物。
  284. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項273から283のいずれか一項に記載の組成物。
  285. 組成物であって、
    複数の部分配列を有する標的ポリヌクレオチドと、
    ガイドRNA(gRNA)にカップリングしたShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)を各々含む複数の複合体であって、前記ShCASTが、前記複合体にカップリングした増幅アダプターを有する、複数の複合体と
    を含み、
    前記複合体の各々は、前記標的ポリヌクレオチド中の前記部分配列のうちの対応する1つにハイブリダイズされている、組成物。
  286. 前記部分配列への前記複合体のハイブリダイゼーションを促進し、かつ前記トランスポザーゼの活性を阻害する条件を有する流体を更に含む、請求項285に記載の組成物。
  287. 前記流体の条件が、前記トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む、請求項286に記載の組成物。
  288. 前記トランスポザーゼの活性を促進する条件を有する流体を更に含み、前記トランスポザーゼが、前記標的ポリヌクレオチド中の位置に増幅アダプターを付加する、請求項285に記載の組成物。
  289. 前記流体の条件が、前記トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在することを含む、請求項288に記載の組成物。
  290. 前記ShCASTがCas12kを含む、請求項285から289のいずれか一項に記載の組成物。
  291. 前記トランスポザーゼが、Tn5又はTn7様トランスポザーゼを含む、請求項285から290のいずれか一項に記載の組成物。
  292. 前記アダプターが、P5アダプター及びP7アダプターのうちの少なくとも1つを含む、請求項285から291のいずれか一項に記載の組成物。
  293. 前記標的ポリヌクレオチドが二本鎖DNAを含む、請求項285から292のいずれか一項に記載の組成物。
  294. 前記gRNA及び前記トランスポザーゼのうちの少なくとも1つがビオチン化されており、前記組成物が、ビオチン化されている前記gRNA及びトランスポザーゼのうちの少なくとも1つがカップリングしているストレプトアビジンでコーティングされたビーズを更に含む、請求項285から292のいずれか一項に記載の組成物。
  295. 第1のタグが前記第1のCas-gRNA RNPにカップリングされ、第2のタグが前記第2のCas-gRNA RNPにカップリングされる、請求項180から206のいずれか一項に記載の方法。
  296. 前記第1のタグを基材にカップリングした第1のタグパートナーにカップリングすることと、前記第2のタグを基材にカップリングした第2のタグパートナーにカップリングすることとを更に含む、請求項294に記載の方法。
  297. 前記カップリングが、前記第1及び第2のCas-gRNA RNPがそれぞれ前記第1及び第2の部分配列にハイブリダイズされた後に行われる、請求項295に記載の方法。
  298. 前記第1及び第2のタグがそれぞれ前記第1及び第2のタグパートナーに付加された後に、第1及び増幅アダプターが付加される、請求項295又は請求項296に記載の方法。
  299. 前記第1及び第2のタグがビオチンを含む、請求項294から297のいずれか一項に記載の方法。
  300. 前記第1及び第2のタグパートナーがストレプトアビジンを含む、請求項298に記載の方法。
  301. 前記基材がビーズを含む、請求項295から299のいずれか一項に記載の方法。
  302. 前記Cas-gRNA RNPがCas12 kを含む、請求項294から300のいずれか一項に記載の方法。
  303. 前記トランスポザーゼが、Tn5又はTn7様トランスポザーゼを含む、請求項294から301のいずれか一項に記載の組成物。
  304. 前記第1のCas-gRNA RNPにカップリングした第1のタグを更に含む、請求項208から236のいずれか一項に記載の組成物。
  305. 基材と、前記基材及び前記第1のタグにカップリングした第1のタグパートナーとを更に含む、請求項303に記載の組成物。
  306. 前記第1のCas-gRNA RNPにカップリングした第1のタグと、前記第2のCas-gRNA RNPにカップリングした第2のタグとを更に含む、請求項209から236のいずれか一項に記載の組成物。
  307. 基材と、前記基材及び前記第1のタグにカップリングした第1のタグパートナーと、前記基材及び前記第2のタグにカップリングした第2のタグパートナーとを更に含む、請求項305に記載の組成物。
  308. 前記第1及び第2のタグがビオチンを含む、請求項306に記載の組成物。
  309. 前記第1及び第2のタグパートナーがストレプトアビジンを含む、請求項307に記載の組成物。
  310. 前記基材がビーズを含む、請求項303から308のいずれか一項に記載の組成物。
  311. 前記Cas-gRNA RNPがCas12kを含む、請求項303から309のいずれか一項に記載の組成物。
  312. 前記トランスポザーゼが、Tn5又はTn7様トランスポザーゼを含む、請求項303から309のいずれか一項に記載の組成物。
  313. 二本鎖ポリヌクレオチドの断片を生成する方法であって、前記方法は、
    前記二本鎖ポリヌクレオチドを基材にカップリングさせることと、
    第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)ニッカーゼを、前記二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることであって、
    前記第1の部分配列は、前記二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、
    前記第2の部分配列は、前記二本鎖ポリヌクレオチドの第2の鎖に沿った前記標的配列の3’側である、ことと、
    前記第1のCas-gRNA RNPニッカーゼを使用して、前記第1の部分配列において前記第1の鎖を切断することと、
    前記第2のCas-gRNA RNPニッカーゼを使用して、前記第2の部分配列において前記第2の鎖を切断することと
    ポリメラーゼを使用して、前記それぞれの切断部から前記第1及び第2の鎖を伸長させ、前記基材から前記標的配列を溶出させることと、
    前記溶出された標的配列を配列決定することと
    を含む、方法。
  314. 前記基材がビーズを含む、請求項312に記載の方法。
  315. 前記二本鎖ポリヌクレオチドの3’末端がタグにカップリングされており、前記基材はタグパートナーにカップリングされており、前記カップリングが、前記タグを前記タグパートナーにカップリングすることを含む、請求項312又は請求項313に記載の方法。
  316. 前記タグがビオチンを含み、前記タグパートナーがストレプトアビジンを含む、請求項314に記載の方法。
  317. 前記第1及び第2のCas-gRNA RNPニッカーゼが、Cas9を含む、請求項312から315のいずれか一項に記載の方法。
  318. 前記ポリメラーゼが鎖置換ポリメラーゼを含む、請求項312から316のいずれか一項に記載の方法。
  319. 前記ポリメラーゼがVent又はBsuを含む、請求項317に記載の方法。
  320. 前記ポリメラーゼが5’エキソヌクレアーゼ活性を有する、請求項312から316のいずれか一項に記載の方法。
  321. 前記ポリメラーゼが、Taq、Bst、又はDNAポリメラーゼIを含む、請求項319に記載の方法。
  322. 前記二本鎖ポリヌクレオチドが、配列決定ライブラリーの一部を含む、請求項312から320のいずれか一項に記載の方法。
  323. 前記溶出された標的配列に配列決定アダプターを付加することを更に含む、請求項312から321のいずれか一項に記載の方法。
  324. 組成物であって、
    基材にカップリングした二本鎖ポリヌクレオチドと、
    前記二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズした第1及び第2のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)ニッカーゼと
    を含み、
    前記第1の部分配列は、前記二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、
    前記第2の部分配列は、前記二本鎖ポリヌクレオチドの第2の鎖に沿った前記標的配列の3’側である、組成物。
  325. 前記基材がビーズを含む、請求項323に記載の組成物。
  326. 前記二本鎖ポリヌクレオチドの3’末端がタグにカップリングされており、前記基材は前記タグにカップリングしたタグパートナーにカップリングされている、請求項323又は324に記載の組成物。
  327. 前記タグがビオチンを含み、前記タグパートナーがストレプトアビジンを含む、請求項325に記載の組成物。
  328. 前記第1及び第2のCas-gRNA RNPニッカーゼが、Cas9を含む、請求項323から326のいずれか一項に記載の組成物。
  329. 前記二本鎖ポリヌクレオチドが、配列決定ライブラリーの一部を含む、請求項323から327のいずれか一項に記載の組成物。
  330. 二本鎖ポリヌクレオチドの断片を生成する方法であって、前記方法は、
    第1及び第2の複合体を二本鎖ポリヌクレオチド中の第1及び第2の部分配列にそれぞれハイブリダイズさせることであって、
    前記第1及び第2の複合体の各々は、増幅アダプターにカップリングしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含む、ことと、
    前記ハイブリダイズされた第1及び第2の複合体の増幅アダプターを、前記二本鎖ポリヌクレオチドの第1及び第2の末端にそれぞれライゲーションすることと、
    前記二本鎖ポリヌクレオチドから前記第1及び第2の複合体のCas-gRNA RNPを除去することと、
    前記増幅アダプターがライゲーションされた前記二本鎖ポリヌクレオチドを配列決定することと
    を含む、方法。
  331. 前記第1の部分配列が、前記二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、前記第2の部分配列は、前記二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側である、請求項329に記載の方法。
  332. 前記増幅アダプターがY字型である、請求項329又は330に記載の方法。
  333. 各複合体が、前記Cas-gRNA RNPを前記増幅アダプターにカップリングするリンカーを更に含む、請求項329から331のいずれか一項に記載の方法。
  334. 前記リンカーが、前記Cas-gRNA RNPのCasにカップリングされる、請求項332に記載の方法。
  335. 前記リンカーが前記gRNAにカップリングされる、請求項332に記載の方法。
  336. 前記リンカーが、タンパク質、ポリヌクレオチド、又はポリマーを含む、請求項332から334のいずれか一項に記載の方法。
  337. 前記Cas-gRNA RNPが除去されるとき、前記リンカーが前記増幅アダプターにカップリングしたままである、請求項332から335のいずれか一項に記載の方法。
  338. 前記ライゲーションがリガーゼの使用を含む、請求項329から336のいずれか一項に記載の方法。
  339. リガーゼがハイブリダイズ中に存在する、請求項337に記載の方法。
  340. リガーゼがハイブリダイズ中に不活性であり、ATPを使用してライゲーションするために活性化される、請求項338に記載の方法。
  341. 前記リガーゼが、前記ハイブリダイズの後に付加される、請求項337に記載の方法。
  342. 前記ハイブリダイズさせる前に、前記二本鎖ポリヌクレオチドをA-テーリングすることを更に含み、前記増幅アダプターが、前記A-テールとハイブリダイズするための不対Tを含む、請求項329から340のいずれか一項に記載の方法。
  343. 増幅アダプターが固有の分子識別子を含む、請求項329から341のいずれか一項に記載の方法。
  344. 前記Cas-gRNA RNPがdCas9を含む、請求項329から342のいずれか一項に記載の方法。
  345. 組成物であって、
    二本鎖ポリヌクレオチドの断片と、
    前記二本鎖ポリヌクレオチド中の第1及び第2の部分配列にハイブリダイズした第1及び第2の複合体と
    を含み、
    前記第1及び第2の複合体の各々が、増幅アダプターにカップリングしたCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を含む、組成物。
  346. 前記第1の部分配列が、前記二本鎖ポリヌクレオチドの第1の鎖に沿った標的配列の3’側であり、前記第2の部分配列は、前記二本鎖ポリヌクレオチドの第2の鎖に沿った標的配列の3’側である、請求項344に記載の組成物。
  347. 増幅アダプターがY字型である、請求項344又は請求項345に記載の組成物。
  348. 各複合体が、前記Cas-gRNA RNPを前記増幅アダプターにカップリングするリンカーを更に含む、請求項344から346のいずれか一項に記載の組成物。
  349. 前記リンカーが、前記Cas-gRNA RNPのCasにカップリングされている、請求項347に記載の組成物。
  350. 前記リンカーが前記gRNAにカップリングされている、請求項348に記載の組成物。
  351. 前記リンカーが、タンパク質、ポリヌクレオチド、又はポリマーを含む、請求項347から349のいずれか一項に記載の組成物。
  352. 前記二本鎖ポリヌクレオチドがAテールを含み、前記増幅アダプターが、前記Aテールとハイブリダイズする不対Tを含む、請求項344から348のいずれか一項に記載の組成物。
  353. 増幅アダプターが固有の分子識別子を含む、請求項344から351のいずれか一項に記載の組成物。
  354. 前記Cas-gRNA RNPがdCas9を含む、請求項344から352のいずれか一項に記載の組成物。
  355. ポリヌクレオチドの断片を生成する方法であって、前記方法は、
    第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を前記ポリヌクレオチド中の第1の配列にハイブリダイズさせることと、
    第2のCas-gRNA RNPを、前記第1の配列から少なくとも標的配列だけ離間している前記ポリヌクレオチド中の第2の配列にハイブリダイズさせることと、
    前記第1及び第2の配列を前記第1及び第2のCas-gRNA RNPで切断して、第1及び第2の末端並びにそれらの間の前記標的配列を含む断片を生成することであって、前記第1の末端が少なくとも1つの塩基の第1の5’オーバーハングを有し、前記第2の末端が少なくとも1つの塩基の第2の5’オーバーハングを有する、ことと
    を含む、方法。
  356. 前記第1及び第2の5’オーバーハングが各々約2~5塩基長である、請求項354に記載の方法。
  357. 前記第1及び第2の5’オーバーハングが各々約5塩基長である、請求項354に記載の方法。
  358. 前記第1及び第2の5’オーバーハングが互いに異なる配列を有する、請求項354から356のいずれか一項に記載の方法。
  359. 第1の増幅アダプターを前記断片の第1の末端にライゲーションすることと、第2の増幅アダプターを前記断片の第2の末端にライゲーションすることとを更に含み、
    前記第1の増幅アダプターが、前記第1の5’オーバーハングに相補的な第3の5’オーバーハングを有し、
    前記第2の増幅アダプターが、前記第2の5’オーバーハングに相補的な第4の5’オーバーハングを有し、
    前記第3及び第4の5’オーバーハングは、互いに異なる配列を有する、請求項357に記載の方法。
  360. 前記第1及び第2の増幅アダプターがライゲーションされた前記断片のアンプリコンを生成することと、
    前記アンプリコンを配列決定することと、
    前記配列決定に基づいて前記標的ポリヌクレオチドを同定することと
    を更に含む、請求項358に記載の方法。
  361. 前記増幅アダプターが固有の分子識別子(UMI)を含む、請求項358又は359に記載の方法。
  362. 前記CasがCas12aを含む、請求項354から360のいずれか一項に記載の方法。
  363. 組成物であって、
    ポリヌクレオチドと、
    前記ポリヌクレオチド中の第1の配列にハイブリダイズした第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と、
    前記第1の配列から少なくとも標的配列だけ離間している前記ポリヌクレオチド中の第2の配列にハイブリダイズされた第2のCas-gRNA RNPと
    を含み、
    前記第1及び第2のCas-gRNA RNPはそれぞれ、前記ポリヌクレオチドの前記第1及び第2の配列を切断して、前記標的配列を間に持つ第1及び第2の末端を有する断片を生成するためのものであり、前記第1の末端が少なくとも1つの塩基の第1の5’オーバーハングを有し、前記第2の末端が少なくとも1つの塩基の第2の5’オーバーハングを有する、組成物。
  364. 前記第1及び第2の5’オーバーハングが各々約2~5塩基長である、請求項362に記載の組成物。
  365. 前記第1及び第2の5’オーバーハングが各々約5塩基長である、請求項362に記載の組成物。
  366. 前記第1及び第2の5’オーバーハングが互いに異なる配列を有する、請求項362から364のいずれか一項に記載の組成物。
  367. 前記CasがCas12aを含む、請求項362から365のいずれか一項に記載の組成物。
  368. 組成物であって、
    前記標的配列を間に持つ第1及び第2の末端を各々有するポリヌクレオチド断片であって、前記第1の末端が少なくとも1つの塩基の第1の5’オーバーハングを有し、前記第2の末端が少なくとも1塩基の第2の5’オーバーハングを有し、前記第1及び第2の5’オーバーハングが互いに異なる配列を有する、ポリヌクレオチド断片と、
    前記第1の5’オーバーハングに相補的であり、かつ前記第2の5’オーバーハングに相補的でない第3の5’オーバーハングを有する第1の増幅アダプターと、
    前記第2の5’オーバーハングに相補的であり、かつ前記第1の5’オーバーハングに相補的でない第4の5’オーバーハングを有する第2の増幅アダプターと
    を含む、組成物。
  369. 前記第1の増幅アダプターを前記第1の末端にライゲーションし、前記第2の増幅アダプターを前記第2の末端にライゲーションするための少なくとも1つのリガーゼを更に含む、請求項367に記載の組成物。
  370. 前記第1及び第2の5’オーバーハングが各々約2~5塩基長である、請求項367又は請求項368に記載の組成物。
  371. 前記第1及び第2の5’オーバーハングが各々約5塩基長である、請求項367又は請求項368に記載の組成物。
  372. 前記第1及び第2の増幅アダプターが固有の分子識別子(UMI)を含む、請求項367から370のいずれか一項に記載の組成物。
  373. 前記リガーゼがT4 DNAリガーゼを含む、請求項368から371のいずれか一項に記載の組成物。
  374. 組成物であって、
    前記標的配列を間に持つ第1及び第2の末端を各々有する複数のポリヌクレオチド断片であって、前記第1の末端が少なくとも1つの塩基の第1の5’オーバーハングを有し、前記第2の末端が少なくとも1塩基の第2の5’オーバーハングを有し、前記第1及び第2の5’オーバーハングが、互いに、かつ他の断片の第1及び第2の5’オーバーハングとは異なる配列を有する、ポリヌクレオチド断片
    を含む、組成物。
  375. 複数の第1の増幅アダプターであって、各々が、対応する断片の第1の5’オーバーハングに相補的であり、その断片の第2の5’オーバーハングに相補的でなく、他の断片の第1又は第2の5’オーバーハングに相補的でない第3の5’オーバーハングを有する、複数の第1の増幅アダプターと、
    複数の第2の増幅アダプターであって、各々が、対応する断片の第2の5’オーバーハングに相補的であり、その断片の第1の5’オーバーハングに相補的でなく、他の断片の第1又は第2の5’オーバーハングに相補的でない第4の5’オーバーハングを有する、複数の第2の増幅アダプターと
    を更に含む、請求項373に記載の組成物。
  376. 前記第1及び第3の5’オーバーハングが相補的である前記第1の末端に前記第1の増幅アダプターをライゲーションし、前記第2及び第4の5’オーバーハングが相補的である前記第2の末端に前記第2の増幅アダプターをライゲーションするためのリガーゼを更に含む、請求項374に記載の組成物。
  377. 前記リガーゼがT4 DNAリガーゼを含む、請求項375に記載の組成物。
  378. 前記第1及び第2の増幅アダプターが固有の分子識別子(UMI)を含む、請求項375又は請求項376に記載の組成物。
  379. 前記第1及び第2の5’オーバーハングが各々約2~5塩基長である、請求項373から377のいずれか一項に記載の組成物。
  380. 前記第1及び第2の5’オーバーハングが各々約5塩基長である、請求項373から377のいずれか一項に記載の組成物。
  381. 組成物であって、
    複数のポリヌクレオチドと、
    前記ポリヌクレオチド中のそれぞれの第1の配列にハイブリダイズした複数の第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と、
    前記それぞれの第1の配列から少なくともそれぞれの標的配列にだけ離間している前記ポリヌクレオチド中のそれぞれの第2の配列にハイブリダイズした複数の第2のCas-gRNA RNPと
    を含み、
    前記第1及び第2の複数のCas-gRNA RNPはそれぞれ、前記それぞれのポリヌクレオチドの前記第1及び第2の配列を切断して、前記それぞれの標的配列内に第1及び第2の末端をそれぞれ有する断片を生成するためのものであり、前記第1の末端が少なくとも1つの塩基の第1の5’オーバーハングを有し、前記第2の末端が少なくとも1つの塩基の第2の5’オーバーハングを有する、組成物。
  382. 前記第1及び第2の5’オーバーハングが各々約2~5塩基長である、請求項380に記載の組成物。
  383. 前記第1及び第2の5’オーバーハングが各々約5塩基長である、請求項380に記載の組成物。
  384. 前記第1及び第2の5’オーバーハングが互いに異なる配列を有する、請求項380から383のいずれか一項に記載の組成物。
  385. 前記CasがCas12aを含む、請求項380から384のいずれか一項に記載の組成物。
  386. プライマー結合部位、増幅アダプター部位、及びCRISPRプロトスペーサーを含む、ガイドRNA。
  387. 前記プライマー結合部位が、前記CRISPRプロトスペーサーの少なくとも一部におおよそ相補的である、請求項386に記載のガイドRNA。
  388. 前記増幅アダプター部位が、前記プライマー結合部位と前記CRISPRプロトスペーサーとの間に位置する、請求項386又は請求項387に記載のガイドRNA。
  389. 少なくとも1つのループを更に含む、請求項386から388のいずれか一項に記載のガイドRNA。
  390. 第1のループが、前記増幅アダプター部位と前記CRISPRプロトスペーサーとの間に位置する、請求項389に記載のガイドRNA。
  391. 第2のループが、前記増幅アダプター部位と前記CRISPRプロトスペーサーとの間に位置する、請求項390に記載のガイドRNA。
  392. CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)であって、
    請求項386から391のいずれか一項に記載のgRNAと、
    前記CRISPRプロトスペーサーに結合するCasタンパク質と
    を含む、CRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)。
  393. 前記Casタンパク質が二本鎖ポリヌクレオチド切断を行うように構成されている、請求項392に記載のCas-gRNA RNP。
  394. 前記Casタンパク質が、Cas9、Cas 12a、又はCas12fを含む、請求項393に記載のCas-gRNA RNP。
  395. 前記プライマー結合部位及び前記増幅アダプター部位が、前記Casタンパク質の外側に伸長する、請求項392から394のいずれか一項に記載のCas-gRNA RNP。
  396. 複合体であって、
    第1の鎖及び第の2鎖を含むポリヌクレオチドと、
    第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)であって、
    第1のプライマー結合部位、第1の増幅アダプター部位、及び第1のCRISPRプロトスペーサーを含む第1のガイドRNAと、
    前記第1のCRISPRプロトスペーサーに結合する第1のCasタンパク質とを含む、第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)と
    を含み、
    前記第1のCRISPRプロトスペーサーが前記第1の鎖にハイブリダイズしており、前記第1のプライマー結合部位が前記第2の鎖にハイブリダイズしている、複合体。
  397. 前記第1及び第2の鎖が、前記第1のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で前記第1のCas-gRNA RNPによって切断されている、請求項396に記載の複合体。
  398. 前記第1のCasタンパク質が、Cas9、Cas 12a、又はCas12fを含む、請求項397に記載の複合体。
  399. 前記第1のCasタンパク質によって引き起こされた前記第2の鎖の切断部に前記増幅アダプター部位のアンプリコンを作製するための第1の逆転写酵素を更に含む、請求項397又は請求項398に記載の複合体。
  400. 前記第1の逆転写酵素が前記第1のCasタンパク質にカップリングされている、請求項399に記載の複合体。
  401. 前記第1の逆転写酵素及び前記第1のCasタンパク質が、第1の融合タンパク質の構成要素である、請求項400に記載の複合体。
  402. 前記第1のプライマー結合部位が、前記第1のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である、請求項396から401のいずれか一項に記載の複合体。
  403. 前記第1の増幅アダプター部位が、前記第1のプライマー結合部位と前記第1のCRISPRプロトスペーサーとの間に位置する、請求項396から402のいずれか一項に記載の複合体。
  404. 前記第1のgRNAが少なくとも1つのループを更に含む、請求項396から403のいずれか一項に記載の複合体。
  405. 第1のループが、前記第1の増幅アダプター部位と第1のCRISPRプロトスペーサーとの間に位置する、請求項404に記載の複合体。
  406. 第2のループが、前記第1の増幅アダプター部位と前記第1のCRISPRプロトスペーサーとの間に位置する、請求項405に記載の複合体。
  407. 第2のCas-gRNA RNPを更に含み、前記第2のCas-gRNA RNPは、
    第2のプライマー結合部位、第2の増幅アダプター部位、及び第2のCRISPRプロトスペーサーを含む第2のガイドRNAと、
    前記第2のCRISPRプロトスペーサーに結合する第2のCasタンパク質とを含み、
    前記第2のCRISPRプロトスペーサーが前記第1の鎖にハイブリダイズしており、前記第2のプライマー結合部位が、前記第2の鎖にハイブリダイズしている、請求項396から406のいずれか一項に記載の複合体。
  408. 前記第1及び第2の鎖が、前記第2のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で前記第2のCas-gRNA RNPによって切断されている、請求項407に記載の複合体。
  409. 前記第2のCas-gRNA RNPによる第1及び第2の鎖の切断部が、前記第1のCas-gRNA RNPによる第1及び第2の鎖の切断部から少なくとも標的配列だけ離間している、請求項408に記載の複合体。
  410. 前記第2のCasタンパク質が、Cas9、Cas 12a、又はCas12fを含む、請求項408又は請求項409に記載の複合体。
  411. 前記第2のCasタンパク質によって引き起こされた前記第2の鎖の切断部に前記増幅アダプター部位のアンプリコンを作製するための第2の逆転写酵素を更に含む、請求項408から410のいずれか一項に記載の複合体。
  412. 前記第2の逆転写酵素が、前記第2のCasタンパク質にカップリングされている、請求項411に記載の複合体。
  413. 前記第2の逆転写酵素及び前記第2のCasタンパク質が、第2の融合タンパク質の構成要素である、請求項412に記載の複合体。
  414. 前記第2のプライマー結合部位が、前記第2のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である、請求項407から413のいずれか一項に記載の複合体。
  415. 前記第2の増幅アダプター部位が、前記第2のプライマー結合部位と前記第2のCRISPRプロトスペーサーとの間に位置する、請求項396から414のいずれか一項に記載の複合体。
  416. 部分二本鎖ポリヌクレオチド断片であって、
    第1の3’オーバーハングを含む第1の末端と、
    第2の末端と、
    前記第1の末端と前記第2の末端との間に位置する標的配列と
    を含む、部分二本鎖ポリヌクレオチド断片。
  417. 前記第1の3’オーバーハングが第1の増幅アダプターを含む、請求項416に記載の断片。
  418. 前記第2の末端が第2の3’オーバーハングを含む、請求項416又は請求項417に記載の断片。
  419. 前記第2の3’オーバーハングが第2の増幅アダプターを含む、請求項418に記載の断片。
  420. 方法であって、
    第1のCRISPR関連タンパク質ガイドRNAリボ核タンパク質(Cas-gRNA RNP)を、第1及び第2の鎖を含むポリヌクレオチドと接触させることであって、
    前記第1のCas-gRNAは、
    第1のプライマー結合部位、第1の増幅アダプター部位、及び第1のCRISPRプロトスペーサーを含む第1のガイドRNAと、
    前記第1のCRISPRプロトスペーサーに結合する第1のCasタンパク質とを含む、ことと、
    前記第1のCRISPRプロトスペーサーを前記第1の鎖にハイブリダイズさせることと、
    前記第1のプライマー結合部位を前記第2の鎖にハイブリダイズさせることと
    を含む、方法。
  421. 前記第1のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で、前記第1のCas-gRNA RNPによって前記第1及び第2の鎖を切断することを更に含む、請求項420に記載の方法。
  422. 前記第1のCasタンパク質が、Cas9、Cas 12a、又はCas12fを含む、請求項421に記載の方法。
  423. 第1の逆転写酵素を使用して、前記第1のCasタンパク質によって引き起こされた前記第2の鎖の前記切断部に前記増幅アダプター部位のアンプリコンを生成することを更に含む、請求項421又は請求項422に記載の方法。
  424. 前記第1の逆転写酵素が、前記第1のCasタンパク質にカップリングされる、請求項423に記載の方法。
  425. 前記第1の逆転写酵素及び前記第1のCasタンパク質が、第1の融合タンパク質の構成要素である、請求項424に記載の方法。
  426. 前記第1のプライマー結合部位が、前記第1のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である、請求項420から425のいずれか一項に記載の方法。
  427. 第1の増幅アダプター部位が、第1のプライマー結合部位と第1のCRISPRプロトスペーサーとの間に位置する、請求項420から426のいずれか一項に記載の方法。
  428. 前記第1のgRNAが少なくとも1つのループを更に含む、請求項420から427のいずれか一項に記載の方法。
  429. 第1のループが、前記第1の増幅アダプター部位と第1のCRISPRプロトスペーサーとの間に位置する、請求項428に記載の方法。
  430. 第2のループが、前記第1の増幅アダプター部位と前記第1のCRISPRプロトスペーサーとの間に位置する、請求項429に記載の方法。
  431. 前記ポリヌクレオチドを第2のCas-gRNA RNPと接触させることであって、
    前記第2のCas-gRNA RNPが、
    第2のプライマー結合部位、第2の増幅アダプター部位、及び第2のCRISPRプロトスペーサーを含む第2のガイドRNAと、
    前記第2のCRISPRプロトスペーサーに結合する第2のCasタンパク質とを含む、ことと、
    前記第2のCRISPRプロトスペーサーを前記第1の鎖にハイブリダイズさせることと、
    前記第2のプライマー結合部位を前記第2の鎖にハイブリダイズさせることと
    を更に含む、請求項420から430のいずれか一項に記載の方法。
  432. 前記第2のCRISPRプロトスペーサーの配列に基づくそれぞれの位置で、前記第2のCas-gRNA RNPによって前記第1及び第2の鎖を切断することを更に含む、請求項431に記載の方法。
  433. 前記第2のCas-gRNA RNPによる第1及び第2の鎖の切断部が、前記第1のCas-gRNA RNPによる第1及び第2の鎖の切断部から少なくとも標的配列だけ離間している、請求項432に記載の方法。
  434. 前記第2のCasタンパク質が、Cas9、Cas 12a、又はCas12fを含む、請求項432又は433に記載の方法。
  435. 第2の逆転写酵素を使用して、前記第2のCasタンパク質によって引き起こされた前記第2の鎖の切断部に前記増幅アダプター部位のアンプリコンを生成することを更に含む、請求項432~434のいずれか一項に記載の方法。
  436. 前記第2の逆転写酵素が、前記第2のCasタンパク質にカップリングされる、請求項435に記載の方法。
  437. 前記第2の逆転写酵素及び前記第2のCasタンパク質が、第2の融合タンパク質の構成要素である、請求項436に記載の方法。
  438. 前記第2のプライマー結合部位が、前記第2のCRISPRプロトスペーサーの少なくとも一部におおよそ相補的である、請求項431から437のいずれか一項に記載の方法。
  439. 前記第2の増幅アダプター部位が、前記第2のプライマー結合部位と前記第2のCRISPRプロトスペーサーとの間に位置する、請求項431から438のいずれか一項に記載の方法。
  440. 前記第1及び第2のCas-gRNA RNP並びに前記第1及び第2の逆転写酵素が、第1の末端及び第2の末端を有する部分二本鎖ポリヌクレオチド断片を生成し、
    前記第1の末端は、第1の3’オーバーハングを含み、
    前記第2の末端は、第2の3’オーバーハングを含み、
    前記第1の末端と前記第2の末端との間に標的配列が位置する、請求項435から439のいずれか一項に記載の方法。
  441. 前記第1の3’オーバーハングが、前記第1の増幅アダプター部位のアンプリコンを含む、請求項440に記載の方法。
  442. 前記第2の3’オーバーハングが、前記第2の増幅アダプター部位のアンプリコンを含む、請求項440又は請求項441に記載の方法。
  443. 第3の増幅アダプターを前記第1の末端の5’基にライゲーションすることと、
    第4の増幅アダプターを第2の末端の5’基にライゲーションすることと、
    前記第1、第2、第3、及び第4の増幅アダプターを使用して前記断片を増幅することと、
    前記増幅された断片を配列決定することと
    更に含む、請求項442に記載の方法。
JP2023555515A 2021-03-09 2022-03-08 CAS-gRNAリボ核タンパク質を使用するゲノムライブラリー調製及び標的化エピジェネティックアッセイ Pending JP2024510206A (ja)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US202163158492P 2021-03-09 2021-03-09
US63/158,492 2021-03-09
US202163162775P 2021-03-18 2021-03-18
US63/162,775 2021-03-18
US202163163381P 2021-03-19 2021-03-19
US63/163,381 2021-03-19
US202163228344P 2021-08-02 2021-08-02
US63/228,344 2021-08-02
US202163246879P 2021-09-22 2021-09-22
US63/246,879 2021-09-22
US202163295432P 2021-12-30 2021-12-30
US63/295,432 2021-12-30
PCT/US2022/019252 WO2022192186A1 (en) 2021-03-09 2022-03-08 Genomic library preparation and targeted epigenetic assays using cas-grna ribonucleoproteins

Publications (1)

Publication Number Publication Date
JP2024510206A true JP2024510206A (ja) 2024-03-06

Family

ID=80937135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023555515A Pending JP2024510206A (ja) 2021-03-09 2022-03-08 CAS-gRNAリボ核タンパク質を使用するゲノムライブラリー調製及び標的化エピジェネティックアッセイ

Country Status (8)

Country Link
EP (1) EP4305163A1 (ja)
JP (1) JP2024510206A (ja)
KR (1) KR20230154078A (ja)
AU (1) AU2022234741A1 (ja)
BR (1) BR112023018152A2 (ja)
CA (1) CA3209074A1 (ja)
IL (1) IL305444A (ja)
WO (1) WO2022192186A1 (ja)

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4883750A (en) 1984-12-13 1989-11-28 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5614389A (en) 1992-08-04 1997-03-25 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
US5834202A (en) 1992-08-04 1998-11-10 Replicon, Inc. Methods for the isothermal amplification of nucleic acid molecules
WO1994003624A1 (en) 1992-08-04 1994-02-17 Auerbach Jeffrey I Methods for the isothermal amplification of nucleic acid molecules
US6261808B1 (en) 1992-08-04 2001-07-17 Replicon, Inc. Amplification of nucleic acid molecules via circular replicons
US5593826A (en) 1993-03-22 1997-01-14 Perkin-Elmer Corporation, Applied Biosystems, Inc. Enzymatic ligation of 3'amino-substituted oligonucleotides
DE69433010T2 (de) 1993-04-12 2004-06-09 Northwestern University, Evanston Verfahren zur darstellung von oligonukleotiden
US5422252A (en) 1993-06-04 1995-06-06 Becton, Dickinson And Company Simultaneous amplification of multiple targets
CA2122203C (en) 1993-05-11 2001-12-18 Melinda S. Fraiser Decontamination of nucleic acid amplification reactions
KR100189229B1 (ko) 1993-07-23 1999-06-01 다니엘 엘. 캐시앙, 헨리 엘. 노르호프 핵산 증폭을 강화하는 방법
FR2708288B1 (fr) 1993-07-26 1995-09-01 Bio Merieux Procédé d'amplification d'acides nucléiques par transcription utilisant le déplacement, réactifs et nécessaire pour la mise en Óoeuvre de ce procédé.
US5523204A (en) 1993-12-10 1996-06-04 Becton Dickinson And Company Detection of nucleic acids in cells by strand displacement amplification
SE9400522D0 (sv) 1994-02-16 1994-02-16 Ulf Landegren Method and reagent for detecting specific nucleotide sequences
US5677170A (en) 1994-03-02 1997-10-14 The Johns Hopkins University In vitro transposition of artificial transposons
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US5648211A (en) 1994-04-18 1997-07-15 Becton, Dickinson And Company Strand displacement amplification using thermophilic enzymes
FR2726277B1 (fr) 1994-10-28 1996-12-27 Bio Merieux Oligonucleotide utilisable comme amorce dans une methode d'amplification basee sur une replication avec deplacement de brin
US5631147A (en) 1995-09-21 1997-05-20 Becton, Dickinson And Company Detection of nucleic acids in cells by thermophilic strand displacement amplification
US5916779A (en) 1995-09-21 1999-06-29 Becton, Dickinson And Company Strand displacement amplification of RNA targets
WO1997035026A1 (en) 1996-03-18 1997-09-25 Molecular Biology Resources, Inc. Target nucleic acid sequence amplification
US5773733A (en) 1996-04-12 1998-06-30 National Science Council Alumina-aluminum nitride-nickel composites
US6124120A (en) 1997-10-08 2000-09-26 Yale University Multiple displacement amplification
EP2287338B1 (en) 1998-11-09 2012-09-05 Eiken Kagaku Kabushiki Kaisha Process for synthesizing nucleic acid
US6155972A (en) 1999-02-02 2000-12-05 Acorn Cardiovascular, Inc. Cardiac constraint jacket construction
ATE362532T1 (de) 1999-03-19 2007-06-15 Takara Bio Inc Verfahren zur amplifizierung einer nukleinsäuresequenz unter verwendung eines chimären primers
US6238868B1 (en) 1999-04-12 2001-05-29 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences using ligation-dependant strand displacement amplification and bioelectronic chip technology
US6326173B1 (en) 1999-04-12 2001-12-04 Nanogen/Becton Dickinson Partnership Electronically mediated nucleic acid amplification in NASBA
US6309833B1 (en) 1999-04-12 2001-10-30 Nanogen/Becton Dickinson Partnership Multiplex amplification and separation of nucleic acid sequences on a bioelectronic microchip using asymmetric structures
CN102586228A (zh) 1999-09-13 2012-07-18 纽亘技术公司 用于多核苷酸序列线性等温扩增的方法及组合物
AU2001278783B2 (en) 2000-08-23 2006-04-27 Takara Bio Inc. Method of amplifying nucleic acid
US6927028B2 (en) * 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
AU2003294447A1 (en) 2002-11-21 2004-06-18 Epicentre Technologies Preparation and use of single-stranded transcription substrates for synthesis of transcription products corresponding to target sequences
US20050153333A1 (en) 2003-12-02 2005-07-14 Sooknanan Roy R. Selective terminal tagging of nucleic acids
JP2010021219A (ja) 2008-07-09 2010-01-28 Nec Schott Components Corp パッケージングデバイス装置およびパッケージ用ベース部材
US9080211B2 (en) 2008-10-24 2015-07-14 Epicentre Technologies Corporation Transposon end compositions and methods for modifying nucleic acids
DE102012219142B4 (de) * 2012-10-19 2016-02-25 Analytik Jena Ag Verfahren zum Trennen, Erfassen oder Anreichern von unterschiedlichen DNA-Spezies
WO2021252617A1 (en) 2020-06-09 2021-12-16 Illumina, Inc. Methods for increasing yield of sequencing libraries

Also Published As

Publication number Publication date
BR112023018152A2 (pt) 2023-10-31
AU2022234741A1 (en) 2023-09-14
CA3209074A1 (en) 2022-09-15
WO2022192186A1 (en) 2022-09-15
IL305444A (en) 2023-10-01
KR20230154078A (ko) 2023-11-07
EP4305163A1 (en) 2024-01-17

Similar Documents

Publication Publication Date Title
US11692213B2 (en) Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins
US10676734B2 (en) Compositions and methods for detecting nucleic acid regions
US11384383B2 (en) In vitro isolation and enrichment of nucleic acids using site-specific nucleases
US20180312830A1 (en) Capture of nucleic acids using a nucleic acid-guided nuclease-based system
US11473124B2 (en) Method of nucleic acid enrichment using site-specific nucleases followed by capture
PT2963709T (pt) Composições de extremidade de transposão e métodos de modificação de ácidos nucleicos
US20210388414A1 (en) Optimization of in vitro isolation of nucleic acids using site-specific nucleases
JP2024510206A (ja) CAS-gRNAリボ核タンパク質を使用するゲノムライブラリー調製及び標的化エピジェネティックアッセイ
CN117255856A (zh) 使用CAS-gRNA核糖核蛋白的基因组文库制备和靶向表观遗传测定
US20240124921A1 (en) Detection of analytes using targeted epigenetic assays, proximity-induced tagmentation, strand invasion, restriction, or ligation
CN117881796A (zh) 使用靶向表观遗传测定、邻近诱导标签化、链侵入、限制或连接来检测分析物
JP2024509446A (ja) 細胞におけるタンパク質コード変異体の発現の分析

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231201