JP2024519513A - 細胞トランスクリプトームのコンビナトリアル標的化のための方法及び組成物 - Google Patents

細胞トランスクリプトームのコンビナトリアル標的化のための方法及び組成物 Download PDF

Info

Publication number
JP2024519513A
JP2024519513A JP2023553669A JP2023553669A JP2024519513A JP 2024519513 A JP2024519513 A JP 2024519513A JP 2023553669 A JP2023553669 A JP 2023553669A JP 2023553669 A JP2023553669 A JP 2023553669A JP 2024519513 A JP2024519513 A JP 2024519513A
Authority
JP
Japan
Prior art keywords
rna
sequence
cells
seq
crispr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023553669A
Other languages
English (en)
Inventor
サンジャナ,ネビル・イー
ベッセル,ハンス-ヘルマン
メンデス-マンシラ,アレハンドロ
サティヤ,ラフル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New York University NYU
Original Assignee
New York University NYU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New York University NYU filed Critical New York University NYU
Publication of JP2024519513A publication Critical patent/JP2024519513A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3517Marker; Tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/351Conjugate
    • C12N2310/3519Fusion with another nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

1つ以上のcrRNA配列と、バーコードガイドRNA(bcgRNA)と連結された5’ダイレクトリピート(DR)配列と、を含むCRISPRアレイを含む組成物が本明細書で提供され、bcgRNAは、(a)バーコード配列と、(b)逆転写ハンドルと、を5’から3’の順に含む。記載のCRISPRアレイを使用して1つ以上の摂動を単一細胞トランスクリプトームに導入することを含む方法も提供される。【選択図】なし

Description

政府の支援に関する記載
本発明は、米国国立衛生研究所によって付与されたDP2HG010099、DP2HG009623-01、RM1HG011014-01、及びR01CA218668の下で政府の支援を受けてなされたものである。政府は、本発明に一定の権利を有する。
遺伝的摂動のプールをscRNA-seqまたはマルチモーダルな特徴付けと組み合わせること(すなわち、Perturb-Seq、CROP-seq、CRISP-seq、及びECCITE-seq)が最近の技術的進歩によって行われるようになったことで、遺伝子機能についての我々の理解に変化が訪れることが約束されている。具体的には、コンビナトリアル摂動を与える能力は、複雑な制御ネットワークを解読する機会になり、エピスタシス及び他の遺伝的相互作用を同定する能力が先駆的研究によって実証されている。一方で、プール型の単一細胞スクリーニングと関連する特定の技術的及び分析的な課題が存在しており、こうした課題は、コンビナトリアル摂動を考えた場合に深刻なものとなる。例えば、sgRNAが検出されないか、または誤って割り当てられることで最大で20%の細胞に影響が及び得るが、このことは、各細胞において、複数の独立したsgRNAが導入され、独立して検出される場合には一層ひどくなる。さらに、Cas9によって導入される摂動は均一に効率的というわけではなく、標的細胞のかなりの割合が摂動の表現型効果を示し得ない。したがって、2つ以上の摂動を同時に与える場合、すべての摂動が共に成功裏に導入され、それらの検出に成功する細胞の割合は劇的に低くなり得る。
複数の遺伝的摂動を細胞に導入するための改良された組成物及び方法が必要とされている。
一態様では、ダイレクトリピート(DR)配列及びgRNA配列をそれぞれが含む1つ以上のcrRNA配列と、バーコードガイドRNA(bcgRNA)と連結された5’ダイレクトリピート(DR)配列と、を含むCRISPRアレイを含む核酸が本明細書で提供され、bcgRNAは、(a)バーコード配列と、(b)逆転写ハンドルと、を5’から3’の順に含む。
ある特定の実施形態では、bcgRNAは、(a)PCRハンドルと、(b)バーコード配列と、(c)逆転写ハンドルと、を5’から3’の順に含む。ある特定の実施形態では、CRISPRアレイは、1つ、2つ、3つ、またはそれを超える数のcrRNA配列を含む。ある特定の実施形態では、1つ以上のcrRNA配列はそれぞれ、標的RNA配列と相補的な少なくとも20個のヌクレオチドの配列を含むgRNAを含む。ある特定の実施形態では、1つ以上のcrRNA配列はそれぞれ、標的RNA配列と相補的な23個のヌクレオチドの配列であるgRNAを含む。ある特定の実施形態では、CRISPRアレイ中に存在するcrRNAはそれぞれ、異なるgRNA配列を有する。ある特定の実施形態では、CRISPRアレイ中に存在するcrRNAの2つ以上は、同じgRNA配列を含む。ある特定の実施形態では、CRISPRアレイ中に存在するcrRNA配列はそれぞれ、標的転写産物の異なる領域に特異的である。ある特定の実施形態では、CRISPRアレイは、複数の転写産物を標的とするガイドRNA(gRNA)配列を有するcrRNA配列を含む。ある特定の実施形態では、bcgRNAは、CRISPRアレイの1つ以上のcrRNA配列の下流(3’)に位置する。ある特定の実施形態では、bcgR
NAは、CRISPRアレイの1つ以上のcrRNA配列の上流(5’)に位置する。ある特定の実施形態では、ダイレクトリピートは、CRISPR-Cas13酵素と結合することが可能であり、CRISPR-Cas13酵素は、任意選択で、Cas13dである。ある特定の実施形態では、逆転写ハンドルは、ポリA配列、CS1、またはCS2を含む。ある特定の実施形態では、バーコードは、8~15個のヌクレオチドを含む。ある特定の実施形態では、CRISPRアレイは、その3’末端に安定化RNAエレメントをさらに含む。ある特定の実施形態では、安定化RNAエレメントは、MALAT1エレメント、NEAT1(MENβ)エレメント、spnpreQエレメント、ZIKV xrRNA1エレメント、mpknotエレメント、またはevopreQエレメントである。
別の態様では、ダイレクトリピート(DR)配列及びgRNA配列をそれぞれが含む1つ以上のcrRNA配列と、バーコードガイドRNA(bcgRNA)と連結された5’ダイレクトリピート(DR)配列と、を含むCRISPRアレイを含む核酸を含む発現カセットが本明細書で提供され、bcgRNAは、(a)バーコード配列と、(b)逆転写ハンドルと、を5’から3’の順に含む。ある特定の実施形態では、発現カセットは、(a)PCRハンドルと、(b)バーコード配列と、(c)逆転写ハンドルと、を5’から3’の順に含むbcgRNAを含む。発現カセットを含むベクターは、非ウイルスベクターまたはウイルスベクターであり得る。ある特定の実施形態では、非ウイルスベクターは、プラスミドである。別の実施形態では、プラスミドは、CRISPR-Cas酵素をコードする配列を含み、CRISPR-Cas酵素は、任意選択で、Cas13酵素またはCas12酵素である。ある特定の実施形態では、Cas酵素は、VI型CRISPR-Cas酵素である。ある特定の実施形態では、ベクターは、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、またはアデノ随伴ウイルスベクターであるウイルスベクターである。
一態様では、記載のCRISPRアレイを含む核酸と、CRISPR-Cas酵素と、を含む宿主細胞が本明細書で提供され、CRISPR-Cas酵素は、任意選択で、Cas13酵素またはCas12酵素である。
別の態様では、単一細胞トランスクリプトームへの1つ以上の遺伝子摂動の導入方法が本明細書で提供され、この方法は、宿主細胞を培養することを含む。ある特定の実施形態では、遺伝子摂動プロファイリングの実施方法が提供され、この方法は、(a)宿主細胞を取得することと、(b)細胞からRNAを単離することと、(c)逆転写ハンドルに特異的なプライマーとRNAとを接触させることを含む逆転写を実施することと、(d)バーコード配列を同定することと、(e)1つ以上の転写産物または遺伝子産物の発現を検出することと、を含み、CRISPR-Cas酵素によって、1つ以上の摂動が細胞トランスクリプトームに導入される。ある特定の実施形態では、遺伝子摂動プロファイリングの実施方法が提供され、この方法は、(a)請求項21に記載の宿主細胞を取得し、フルオロフォア結合型抗体で細胞を標識し、フローサイトメトリーを使用して細胞を選別することと、(b)細胞からRNAを単離することと、(c)逆転写ハンドルに特異的なプライマーとRNAとを接触させることを含む逆転写を実施することと、(d)バーコード配列を同定することと、(e)1つ以上の転写産物または遺伝子産物の発現を検出することと、を含み、CRISPR-Cas酵素によって、1つ以上の摂動が細胞トランスクリプトームに導入される。別の実施形態では、方法は、バーコード配列を同定するステップ(d)を含み、ステップ(d)は、PCRハンドルに特異的なプライマーを使用してバーコード配列を増幅することを含む。ある特定の実施形態では、方法は、(e)1つ以上の転写産物または遺伝子産物の発現を検出することを含み、この検出することは、フローサイトメトリー分析、細胞ハッシング(cell-hashing)、単一細胞シークエンシング分析、単一細胞RNAシークエンシング(scRNA-seq)、Perturb-
seq、CROP-seq、CRISP-seq、ECCITE-seq、トランスクリプトーム及びエピトープの細胞インデックス化(cellular indexing of transcriptomes and epitopes)(CITE-seq)のうちの1つ以上を含む。
本発明の他の態様及び利点は、本発明の下記の詳細な説明から容易に明らかになるであろう。
Cas13 RNA Perturb-seq(CaRPool-seq)のためのgRNAの効率的な捕捉を示す。直接的及び間接的なアレイベースのgRNA捕捉手法のスキームである。4つの手法を評価している。直接捕捉では、スペーサーRNAの下流に直接的に付加された逆転写(RT)ハンドルが使用される。間接捕捉方法については、バーコードガイドRNA(bcgRNA)がCRISPRアレイの一部として捕捉される。3つの異なるCRISPRアレイ構成(A、R、及びX)を試験している(RT=逆転写ハンドル、bc=バーコード、PCR=PCRプライマーアニーリング部位、bcgRNA=バーコードガイドRNA、A=アレイ、R=逆アレイ構成、X=追加のPCRハンドル)。 Cas13 RNA Perturb-seq(CaRPool-seq)のためのgRNAの効率的な捕捉を示す。(図1A)に記載の4つのCaRPool-seq構成及び標準gRNAを使用してCas13d介在性のCD46ノックダウン及びdCas13d介在性の対照を行った際のCD46-APCシグナルを示す密度プロットである。すべての場合においてCS1 RTハンドルを使用した。 Cas13 RNA Perturb-seq(CaRPool-seq)のためのgRNAの効率的な捕捉を示す。図1Bにおいて使用したレンチウイルス感染細胞に由来する逆転写crRNAのPCRアンプリコンである。直接捕捉(予想サイズ109bp)、R型アレイ(予想サイズ99bp)、及びX型アレイ(予想サイズ52bp)では、異なる効率での逆転写及び増幅が可能であった。X型アレイは、テンプレートスイッチングの成功とは無関係であり、最も高い検出感度を示す。X型のバンドの強度は、活性なRfxCas13と不活性なRfxdCas13dとの間で等しく、このことは、利用可能なbcgRNA量がCas13のRNA標的化活性によって減少しないことを示唆している。A型アレイでは、プロセシングを受けていないCRISPRアレイの長さのバンド(159bp)がかすかに見られた。 Cas13 RNA Perturb-seq(CaRPool-seq)のためのgRNAの効率的な捕捉を示す。CRISPRアレイウイルスをレンチウイルス形質導入した2,387個のHEK293FT-Cas13d細胞またはマウスNIH/3T3-Cas13d細胞をプロファイリングする種混合実験である。このCRISPRアレイは、非標的化gRNA及びX型構成のbcgRNAを含む。プロットは、各細胞バーコードと関連する転写産物の数を示す。データ点の陰影付け及び枠内のラベルは、トランスクリプトーム分類に基づいて割り当てられている(割り当てに必要な種特異性は90%超である)。 Cas13 RNA Perturb-seq(CaRPool-seq)のためのgRNAの効率的な捕捉を示す。各細胞バーコードと関連するbcgRNAの数である。データ点の陰影付けは、トランスクリプトーム分類に基づき、枠内のラベルは、観測されたgRNAに基づく(割り当てに必要な種特異性は90%超である)。 CaRPool-seqは、マルチモーダルな単一細胞リードアウトと共にコンビナトリアル遺伝子標的化を行うことを可能にする。CaRPool-seqは、CITE-seqモダリティ及び細胞ハッシングモダリティと組み合わせることができる。 CaRPool-seqは、マルチモーダルな単一細胞リードアウトと共にコンビナトリアル遺伝子標的化を行うことを可能にする。標的遺伝子のタンパク質発現(CD46、CD55、CD71についてのADT UMIカウント数)をCRISPRアレイ(n=29)によって群化したものを示すバイオリンプロットである。3つの破線は、すべての非標的化細胞の中央値に対して50%、25%、及び12.5%のUMIカウント数を示す。ひし形はUMIカウント数の中央値を示す。各バイオリンプロットの上に記載されている数字は、単一細胞全体の平均減少レベルを示す。CD71+CD71は実験に含めなかった。 CaRPool-seqは、マルチモーダルな単一細胞リードアウトと共にコンビナトリアル遺伝子標的化を行うことを可能にする。CaRPool-seq実験(n=6,986個細胞)の単一細胞タンパク質発現プロファイルをUMAPで視覚化したものである。細胞は、それに与えられた一重摂動またはコンビナトリアル摂動に基づいて陰影付けされている。 CaRPool-seqは、マルチモーダルな単一細胞リードアウトと共にコンビナトリアル遺伝子標的化を行うことを可能にする。CD46、CD55、CD71について、UMAPでの視覚化に基づいてbcgRNA、mRNA、及びタンパク質(ADT)の発現レベルを重ね合わせたものである(n=6,986個総細胞)。 代替のコンビナトリアル摂動手法に対するCarPool-seqのベンチマーク評価を示す。CaRPool-seqと直接捕捉Perturb-seqとを比較する三重摂動シナリオ向けのレンチウイルス生成のためのプラスミドベクターである。両方の場合において、10×Genomics feature barcoding technologyを使用して目的の特徴量が捕捉される。CaRPool-seqでは、単一のバーコード配列(bcgRNA)がコンビナトリアル摂動に相当する一方で、Perturb-seqでは、複数のgRNAを独立して捕捉することが必要である。 代替のコンビナトリアル摂動手法に対するCarPool-seqのベンチマーク評価を示す。一重摂動、二重摂動、及び三重摂動について、gRNAの正しい組み合わせが検出された細胞の割合である。破線は、Replogle et al.(Nat.Biotechnol.38,954-961(2020))に報告されたようにp=0.81でsgRNAを独立して検出した仮定に基づく理論的推定を表す。 代替のコンビナトリアル摂動手法に対するCarPool-seqのベンチマーク評価を示す。割り当てられた非標的化(s)gRNA(NT)または3つの標的化(s)gRNAの組み合わせを用いた細胞における細胞表面タンパク質(CD46、CD55、及びCD71)の相対発現である。各標的の発現レベルはNT対照で正規化した。棒は、s.e.m.エラーバーを付加した細胞全体の平均を示す。 代替のコンビナトリアル摂動手法に対するCarPool-seqのベンチマーク評価を示す。CaRPool-seq実験、及びCas9、KRAB-dCas9、またはKRAB-dCas9-MeCP2を使用したPerturb-seq実験がマージされたものの単一細胞発現プロファイルをタンパク質レベルADTベースでクラスター化したものである。細胞は、摂動技術によって陰影付けされている。細胞は、技術にまたがって一緒にクラスター化しており、このことは、すべての手法が、同様の表現型強度の摂動を導入することを示している。 代替のコンビナトリアル摂動手法に対するCarPool-seqのベンチマーク評価を示す。CaRPool-seq実験、及びCas9、KRAB-dCas9、またはKRAB-dCas9-MeCP2を使用したPerturb-seq実験がマージされたものの単一細胞発現プロファイルをタンパク質レベルADTベースでクラスター化したものである。細胞は、与えられた一重摂動またはコンビナトリアル摂動に基づいて陰影付けされている。細胞は、技術にまたがって一緒にクラスター化しており、このことは、すべての手法が、同様の表現型強度の摂動を導入することを示している。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。通常のgRNA、または3つの逆転写ハンドル(pA(30)=長さ30のポリA尾部、CS1=10×Genomics Capture Sequence1、CS2=10×Genomics Capture Sequence2、NT=非標的化)のうちの1つを含む直接捕捉gRNA、のいずれかでCas13d介在性のノックダウンを行った際のCD46-APC、CD55-FITC、及びCD71-PEのフローサイトメトリーシグナルを示す密度プロットである。縦線はCDタンパク質陰性細胞の閾値(NT細胞集団の2パーセンタイル)を印付けしており、1つの反復実験の陰性細胞パーセントを示す。重要なことに、Cas13介在性機能はユニモーダルな応答を示し、このことは、標的遺伝子ノックダウンにおける細胞間差異が限定的であることを示唆している。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。(図4A)に示される3つの反復実験のまとめ解析である。Y軸は、すべてのNT細胞集団の平均に対する平均蛍光強度(MFI)を示す。CS1またはCS2を含む直接捕捉コンストラクトはCD46を強力にノックダウンすることが可能であるが、CD55及びCD71についてはノックダウンが減少している。pAハンドルを含む直接捕捉では、通常のgRNA(標準条件)と比較してノックダウン効率の大幅な減少が見られる。両側t検定、p<0.05、**p<0.01、及び***p<0.001。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。通常のgRNA、直接捕捉gRNA、またはA型、R型、及びX型の間接捕捉コンストラクト(図1Aに示されるもの)、のいずれかでCas13d介在性のノックダウンを行った際のCD46-APC、CD55-FITC、及びCD71-PEのシグナルを示す密度プロットである。RTハンドルを含めたコンストラクトでは、そのすべてにおいてCS1を使用した。X型は、部分的TSO(pTSO)PCR プライミング部位またはIllumina低分子RNA PCRハンドル配列、のいずれかと共に使用した。縦線はCDタンパク質陰性細胞の閾値を印付けしており、1つの反復実験の陰性細胞パーセントを示す。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。(図4C)に示される3つの反復実験のまとめ解析である。Y軸は、すべてのNT細胞集団の平均に対する平均蛍光強度(MFI)を示す。間接捕捉コンストラクトは、通常のgRNA(標準条件)と同様に、3つすべての標的遺伝子に対して強力な標的遺伝子ノックダウンを示す。間接的ガイド捕捉における標的化効率のわずかな減少は、CRISPRアレイのプロセシング制約によって説明され得る。両側t検定、p<0.05、**p<0.01、及び***p<0.001。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。通常のgRNA、直接捕捉gRNA、またはX型の間接捕捉コンストラクト、のいずれかでCas13d介在性のノックダウンを行った際のCD46-APC、CD55-FITC、及びCD71-PEのシグナルを示す密度プロットである。ここでは、ポリA尾部RTハンドルの効果及び配置を比較している。X型は、pTSOまたは低分子RNA PCRハンドル配列のいずれかと共に使用した。縦線は、CDタンパク質陰性細胞の閾値を印付けしており、1つの反復実験の陰性細胞パーセントを示す。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。(図4E)に示される3つの反復実験のまとめ解析である。Y軸は、すべてのNT細胞集団の平均に対する平均蛍光強度(MFI)を示す。間接捕捉コンストラクトは、通常のgRNA(標準条件)と同様に、3つすべての標的遺伝子に対して強力な標的遺伝子ノックダウンを示す。ポリA尾部配列を介する直接捕捉が行える状態での標的ノックダウンは限られたものである。両側t検定、p<0.05、**p<0.01、及び***p<0.001。 Cas13dスペーサーRNAに3’共通配列を付加することによる直接的なガイドRNA捕捉を示す。図4Eにおいて使用したレンチウイルス感染細胞に由来する逆転写crRNAのPCRアンプリコンである。低分子RNA PCRハンドル及びポリA尾部を含むX型crRNAの間接捕捉(矢印)では、逆転写及び増幅が可能であった。こうした結果は、間接的gRNA捕捉が、CS1ベースの捕捉の代替としてのポリA尾部での補足でも促進され得ることを示す。X型アレイは、テンプレートスイッチングの成功とは無関係である。 10×Genomics Feature Barcoding technologyから編集したbcgRNA捕捉スキームを示す。 CaRPool-seqが効率的なbcgRNA捕捉及び特異的な標的RNAノックダウンを可能にすることを示す。cDNA、及び一緒にアッセイした4つのモダリティ(GEX=遺伝子発現、bcgRNA=バーコードガイドRNA、ADT=抗体由来タグ、HTO=ハッシュタグオリゴヌクレオチド)の代表的なバイオアナライザトレースである。 CaRPool-seqが効率的なbcgRNA捕捉及び特異的な標的RNAノックダウンを可能にすることを示す。CRISPRアレイの割り当てによって群化した細胞ごとに正規化bcgRNA UMIカウント数を示す積み上げバイオリンプロットである[総細胞数n=9,355、単一のbcgRNAを含む細胞数n = 6,986,(74.7%)]。 CaRPool-seqが効率的なbcgRNA捕捉及び特異的な標的RNAノックダウンを可能にすることを示す。示されるCRISPRアレイによって群化された細胞(y軸)及び対照NT細胞(x軸)の正規化疑似バルクRNA UMIカウント数プロファイを示す散布図である。それぞれの標的遺伝子(CD46、CD55、CD71)が強調されている。CD71+CD71は実験に含めなかった。 CaRPool-seqが効率的なbcgRNA捕捉及び特異的な標的RNAノックダウンを可能にすることを示す。示されるCRISPRアレイによって群化された細胞及び対照NT細胞の遺伝子発現差異の結果を示すボルケーノプロットである。細胞の群化は図6Cのものと同じである。x軸は、log変換変化倍率を示す。y軸は、-log10変換調整p値(ウィルコクソン検定)を示す。 CaRPool-seqが効率的なbcgRNA捕捉及び特異的な標的RNAノックダウンを可能にすることを示す。CD46、CD55、及びCD71を標的とするgRNAに由来するgRNA依存性予測オフターゲット転写産物の部位及び相対発現レベルである。e値はBlastn由来のものである(ウィルコンクソン検定 調整p<0.05、**調整p<0.01、***調整p<0.001)。 CaRPool-seqが効率的なbcgRNA捕捉及び特異的な標的RNAノックダウンを可能にすることを示す。Cas13d、Cas9ヌクレアーゼ、及びKRAB-dCas9-MeCP2ベースのCD55標的化(それぞれ3つの独立したCD55標的化(s)gRNA及びNT(s)gRNAを使用するもの)のバルクRNA-seqの結果である。ボルケーノプロットは、示されるCRISPRエフェクタータンパク質によって群化された対応NT条件に対するCD55標的化条件の遺伝子発現差異の結果を示す。x軸は、log変換変化倍率を示す。y軸は、-log10変換調整p値(DESeq2)を示す。3つの手法では、CD55の減少以外にも遺伝子の発現に差異が見られたが、発現差異が生じた遺伝子の数は異なっている(n=1 Cas13d、n=3 Cas9、n=30 KRAB-dCas9-MeCP2)。Cas13d gRNA及びCas9s gRNAの効率については、図7A及び図8Aに示される。 A~Cは、単一ガイドRNAについて、CaRPool-seqが標的RNA及びタンパク質ノックダウンを検出することを示す。(A)標的遺伝子ごとに3つの代替gRNAを用いてCas13d介在性のノックダウンを行った際のCD46-APC、CD55-FITC、及びCD71-PEのシグナルをフローサイトメトリーによって測定して3つのNT対照の平均と対比した棒グラフである。Y軸は、すべてのNT細胞集団の平均に対する平均蛍光強度(MFI)を示す。両側t検定、p<0.05、**p<0.01、及び***p<0.001。ガイドRNA g1はCaRPool-seq実験に使用した。ガイドRNA g2及びガイドRNA g3はB及びCに使用した。(B)CRISPRアレイ当たり同じgRNA(g1)の1つ、2つ、もしくは3つのコピー、または2つ及び3つの代替gRNA(g2、g3)、のいずれかを用いてCas13d介在性のノックダウンを行った際のCD46-APC、CD55-FITC、及びCD71-PEのシグナルを示す密度プロットである。縦線はCDタンパク質陰性細胞の閾値(統合したNT条件の2パーセンタイル)を印付けしており、1つの反復実験の陰性細胞パーセントを示す。1つの代表的な反復実験が示される。(C)Bに示される3つの反復実験のまとめ解析である。Y軸は、すべてのNT細胞集団の平均に対する平均蛍光強度(MFI)を示す。この解析は、Bに示されるようにgRNA効率が同等であることを考慮すると、アレイ当たりのgRNAの数の間の標的遺伝子ノックダウン差異が、同じ総数のgRNAアイデンティティーの間の差異と比較して顕著であることを示唆している。同じ標的に対する複数のgRNAをコードするCRISPRアレイを使用することで、標的ノックダウンがさらに増強され得る。両側t検定、p<0.05、**p<0.01、及び***p<0.001。 CaRPool-seqが効率的なコンビナトリアル標的RNA摂動を可能にすることを示す。確立されたゲノムワイドノックアウト(KO)ライブラリー(Doench,J.G.et al.Nat.Biotechnol.34,184-191(2016))及びCRISPRiライブラリー(Sanson,K.R.et al.Nat.Commun.9,1-15(2018))に由来する3つの代替sgRNAを用いてCas9ヌクレアーゼ介在性のKO及びCRISPRi介在性の(KRAB-dCas9、KRAB-dCas9-MeCP2)ノックダウンを行った際のCD46-APC、CD55-FITC、及びCD71-PEのフローサイトメトリーシグナルを示す密度プロットである。縦線はCDタンパク質陰性細胞の閾値(統合したNT条件の2パーセンタイル)を印付けしており、1つの反復実験の陰性細胞パーセントを示す。陰性細胞に対するパーセントが最も高い単一ガイドRNAを直接捕捉Perturb-seq実験用に選択した(NA=sgRNAによるアッセイ未実施)。 CaRPool-seqが効率的なコンビナトリアル標的RNA摂動を可能にすることを示す。三重sgRNAプラスミドベクターのクローニング方針である。二重sgRNAコンストラクトを以前の報告のようにクローニングした(Replogle,J.M.et al.Nat.Biotechnol.38,954-961(2020))。以前に試験された代替sgRNAスキャフォールド(Replogle,J.M.et al.Nat.Biotechnol.38,954-961(2020))を使用してウシU6プロモーターの下流に第3のsgRNAをクローニングした。 CaRPool-seqが効率的なコンビナトリアル標的RNA摂動を可能にすることを示す。図3Eと同様に、CaRPool-CITE-seq実験(n=6,986個細胞)、及びCas9ヌクレアーゼエフェクタータンパク質を使用したPerturb-seq実験(n=2,836)、KRAB-dCas9エフェクタータンパク質を使用したPerturb-seq実験(n=2,911)、またはKRAB-dCas9-MeCP2エフェクタータンパク質を使用したPerturb-seq実験(n=3,038)がマージされたものの単一細胞発現プロファイルをタンパク質レベルADTベースでクラスター化したものである。細胞は、検出されたbcgRNAまたはsgRNAに基づいて標的遺伝子の組み合わせの割り当てによって標識され、Perturb-seqによって分けられている。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。CRISPR Cas13dリボ核タンパク質(RNP)複合体への包埋時のbcgRNAの3’エキソヌクレアーゼ分解のモデルである。bcgRNAの最初の約22個のヌクレオチドはCas13タンパク質に包埋される一方で、3’末端はRNP複合体の外側に突出する(Mendez-Mancilla,A.et al.Cell Chem.Biol.1-7(2021)doi:10.1016/j.chembiol.2021.07.011)。安定なRNA構造を形成し得る配列は、逆転写ハンドル(RT)のすぐ下流に配置すると、エキソヌクレアーゼ分解に対抗し得る。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。bcgRNAの3’に配置した場合に安定なRNA構造を形成し得るヌクレオチド配列である。MALAT1及びNEAT1(MENβ)に見られた配列(Brown,J.A.et al.Proc.Natl.Acad.Sci.U.S.A.109,19202-19207(2012))は、潜在的ターミネーター配列(>=4U)が除去され、RNAポリメラーゼIIIによって当該配列が完全に転写されるようになるには、ヌクレオチド交換(赤で示される)を必要とするものである。試験した他の配列については以前に報告されている(spnpreQ、ZIKV xrRNA1、mpknot、及びevopreQ)(Kang,M.et al.Proc.Natl.Acad.Sci.U.S.A.111,(2014)、Akiyama,B.M.et al.Science.354,1148-1152(2016)、Anzalone,A.V.et al.Nat.Methods 13,453-458(2016))。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。CaRPool-seq実験(n=1,770個細胞)の単一細胞タンパク質発現プロファイルをUMAPで視覚化したものである。4つの異なるgRNA[非標的化対照、CD46、CD55、及びCD71)を7つの異なる安定化エレメントのうちの1つ[安定化エレメントなし(標準)または図9Bに示される6つのうちの1つ]と組み合わせて実験に含めた。細胞は、それが受けた一重摂動に基づいて陰影付けされている。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。CaRPool-seq実験(n=1,770個細胞)の単一細胞タンパク質発現プロファイルをUMAPで視覚化したものである。細胞は、それが受けた安定化エレメントに基づいて陰影付けされている。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。標的遺伝子のタンパク質発現(CD46、CD55、CD71についてのADT UMIカウント数)をCRISPRアレイによって群化したものを示すバイオリンプロットである[標的遺伝子(y軸)及び安定化RNAエレメント(x軸)の組み合わせ;n=28]。3つの破線は、標的ADTによるすべての非標的化細胞の平均値に対して50%、25%、及び12.5%のUMIカウント数を示す。各バイオリンプロットの上に記載されている数字は、gRNAと標的とがマッチしている細胞について、単一細胞全体の減少の中央値を示す。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。各細胞に割り当てたbcgRNAのUMIカウント数を標的遺伝子及びRNAエレメントによって分けたものである。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。標準bcgRNA捕捉条件でのUMIカウント数に対するbcgRNA UMIカウント数のエンリッチメント倍率を標的遺伝子によって分けたものである。evopreQエレメントでは、平均で6倍高いbcgRNA検出感度が得られた。 安定なRNA構造がCaRPool-seq実験でのbcgRNAの検出を改善し得ることを示す。同じ細胞で検出され得る2番目に存在量の多い割り当てbcgRNAとの合計と対比した割り当てbcgRNAのUMI割合[UMI g1/(UMI g1+UMI g2)]である。第2のbcgRNAが検出されない場合は、g2 UMIのカウント数を1に設定した。
プール型のCRISPRスクリーニングを単一細胞RNAシークエンシングと組み合わせることで、遺伝子機能及び制御ネットワークを系統的に調べることが可能になっている。本明細書では、RNA標的化CRISPR/Cas13d系を利用し、マルチモーダル
な単一細胞プロファイリングと共に効率的なコンビナトリアル摂動を可能にするCas13 RNA Perturb-seq(CaRPool-seq)(本明細書ではCARP-seqとも称される)について記載される。CaRPool-seqは、検出可能なバーコード配列と結び付いた切断可能なアレイ上に複数の摂動をコードして、複数の遺伝子を同時に標的にすることを可能にする。本発明者らは、CaRPool-seqを現存のCas9ベースの方法と比較し、コンビナトリアル摂動を与えた細胞を効率的にプロファイリングする上でCaRPool-seqが特有の強みを有することを実証した。本発明はさまざまな細胞型を用いて使用できる共に、CRISPR Cas系を使用して標的とすることに適した任意の転写産物の標的化に使用できることを当業者なら認識するであろう。CARP-seqは、例えば、細胞ハッシング及び細胞表面タンパク質定量化(CITE-seq)と共に利用することができる。
本明細書に別に定義されない限り、本明細書で使用される専門用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解される意味と同じ意味、及び公開テキスト(本出願で使用される用語の多くに対する一般的な指針を当業者に与える)への参照によって一般に理解される意味と同じ意味を有する。
本明細書及び特許請求の範囲を通じて使用される「含む(comprising)」、「含む(containing)」、「含む(including)」という用語、及びその変形形態は、他の成分、要素、整数、ステップ、及び同様のものを含む。逆に、「からなる(consisting)」という用語及びその変形形態は、他の成分、要素、整数、ステップ、及び同様のものを除外する。
「a」または「an」という用語は1つ以上を指すことに留意されたい。例えば、「RNA標的」は、1つ以上のRNA標的(複数可)を表すことが理解されよう。したがって、「a」(または「an」)、「1つ以上」、及び「少なくとも1つ」という用語は本明細書で互換的に使用される。
本明細書で使用される「約」という用語は、別段の指定がない限り、所与の言及値からの変動率が±10%であることを意味する。
組成物
本明細書では、1つ以上のcrRNA(複数可)及びバーコードガイドRNA(bcgRNA)を含むCRISPRアレイ、ならびにそれをコードする配列を含む核酸、発現カセット、及びベクターが提供される。本明細書で提供される「CRISPRアレイ」は、細胞トランスクリプトームに1つ以上の摂動を導入することが可能なcrRNA(複数可)及びバーコードガイドRNA(bcgRNA)の配置を指す。bcgRNAが存在することで、単一細胞リードアウトを含む下流分析の間にCRISPRアレイを検出することが容易になる。いくつかの実施形態では、CRISPRアレイは、1つ、2つ、3つ、またはそれを超える数のcrRNAと、DR配列、バーコード配列、及び逆転写ハンドルを含むbcgRNAと、を5’から3’の順に含む。別の実施形態では、bcgRNAはPCRハンドルも含む。ある特定の実施形態では、CRISPRアレイは、1つ、2つ、3つ、またはそれを超える数のcrRNAと、DR配列、バーコード配列、及び逆転写ハンドルを含むbcgRNAと、を5’から3’の順に含む。さらに別の実施形態では、bcgRNAは、CRISPRアレイ中で1つ以上のcrRNA配列の上流(5’)に位置する。
crRNA
本明細書で使用される「crRNA」は、規則的な間隔でクラスター化した短鎖反復回文配列(CRISPR)RNAの略語であり、CRISPR RNAは、ダイレクトリピ
ート(DR)ステムループ配列及びガイド配列から構成される核酸分子である。「ガイドRNA」または「gRNA」または「ガイド配列」または「スペーサー配列」という用語は本明細書で互換的に使用され、標的核酸(または標的配列)(例えば、標的RNA)の配列(ハイブリダイゼーション領域または標的領域)とのハイブリダイゼーションが可能な核酸配列を指す。一実施形態では、ガイドRNAは、約20ヌクレオチド(nt)~約33ntである。別の実施形態では、ガイドRNAは、約20nt、約21nt、約22nt、約23nt、約24nt、約25nt、約26nt、約27nt、約28nt、約29nt、約30nt、約31nt、約32nt、または約33ntである。一実施形態では、ガイドRNAは、約23ntである。別の実施形態では、ガイドRNAは、約27ntである。gRNAは、非天然起源のヌクレオチドを含み得る。
本明細書で使用される「標的配列」は、ガイド(スペーサー)配列が逆相補性を有するように設計される対象となる配列を指し、標的配列とスペーサー配列との間でハイブリダイゼーションが生じることで、CRISPR複合体の形成が促進される。標的配列は、RNAポリヌクレオチドを構成し得る。「標的RNA」という用語は、コード転写産物及び非コード転写産物を含めて、標的配列であるまたは標的配列を含むRNAポリヌクレオチドを指す。換言すれば、標的RNAは、crRNAの一部(すなわち、スペーサー配列)が相補性を有するように設計される対象であり、かつCRISPRエフェクタータンパク質及びガイドRNA(gRNA)を含む複合体によって媒介されるエフェクター機能の対象となるRNAポリヌクレオチドまたはRNAポリヌクレオチドの一部であり得る。ある特定の実施形態では、標的配列は、細胞の核中または細胞質中に位置し得る。一実施形態では、標的RNAは、少なくとも20nt(または少なくとも23nt、または少なくとも87nt、または少なくとも100nt)のRNA残基またはその改変物を含む。別の実施形態では、標的RNAは、少なくとも20ntの連続するRNA残基またはその改変物を含む。標的RNAのうちで、crRNAのガイドとのハイブリダイゼーションが可能な領域は、本明細書では潜在的ハイブリダイゼーション領域と称される。そのような標的RNA、そこに含まれるハイブリダイゼーション領域、標的RNAのハイブリダイゼーション領域のハイブリダイゼーション対象であり得るcrRNA、及びcrRNAのガイドは、互いに対応する。
crRNAの核酸配列は、標的配列とハイブリダイゼーションし、標的配列へのCRISPR複合体の配列特異的結合を導く上で十分な標的ポリヌクレオチド配列(例えば、標的RNA配列)との相補性を有する任意のポリヌクレオチド配列であり得る。いくつかの実施形態では、改変crRNAのスペーサー配列とその対応標的配列との相補性の程度は、適切なアライメントアルゴリズムを使用して最適にアライメントをとった場合、約50%、約60%、約75%、約80%、約85%、約90%、約95%、約97.5%、約99%、もしくはそれを超える%、または約50%超、約60%超、約75%超、約80%超、約85%超、約90%超、約95%超、約97.5%超、約99%超、もしくはそれを超える%超である。「相補性」という用語は、伝統的なワトソン・クリックまたは他の非伝統的な型のいずれかによって核酸が別の核酸配列と水素結合(複数可)を形成する能力を指す。相補性パーセントは、第2の核酸配列との水素結合形成(例えば、ワトソン・クリック塩基対形成)が可能な核酸分子中残基の割合を示す。本明細書で使用される「相補的」という用語は、配列が完全な相補性を有すること(すなわち、核酸配列のすべての連続残基が第2の核酸配列中の同じ数の連続残基と水素結合を形成することになる)を指すか、または配列が実質的に相補的であること(すなわち、配列が有する相補性が100%未満であること)指し得るが、但し、厳密な条件の下で2つの核酸のハイブリダイゼーションが生じることが条件である。ハイブリダイゼーションについての「厳密な条件」という用語は、標的配列との相補性を有する核酸が標的配列と優位にハイブリダイゼーションし、非標的配列とは実質的にハイブリダイゼーションしない条件を指す。厳密な条件は、一般に、配列に依存し、いくつかの因子に応じて異なる。一般に、配列が長れば長い
ほど、温度が高くても配列はその標的配列と特異的にハイブリダイゼーションするようになる。厳密な条件の例は、Tijssen(1993),Laboratory Techniques In Biochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes Part 1,Second Chapter “Overview of principles of hybridization and the strategy of nucleic acid probe assay”,Elsevier,N.Y.に詳述されているが、これに限定されない。最適なアライメントは、配列のアライメント用の任意の適切なアルゴリズムを使用して決定することができ、こうしたアルゴリズムの例としては、限定されないが、ClustalW及びClustalXが挙げられる。いくつかの実施形態では、スペーサー配列のヌクレオチド長は、約20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、40、45、50、75、またはそれを超える数である。場合によっては、スペーサー配列のヌクレオチド長は約20である。他の場合では、スペーサー配列のヌクレオチド長は23である。他の場合では、スペーサー配列のヌクレオチド長は約25である。標的配列へのCRISPR複合体の配列特異的結合を導くスペーサー配列の能力は任意の適切なアッセイによって評価され得る。例えば、被験スペーサー配列を含む、CRISPR複合体の形成に十分なCRISPR系の成分が、(CRISPR配列の成分をコードするベクターのトランスフェクションなどによって)対応標的配列を有する宿主細胞へと供給され、その後に標的配列内が選択的に切断されるかが評価され得る。同様に、標的ポリヌクレオチド配列の切断は、標的配列と、被験スペーサー配列、及び被験スペーサー配列とは異なる対照スペーサー配列を含む、CRISPR複合体の成分と、を供給し、被験スペーサー配列反応と対照スペーサー配列反応との間で標的配列への結合または標的配列の切断率を比較することによって試験管内で評価され得る。適切なcrRNAのヌクレオチド配列は、cas13design.nygenome.orgにおいてオンラインで利用可能な利用可能な、Sanjana labによって供給されるCas13ガイドデザイナーを含めて、当該技術分野で知られるウェブベースのソフトウェアのいずれかを使用して選択され得る。Guo et al.,Transcriptome-wide Cas13 guide RNA design for model organisms and viral RNA pathogens,bioRxiv 2020.08.20.259762及びWessels,HH.,Mendez-Mancilla,A.,Guo,X.et al.Massively parallel Cas13
screens reveal principles for guide RNA
design.Nat Biotechnol 38,722-727(2020)も併せて参照のこと。これらの文献は、参照によって本明細書に組み込まれる。
本明細書に記載のcrRNA及びbcgRNAは、ダイレクトリピート(DR)配列を含む。DR配列は、Casタンパク質がガイドRNAと複合体を形成するショートヘアピン領域である。今日までに報告されたすべてのCRISPR-Casエフェクターと同様に、Cas13酵素はそれぞれ、その対応crRNA内のステムループ構造含有ダイレクトリピート(DR)配列を認識する。ある特定の実施形態では、crRNAは、Cas13dタンパク質と複合体を形成し、クラス2のVI型タンパク質(Cas13dまたはそのバリアントなど)に対して標的化特異性及び結合能力を付与することが可能である。いくつかの実施形態では、DR配列はCas13d配列である。一方、Cas13サブタイプ間では、DR配列モチーフ、RNAフォールド、及びスペーサー配列に対するDR位置はそれぞれ異なる。Cas13a及びCas13dについては、DRは5’末端上に位置する一方で、Cas13bのDRはスペーサー配列の3’に位置する。したがって、一実施形態では、DRは、スペーサー配列の5’に位置する。別の実施形態では、DRは、スペーサー配列の3’に位置する。例えば、Cheng et al,Structural Basis for the RNA-Guided Ribonuclease
Activity of CRISPR-Cas13d,Cell.2018 Sep 20;175(1):212-223.e17を参照のこと。当該文献は、参照によって本明細書に組み込まれる。いくつかの実施形態では、DRは、crRNA中のスペーサー配列の5’に位置する。
bcgRNA
本明細書で提供されるCRISPRアレイは、使用されている特定のアレイの検出及び/または同定を可能にするバーコードガイドRNA(bcgRNA)を必要とする。bcgRNAは、バーコード配列及び逆転写ハンドルを含む。ある特定の実施形態では、bcgRNAはPCRハンドルも含む。バーコードまたはバーコード配列は、それが含まれる特定のアレイに対応する特有のDNA配列であり、その結果、バーコードは、アレイに含まれる摂動の集約的アイデンティティーをコードする。バーコードは、典型的には、4つ以上のヌクレオチドを含む。いくつかの実施形態では、バーコードは、4つ、5つ、6つ、7つ、8つ、9つ、10個、11個、2個、13個、14個、または15個のヌクレオチドを含む。いくつかの実施形態では、バーコードは、8~15個のヌクレオチドを含む。いくつかの実施形態では、複数の異なるアレイを含むCRISPRアレイのライブラリーが提供され、それぞれの特有のアレイは、異なるバーコードを含む。いくつかの実施形態では、提供されるCRISPRアレイは、bcgRNAの5’にダイレクトリピート(DR)配列を含む。DR配列は、使用されるCas酵素に特異的である。
「逆転写(RT)ハンドル」という用語は、bcgRNAのうちで、逆転写を促進するためのプライマー結合部位である配列を指す。したがって、適切な逆転写反応では、プライマーの伸長によって、テンプレートbcgRNAと相補的な配列を含むポリヌクレオチドが形成される。ある特定の実施形態では、RTハンドルは、少なくとも4ヌクレオチドの長さ、5ヌクレオチドの長さ、10ヌクレオチドの長さ、15ヌクレオチドの長さ、20ヌクレオチドの長さ、25ヌクレオチドの長さ、30ヌクレオチドの長さ、35ヌクレオチドの長さ、40ヌクレオチドの長さ、45ヌクレオチドの長さ、50ヌクレオチドの長さ、60ヌクレオチドの長さ、70ヌクレオチドの長さ、80ヌクレオチドの長さ、90ヌクレオチドの長さ、100ヌクレオチドの長さ、またはこれらの長さのいずれか2つの範囲に含まれる長さを有する。ある特定の実施形態では、RTハンドルはポリA配列(または尾部)を含み、この場合、オリゴ(dT)プライマーが適切であろう。ある特定の実施形態では、RTハンドルは、基材(例えば、単離ビーズ)上のポリヌクレオチドとのハイブリダイゼーションが可能である。一実施形態では、RTハンドルのヌクレオチド長は、7、12、17、または22である。別の実施形態では、RTハンドルは、10×Genomics Capture Sequenceまたはそのバリアントを含む。一実施形態では、RTハンドルは、10×Genomics Capture Sequence CS1を含む。別の実施形態では、RTハンドルは、10×Genomics Capture Sequence CS2を含む。
ある特定の実施形態では、bcgRNAの逆転写によってPCRハンドルの相補鎖が合成され、このPCRハンドルは、bcgRNAの5’に位置するDRと、バーコード配列との間に位置する。例えば、図1Aを参照のこと。「PCRハンドル」という用語は、プライマーに結合してPCRを促進することが可能なプライマー結合部位を指す。ある特定の実施形態では、PCRハンドルは、バーコード配列を含む相補鎖のPCRにおける伸長を促進するためのプライマー結合部位である。PCRハンドルは、少なくとも4ヌクレオチドの長さ、5ヌクレオチドの長さ、10ヌクレオチドの長さ、15ヌクレオチドの長さ、20ヌクレオチドの長さ、25ヌクレオチドの長さ、30ヌクレオチドの長さ、35ヌクレオチドの長さ、40ヌクレオチドの長さ、45ヌクレオチドの長さ、50ヌクレオチドの長さ、60ヌクレオチドの長さ、70ヌクレオチドの長さ、80ヌクレオチドの長さ、90ヌクレオチドの長さ、100ヌクレオチドの長さ、またはこれらの長さのいずれか
2つの範囲に含まれる長さを有する。一実施形態では、PCRハンドルは、Illumina PCRハンドルである。
CRISPRアレイ
CRISPRアレイは、少なくとも1つのcrRNA、及びbcgRNAを含む。いくつかの実施形態では、アレイは、1つ、2つ、3つ、またはそれを超える数のcrRNAを含む。これらのcrRNAは、Cas酵素と共に導入された場合、細胞トランスクリプトームに同じまたは異なる摂動(複数可)を与えるように設計され得る。これらのcrRNAは、いくつかの実施形態では、同じcrRNAであり、例えば、crRNA用量の効果を評価するためのものである。他の実施形態では、これらのcrRNAは異なる。いくつかの実施形態では、これらのcrRNAは、同じ遺伝子転写産物を標的とする(例えば、当該標的遺伝子転写産物の異なる領域/配列を標的とする)。他の実施形態では、これらのcrRNAは、異なる遺伝子転写産物を標的とする。
ある特定の実施形態では、被験crRNAのさまざまな組み合わせを含む複数のCRISPRアレイが提供される。例えば、図2Aを参照のこと。例えば、いくつかの実施形態では、コンビナトリアル標的化を試験するために、異なる遺伝子転写産物を標的とする2つ、3つ、またはそれを超える数のcrRNAが含められる。他の実施形態では、単一のcrRNAの1つ、2つ、3つ、またはそれを超える数のコピーを異なるCRISPRアレイに含め、効果を評価することなどによって、用量依存性が試験され得る。さらに他の実施形態では、CRISPRアレイ中のさまざまなcrRNAの位置を変化させることによってcrRNAの位置依存性が試験され得る。図2Aは、3つのcrRNA(またはgRNA)が利用されるある特定の実施形態を示す。一方で、1つ、2つ、3つ、またはそれを超える数のcrRNAが利用される他の実施形態も企図される。本明細書に記載の成分に基づく他の組み合わせも企図される。
本明細書に記載のCRISPRアレイは、適切な条件の下でCas酵素/系と共に提供された場合、酵素によるプロセシングを受けて1つ、2つ、3つ、またはそれを超える数の成熟crRNA、及びbcgRNAになる。例えば、Konermann,S.et al.Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors.Cell 173,665-676(2018)を参照のこと。
いくつかの実施形態では、本明細書に記載のCRISPRアレイは、任意のRNA標的化CRISPR酵素(Cas13ファミリーのメンバーなど)との使用に有用である。多様なCas13ファミリーは、Cas13a(以前はC2c2)、Cas13b、Cas13c、及びCas13dを含む、少なくとも4つの既知のサブタイプを含む。Cas13ファミリーは、一本鎖RNAを排他的に標的とすることが知られる唯一のクラス2 Cas酵素ファミリーである。Cas13酵素及び系については当該技術分野で知られており、例えば、米国特許第10,362,616号、Abudayyeh,et al,C2c2 is a single-component programmable RNA-guided RNA-targeting CRISPR effector.Science 353,aaf5573(2016)、S.Shmakov,et al,Discovery and functional characterization of diverse class 2 CRISPR-Cas systems.Mol.Cell 60,385-397(2015)、S.Shmakov,et
al,Diversity and evolution of class 2 CRISPR-Cas systems.Nat.Rev.Microbiol.15,169-182(2017)、A.A.Smargon,et al,Cas13b is
a type VI-B CRISPR-associated RNA-guide
d RNase differentially regulated by accessory proteins Csx27 and Csx28.Mol.Cell 65,618-630.e7(2017)、J.S.Gootenberg,et al,Nucleic acid detection with CRISPR-Cas13a/C2c2.Science 356,438-442(2017)、O.O.Abudayyeh,et al,RNA targeting with CRISPR-Cas13.Nature 550,280-284(2017)を参照のこと。これらの文書はそれぞれ、本明細書に組み込まれる。
Cas13タンパク質は、ステムループを介してCas13分子と相互作用し、Cas13分子の一連の立体配座変化を介して標的への結合及びその切断を促進するショートcrRNAを使用する。ある特定の実施形態では、Cas13タンパク質は、Cas13a、Cas13b、Cas13c、またはCas13dである。一実施形態では、Cas13は、HEPNドメイン(複数可)に1つ以上の変異を含む。
Cas13タンパク質は、任意の生物に由来し得る。ある特定の実施形態では、Cas13エフェクタータンパク質は、Leptotrichia、Listeria、Corynebacter、Sutterella、Legionella、Treponema、Filifactor、Eubacterium、Streptococcus、Lactobacillus、Mycoplasma、Bacteroides、Flaviivola、Flavobacterium、Sphaerochaeta、Azospirillum、Gluconacetobacter、Neisseria、Roseburia、Parvibaculum、Staphylococcus、Nitratifractor、Mycoplasma、Campylobacter、及びLachnospiraから選択される属の生物に由来する。一実施形態では、Cas13は、Leptotrichia shahii、Leptotrichia wadei、Listeria seeligeri、Clostridium aminophilum、Carnobacterium gallinarum、Paludibacter
propionicigenes、Listeria weihenstephanensis、またはRuminococcus flavefaciensに由来する。
Cas13dタンパク質は、crRNAによってガイドされるクラス2のVI型CRISPRエフェクターである。Cas13dでは、ヘリックスドメインと隣接する2つの高等真核生物及び原核生物ヌクレオチド結合(HEPN)ドメインが発見されている。例えば、WO2019/010384Al、US2019/0169595A1、Zhang
C,et al.(2018).Structural Basis for the
RNA-Guided Ribonuclease Activity of CRISPR-Cas13d.Cell 175,212-223.e217、golden.com/wiki/CRISPR-Cas13d、及びzlab.bio/cas13を参照のこと。当該刊行物は、その全体が参照によって本明細書に組み込まれる。本明細書を通じて、クラス2のVI型という用語は幅広い属であり、その例としてCas13dが示されているが、「Cas13d」または「Cas13d及びそのバリアント」という用語の使用は、他のクラス2のVI型タンパク質も包含し、これらの用語は互換的に使用され得ることを当業者なら理解するであろう。Cas13d及びそのバリアントには、例えば、野生型もしくは天然起源のCas13dタンパク質、Cas13dのオルソログ、その機能性バリアント、または開示される別の改変バリアントが含まれる。
オルソログは、種分化によって共通の祖先遺伝子から進化した異なる種の遺伝子である。通常、オルソログは、進化の過程で同じ機能を保持する。いくつかの実施形態では、Cas13dは、Ruminococcus flavefaciens株XPD3002
由来のRfxCas13d、Anaerobic digesterメタゲノム15706由来のAdmCas13d、Eubacterium siraeum DSM15702由来のEsCas13d、腸メタゲノムアセンブリP1E0-k21由来のP1E0Cas13d、Ruminoccocus属の難培養種由来のUrCas13d、Ruminoccocus flavefaciens FD1由来のRffCas13d、及びRuminoccocus albus由来のRaCas13dから選択される。一実施形態では、Cas13dタンパク質は、RfxCas13dまたはそのバリアントである。Cas13dオルソログのアミノ酸配列は公的に利用可能である。一実施形態では、Cas13dは、Protein Data Bank(PDB)受入番号6OAW_Bもしくは6OAW_Aもしくは6E9F_Aもしくは6E9E_Aもしくは6IV9_Aによって提供されるアミノ酸配列を有するか、またはUniProtKB識別子B0MS50(B0MS50_9FIRM)もしくはA0A1C5SD84(A0A1C5SD84_9FIRM)によって提供されるアミノ酸配列を有する。これらの参照の配列はそれぞれ、その全体が参照によって本明細書に組み込まれる。
一実施形態では、Cas13dのバリアントは、Cas13dと同じ生物学的機能を共有するタンパク質またはポリペプチドであるCas13dタンパク質の機能性バリアントであり得る。Cas13dタンパク質の機能性バリアントは、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、約20個、約25個、約30個、約35個、約40個、約45個、約50個、約60個、約70個、約80個、約90個、約100個、約110個、約120個、約130個、約140個、約150個、約160個、約170個、約180個、約200個、約220個、約240個、約260個、約280個、約300個、約330個、約360個、約390個、またはそれを超える数の保存的アミノ酸置換(複数可)を有するCas13dタンパク質であり得る。保存的置換の対象となり得るアミノ酸の同定、置換されたアミノ酸の決定、ならびにタンパク質へのアミノ酸置換の導入に関する方法及び手法については、当業者によく知られている。sift.jcvi.org/ 及び(Ng & Henikoff,Predicting the Effects of Amino Acid Substitutions on Protein
Function,2006、Ng & Henikoff,Predicting the effects of coding non-synonymous variants on protein function using the SIFT
algorithm,2009、Ng PC,2003、Ng & Henikoff,Accounting for Human Polymorphisms Predicted to Affect Protein Function,2002、Sim,et al.,2012、Sim,et al.,2012)を参照のこと。これらはそれぞれ、その全体が参照によって本明細書に組み込まれる。
ヒト細胞へのcrRNAの送達は困難であり得、一過性の作用は、その半減期が限られ得る。したがって、ヒト細胞における標的化効率及び/または半減期を増加させる改変crRNAが使用され得る。他の場合では、改変crRNAは、その非改変配列均等物と比較して活性及び/または特異性を改善させる。ある特定の実施形態では、提供される核酸は、1つ以上のヌクレオチドに化学的改変を含む1つ以上のcrRNAを含む。例えば、長さが約23ヌクレオチドであるスペーサー配列は、1つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、もしくは10個以上)の改変ヌクレオチドを有し得るか、または長さが約30ヌクレオチドであるダイレクトリピート配列は、1つ以上(例えば、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、もしくは10個以上)の改変ヌクレオチドを有し得る。「改変ヌクレオチド」という用語は、ヌクレオシドの窒素含有塩基(例えば、シトシン(C)、チミン(T)もしくはウラシル(U)、アデニン(A)、またはグアニン(G))の中または上に、ヌクレオシドの糖部分(例えば
、リボース、デオキシリボース、改変リボース、改変デオキシリボース、6員の糖類似体、または開鎖糖類似体)の中または上に、あるいはリン酸に1つ以上の化学的改変(例えば、置換)を含むヌクレオチドを指す。場合によっては、スペーサー配列は、少なくとも2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、またはそれを超える数の改変ヌクレオチドを含む。改変ヌクレオチドは、crRNA配列の任意の核酸位置に位置し得る。化学的改変は、ダイレクトリピート中、スペーサー配列中、または両方に存在し得る。一実施形態では、改変ヌクレオチドは、スペーサー配列の最初(5’)及び/もしくは最後の(3’)ヌクレオチドにもしくはその付近に存在し、ならびに/またはそれらのヌクレオチドの間の任意の位置に存在し得る。特定の実施形態では、改変ヌクレオチドは、スペーサー配列の3’末端に存在する。いくつかの実施形態では、改変crRNAは、そのリン酸骨格が改変されている。改変crRNAは、1つ以上のホスホロチオエート(S)、ホスホロアミデート(例えば、N3’-P5’-ホスホロアミデート(NP))、2’-O-メトキシ-エチル(2’MOE)、2’-O-メチル-エチル(2’ME)、及び/またはメチルホスホン酸結合を含み得る。いくつかの実施形態では、改変crRNA中の1つ以上の改変ヌクレオチドは、ホスホロチオエート(S)結合を含む。
本明細書で使用されるcrRNA及びbcgRNAは、当業者に知られる任意の方法によって合成され得る。いくつかの実施形態では、crRNA及び/またはbcgRNAは、化学的に合成される。方法は、例えば、Dellinger et al.,J.American Chemical Society 133,11540-11556(2011)、Threlfall et al.,Organic & Biomolecular Chemistry 10,746-754(2012)、及びDellinger et al.,J.American Chemical Society 125,940-950(2003)に記載されている。本明細書で有用な化学的改変については、他のCas系での使用向けに報告されている。例えば、US2018/0119140を参照のこと。当該文献は、参照によって本明細書に組み込まれる。
ある特定の実施形態では、CRISPRアレイは、安定化RNAエレメントを含む。本発明者らは、bcgRNAの3’末端に安定化RNAエレメントを付加することで、核酸分解に対抗し、bcgRNAの検出感度を改善し得ることを示している。安定構造を形成するRNAエレメントについては当該技術分野で知られている(例えば、Mendez-Mancilla,A.et al.Cell Chem.Biol.1-7(2021)doi:10.1016/j.chembiol.2021.07.011を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ある特定の実施形態では、安定化RNAエレメントは、MALAT1三重構造である(Brown,J.A.et al.Proc.Natl.Acad.Sci.U.S.A.109,19202-19207(2012)を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ある特定の実施形態では、安定化RNAエレメントは、NEAT1(MENβ)構造である(Brown,J.A.et al.Proc.Natl.Acad.Sci.U.S.A.109,19202-19207(2012)を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ある特定の実施形態では、安定化RNAエレメントは、spnpreQ構造である(Kang,M.et al.Proc.Natl.Acad.Sci.U.S.A.111,(2014)を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ある特定の実施形態では、安定化RNAエレメントは、mpknotエレメントである(Anzalone,A.V.et al.Nat.Methods 13,453-458(2016)を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ある特定の実施形態では、安定化RNAエレメントは、ジカウイルス由来のxrRNA1ダンベルである(Akiyama,B.M.et al.Science.354,1148-1152(2016)を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ある特定の実施形態では、安定化RNAエレメ
ントは、evopreQ1シュードノットである(例えば、Nelson,J.W.et
al.Nat.Biotechnol.(2021)doi:10.1038/s41587-021-01039-7を参照のこと)。ある特定の実施形態では、安定化RNAエレメントは、evopreQ1シュードノットであり、安定化RNAエレメントを含まないCRISPRアレイと比較して、検出感度を少なくとも3倍、4倍、5倍、または6倍に改善する。ある特定の実施形態では、安定化RNAエレメントは、配列番号39、40、41、42、43、または44に示される配列を含む。
本明細書で使用される「宿主細胞」という用語は、標的RNAを有するまたは標的RNAを有することが疑われる任意の標的細胞を指し得る。したがって、「宿主細胞」は、本明細書に記載のCRISPRアレイを含む原核細胞または真核細胞を指し、当該CRISPRアレイは、任意の手段によって細胞に導入されているものであり、こうした手段は、例えば、電気穿孔、ヌクレオフェクション(nucleofection)、リン酸カルシウム沈殿、マイクロインジェクション、形質転換、ウイルス感染、トランスフェクション、リポソーム送達、膜融合手法、DNA被覆ペレットの高速導入、ウイルス感染、及びプロトプラスト融合である。本明細書に記載のある特定の実施形態では、「宿主細胞」という用語は、本明細書に記載の組成物をインビトロで評価するための任意の哺乳類種の培養細胞を指す。「宿主細胞」という用語は、本明細書に記載のウイルススベクターまたは非ウイルスベクターを生成させるための産生プラスミドを含むパッケージング細胞も指し得る。
一実施形態では、宿主細胞は、初代細胞である。「初代細胞」と言う用語は、多細胞生物から直接的に単離された細胞を指す。初代細胞は、典型的には、集団倍加はほぼ生じておらず、それ故に、その由来元である組織の主な機能的要素を、連続継代性の(腫瘍または人為的不死化)細胞株と比較して色濃く代表するものである。場合によっては、初代細胞は、単離後すぐに使用されている細胞である。他の場合では、初代細胞は無限増殖が不可能なものであり、それ故に、インビトロで長期間培養することができない。他の実施形態では、細胞は、培養細胞(例えば、哺乳類細胞または細菌細胞)である。ある特定の実施形態では、宿主細胞は、不死化細胞株である。ある特定の場合では、初代細胞は、幹細胞または免疫細胞である。幹細胞の例としては、限定されないが、造血幹/前駆細胞(HSPC)(CD34+HSPCなど)、間葉系幹細胞、神経幹細胞、臓器幹細胞、及びそれらの組み合わせが挙げられる。免疫細胞の例としては、限定されないが、T細胞(例えば、CD3+T細胞、CD4+T細胞、CD8+T細胞、腫瘍浸潤性細胞(TIL)、メモリーT細胞、メモリー幹T細胞、エフェクターT細胞)、ナチュラルキラー細胞、単球、末梢血単核細胞(PBMC)、末梢血リンパ球(PBL)、及びそれらの組み合わせが挙げられる。他の実施形態では、初代細胞またはその子孫(例えば、初代細胞由来の細胞)は、CRISPRアレイ及びCasポリペプチドを初代細胞に導入した後に、(例えば、任意の許容可能な送達系及び送達経路を介して投与することで)多細胞生物(例えば、ヒト)に戻される。
本明細書に記載の「核酸」または「ヌクレオチド」は、RNA、DNA、またはその改変物であり得、例えば、目的タンパク質をコードする核酸、オリゴヌクレオチド、核酸類似体(例えばペプチド核酸(PNA)、擬似相補的(pseudocomplementary)PNA(pc-PNA)、架橋型核酸(LNA)など)を含む群から選択され得る。ある特定の実施形態では、「ヌクレオチド」、「核酸」、「ヌクレオチド残基」、及び「核酸残基」という用語は互換的に使用され、核酸ポリマー中のヌクレオチドを指す。別の実施形態では、連続ヌクレオチド残基は、核酸ポリマーの連続領域中のヌクレオチド残基を指す。
リボ核酸(RNA)は、遺伝子のコード、デコード、調節、及び発現におけるさまざま
な生物学的役割に必須のポリマー分子である。本明細書で使用されるRNAは、CRISPRガイドRNA、メッセンジャーRNA(mRNA)、ミトコンドリアRNA、ショートヘアピンRNAi(shRNAi)、低分子干渉RNA(siRNA)、成熟mRNA、一次転写産物mRNA(pre-mRNA)、リボソームRNA(rRNA)、5.8S rRNA、5S rRNA、転移RNA(tRNA)、転移メッセンジャーRNA(tmRNA)、エンハンサーRNA(eRNA)、低分子干渉RNA(siRNA)、マイクロRNA(miRNA)、核小体低分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、tRNA由来低分子RNA(tsRNA)、低分子rDNA由来RNA(srRNA)、非コードRNA(ncRNA)、ロング(遺伝子間)非コードRNA(lincRNA/lncRNA)、一本鎖RNA(ssRNA)、環状RNA(circRNA)、ヴォールトRNA(vRNA/vtRNA)、SmY RNA、二本鎖RNA(dsRNA)、カハール小体特異的RNA(scaRNA)、アンチセンスRNA(aRNA/asRNA)、リボヌクレアーゼRNA(例えば、RNaseP)、非コード制御性RNA(例えば、7SK RNA)、RNAウイルス、または一本鎖DNAを指し得る。一実施形態では、標的RNAは、内在性RNA(例えば、mRNA)である。付加的または代替的に、標的RNAは、CDSを含む/である。別の実施形態では、標的RNAは、UTR(5’UTRまたは3’UTRを含む)を含む/である。さらに別の実施形態では、標的RNAは、イントロンを含む/である。ある特定の実施形態では、標的RNAは、非コード転写産物である。
本明細書で使用されるデオキシリボ核酸(DNA)は、デオキシリボ核酸によって形成されるポリマー分子であり、こうしたものには、限定されないが、ゲノムDNA、二本鎖DNA、一本鎖DNA、ヒストンタンパク質と共にパッケージングされるDNA、相補的DNA(RNAから逆転写されたcDNA)、ミトコンドリアDNA、及び染色体DNAが含まれる。
本明細書に記載の核酸配列は、所定の分子生物学手法を使用してクローニングするか、またはDNA合成によってデノボ生成させることができ、こうしたことは、DNA合成及び/または分子クローニングの領域でビジネスを行っているサービス企業(例えば、GeneArt、GenScript、Life Technologies、Eurofins)によって所定の手順を使用して実施され得る。本明細書に記載のCRISPR-Cas編集系の態様をコードする核酸配列はアセンブリされ、保有配列を宿主細胞に導入する任意の適切な遺伝的エレメント(例えば、ネイキッドDNA、ファージ、トランスポゾン、コスミド、エピソームなど)中に配置される。こうした遺伝的エレメントは、例えば、非ウイルス送達系(例えば、RNAベースの系、ネイキッドDNA、もしくは同様のもの)を生成させるためのもの、もしくはパッケージング宿主細胞においてウイルスベクターを生成させるためのもの、及び/または対象中の宿主細胞に送達するためのものである。一実施形態では、遺伝的エレメントは、ベクターである。一実施形態では、遺伝的エレメントは、プラスミドである。そのような操作されたコンストラクトの調製に使用される方法は、核酸操作の技能を有する当業者に知られており、そうした方法には、遺伝子操作、組換え操作、及び合成手法が含まれる。例えば、Green and Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,NY(2012)を参照のこと。
本明細書で使用される「発現カセット」は、遺伝子編集系の1つ以上のエレメント(例えば、本明細書に記載のCRISPRアレイ及び/またはCas酵素)をコードする核酸分子を指す。発現カセットはプロモーターも含み、宿主細胞における遺伝子編集系の1つ以上のエレメントの発現を制御する追加の調節エレメントも含み得る。一実施形態では、発現カセットは、ウイルスベクター(例えば、ウイルス粒子)のカプシド中にパッケージ
ングされ得る。一実施形態では、本明細書に記載のウイルスベクターを生成させるためのそのような発現カセットは、ウイルスゲノムのパッケージングシグナル及び他の発現制御配列(本明細書に記載のものなど)と隣接する。核酸分子もしくはベクターまたはその使用に関する実施形態では、CRISPRアレイをコードする核酸分子は、例えば、RNA
pol IIプロモーターまたはRNA pol IIIプロモーターと機能可能なように結び付いたものであり得る。RNA pol IIIプロモーターは、RNAポリメラーゼIII機構による転写が正確に開始されるように導く上で十分なプロモーターであり、RNAポリメラーゼIII(RNAP III及びPol III)は、DNAを転写してリボソーム5SリボソームRNA(rRNA)、転移RNA(tRNA)、crRNA、及び他の低分子RNAを合成するRNAポリメラーゼである。使用できるさまざまなポリメラーゼIIIプロモーターは公的または商業的に利用可能であり、こうしたポリメラーゼIIIプロモーターは、例えば、U6プロモーター、ヒト起源もしくはマウス起源または任意の他種由来のH1 RNA遺伝子またはU6 snRNA遺伝子に由来するプロモーター断片である。さらに、pol IIIプロモーターは、遍在性にまたは組織特異的様式で他の望ましい特性(化学低分子によって誘導される能力など)を含むように改変/操作され得る。例えば、一実施形態では、プロモーターは、テトラサイクリンによって活性化され得る。別の実施形態では、プロモーターは、IPTG(lacI系)によって活性化され得る。US5902880A及びUS7195916B2を参照のこと。別の実施形態では、さまざまな種(ヒト、マウス、またはラットなど)に由来するPol
IIIプロモーターが利用され得る。
「調節エレメント」または「調節配列」という用語は、目的の核酸配列(例えば、Cas13dコード配列、またはCRISPRアレイを発現させるための配列)と連続する発現制御配列と、目的の核酸配列を制御するためにトランスまたは遠隔で作用する発現制御配列とを指す。本明細書に記載の調節エレメントは、限定されないが、プロモーター、エンハンサー、転写因子、転写ターミネーター、効率的なRNAプロセシングシグナル(スプライシングシグナル及びポリアデニル化シグナル(ポリA)など)、細胞質mRNAを安定化させる配列(例えば、ウッドチャック肝炎ウイルス(WHP)転写後調節エレメント(WPRE))、翻訳効率を増強する配列(すなわち、コザックコンセンサス配列)、タンパク質安定性を増強する配列、ならびに必要に応じて、コード産物の分泌を増強する配列を含む。Goeddel;Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)も併せて参照のこと。調節配列には、多くの型の標的細胞において核酸配列の構成的発現を導くもの、及びある特定の標的細胞中でのみ核酸配列の発現を導くもの(例えば、組織特異的調節配列)が含まれる。さらに、CRISPRアレイまたはCas13dは、特定の間隔でまたは特定の期間にわたってCRISPRアレイまたはCas13dの合成を導くために、調節配列を含むベクターによって送達され得る。ベクターの設計は、要因(標的細胞の選択、所望の発現のレベル、及び同様のものなど)に依存し得ることを当業者なら理解するであろう。
本明細書で使用される「機能可能なように連結された」配列または「機能可能なように結び付いた」配列は、目的の核酸配列(例えば、Cas13dコード配列、またはCRISPRアレイを発現させるための配列)と連続する発現制御配列と、目的の核酸配列を制御するためにトランスまたは遠隔で作用する発現制御配列との両方を含む。
「発現」という用語は、その最も広い意味において本明細書で使用され、RNAの産生、タンパク質の産生、またはRNA及びタンパク質の両方の産生を含む。発現は一過性のものであり得るか、または安定的なものであり得る。
発現カセットは、任意の適切な送達系を介して宿主細胞に送達され得る。適切な非ウイ
ルス送達系については当該技術分野で知られており(例えば、Ramamoorth and Narvekar.J Clin Diagn Res.2015 Jan;9(1):GE01-GE06を参照のこと。当該文献は、参照によって本明細書に組み込まれる)、当業者によって容易に選択され得る。こうした適切な非ウイルス送達系には、例えば、ネイキッドDNA、ネイキッドRNA、デンドリマー、PLGA、ポリメタクリレート、無機粒子、脂質粒子(例えば、脂質ナノ粒子、すなわちLNP)、またはキトサンベースの製剤が含まれ得る。
ある特定の実施形態では、遺伝子編集系の1つ以上のエレメントは、ベクターまたはウイルスベクターによって宿主細胞に送達される核酸配列によってコードされ、こうしたベクターまたはウイルスベクターは、その多くが当該技術分野で知られており、利用可能である。一実施形態では、本明細書に記載の発現カセットを含むベクターが提供される。
一実施形態では、ベクターは、非ウイルスベクターである。別の実施形態では、ベクターは、ウイルスベクターである。「ウイルスベクター」は、目的の核酸配列を含む発現カセットがウイルスカプシド中またはエンベロープ中にパッケージングされる合成ウイルス粒子または人工ウイルス粒子を指す。ウイルスベクターの例としては、限定されないが、レンチウイルス、アデノウイルス(Ad)、レトロウイルス(γ-レトロウイルス及びレンチウイルス)、ポックスウイルス、アデノ随伴ウイルス(AAV)、バキュロウイルス、単純ヘルペスウイルスが挙げられる。一実施形態では、ウイルスベクターは、複製欠陥である。「複製欠陥ウイルス」は、ウイルスカプシド中またはエンベロープ中に併せてパッケージングされるウイルスゲノム配列がいずれも複製欠損であり、すなわち、子孫ビリオンは生成できないが、細胞に感染する能力は保持するウイルスベクターを指す。
一実施形態では、ベクターは、本明細書に記載の発現カセットを含む非ウイルスプラスミド(例えば、ネイキッドDNA、ネイキッドプラスミドDNA、RNA、及びmRNA)であり、こうした非ウイルスプラスミドは、さまざまな組成物及びナノ粒子と組み合わせられ、こうした組成物及びナノ粒子には、例えば、ミセル、リポソーム、陽イオン性脂質-核酸組成物、ポリグリカン組成物及び他のポリマー、脂質及び/またはコレステロールベースの核酸複合体、ならびに他のコンストラクト(本明細書に記載のものなど)が含まれる。例えば、X.Su et al,Mol.Pharmaceutics,2011,8(3),pp774-787;ウェブ公開日:2011年3月21日、WO2013/182683、WO2010/053572、及びWO2012/170930を参照のこと。これらの文献はすべて、参照によって本明細書に組み込まれる。
本発明に従って使用することができるプラスミド、他のクローニングベクター及び発現ベクター、その特性、ならびにその構築/操作方法は、当業者には容易に明らかである。一実施形態では、本明細書に記載の遺伝子編集系のエレメントまたは本明細書に記載の発現カセットは、ウイルスベクターの生成及び/または宿主細胞への送達に有用な適切な遺伝エレメント(ベクター)へと操作導入される。こうした適切な遺伝エレメント(ベクター)は、それが保有する配列を導入するものであり、例えば、ネイキッドDNA、ファージ、トランスポゾン、コスミド、エピソームなどである。選択されるベクターは、トランスフェクション、電気穿孔、リポソーム送達、膜融合手法、DNA被覆ペレットの高速導入、ウイルス感染、及びプロトプラスト融合を含めて、任意の適切な方法によって送達され得る。そのようなコンストラクトの調製に使用される方法は、核酸操作の技能を有する当業者に知られており、そうした方法には、遺伝子操作、組換え操作、及び合成手法が含まれる。例えば、Sambrook et al,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,NYを参照のこと。
本明細書で使用される「摂動」という用語は、標的配列の変異または改変の結果として
1つ以上の転写産物、遺伝子、または遺伝子産物(タンパク質を含む)に及ぶ作用を指す。変異または改変には、例えば、小さなヌクレオチド挿入もしくはヌクレオチド欠失(インデル)またはより大きな欠失、挿入、もしくは逆位が含まれる。ある特定の実施形態では、変異または改変の導入は、「編集」または「遺伝子編集」と称される。
本明細書で使用される「遺伝子編集系」は、特定の遺伝子または核酸配列(すなわち、標的配列)に対する特異性を典型的には有する遺伝物質改変技術または遺伝物質改変分子機構を指す。ある特定の実施形態では、遺伝子編集系は、1つ以上のRNA標的配列に摂動を導入する規則的な間隔でクラスター化した短鎖反復回文配列(CRISPR)系である。
ある特定の実施形態では、適切なCRISPR遺伝子編集系は、Cas酵素と、本明細書で提供されるCRISPRアレイと、を最低限含む。ある特定の実施形態では、遺伝子編集系は、編集酵素としてのCas13dと、本明細書で提供されるCRISPRアレイとを含む。ある特定の実施形態では、CRISPRアレイをコードする核酸配列と、Cas13d酵素をコードする核酸配列と、を含む発現カセットを有する核酸を含むベクターが提供される。したがって、ある特定の実施形態では、二重ベクター系(例えば、WO2016/176191に記載のもの)が提供され、遺伝子編集系は、発現を導く調節配列の制御下にあるCas13遺伝子を含む発現カセットと、本明細書で提供されるCRISPRアレイを含む第2の発現カセットと、を含む。
CRISPRアレイ、核酸分子、ベクター、組成物、任意の他の成分、方法、または使用に関して記載される実施形態はいずれも、CRISPRアレイ、核酸分子、ベクター、組成物、任意の他の成分、方法、または使用に関する任意の他の実施形態と組み合わせられ得ることにも留意されたい。
方法
本明細書に記載のCRISPRアレイ、核酸分子、RNP、ベクター、細胞、及びライブラリーのうちの1つ以上はさまざまな方法に有用であり、こうした方法には、限定されないが、異常なRNAと関連する疾患の治療;機能性RNA(複数可)のスクリーニング;標的RNAのノックダウン、検出、または編集;あるいはスプライシング、選択的アイソフォーム、イントロンリテンション、もしくはUTR使用差異の検出もしくは編集、または分解を伴わない標的への結合が含まれる。一態様では、遺伝子摂動プロファイリングの実施方法が提供される。
一態様では、遺伝子摂動プロファイリングの実施方法が提供される。方法は、本明細書に記載のCRISPRアレイとCas酵素とを含む宿主細胞を提供することを含み、CRISPR-Cas酵素によって、1つ以上の摂動が細胞トランスクリプトームに導入される。方法は、細胞からRNAを単離することと、RNA試料を逆転写ハンドルに特異的なプライマーと接触させることを含む逆転写を実施することと、バーコード配列を同定することと、をさらに含む。方法は、1つ以上の転写産物または遺伝子産物の発現を検出することをさらに含む。いくつかの実施形態では、方法は、フローサイトメトリー分析、細胞ハッシング、単一細胞シークエンシング分析、単一細胞RNAシークエンシング(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq.、ならびにトランスクリプトーム及びエピトープの細胞インデックス化(CITE-seq)のうちの1つ以上を使用することをさらに含む。いくつかの実施形態では、方法は、PCRハンドルに特異的なプライマーを使用してバーコード配列を増幅することを含む。
別の実施形態では、遺伝子摂動プロファイリングの実施方法は、本明細書に記載のCR
ISPRアレイとCas酵素とを含む宿主細胞を提供することを含み、CRISPR-Cas酵素によって、1つ以上の摂動が細胞トランスクリプトームに導入され、宿主細胞は、1つ以上のフルオロフォア結合型抗体で標識され、フローサイトメトリーを使用して選別される。方法は、単離された細胞からRNAを単離することと、RNA試料を逆転写ハンドルに特異的なプライマーと接触させることを含む逆転写を実施することと、バーコード配列を同定することと、をさらに含む。方法は、1つ以上の転写産物または遺伝子産物の発現を検出することをさらに含む。いくつかの実施形態では、方法は、フローサイトメトリー分析、細胞ハッシング、単一細胞シークエンシング分析、単一細胞RNAシークエンシング(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq.、ならびにトランスクリプトーム及びエピトープの細胞インデックス化(CITE-seq)のうちの1つ以上を使用することをさらに含む。いくつかの実施形態では、方法は、PCRハンドルに特異的なプライマーを使用してバーコード配列を増幅することを含む。
本明細書に記載のCRISPRアレイを使用する上では、Cas13dタンパク質をコードする核酸と共に当該CRISPRアレイを提供することが望ましくあり得る。Cas13dをコードする核酸は、複製及び/または発現のための原核細胞または真核細胞への形質転換のための中間ベクターにクローニングされ得る。中間ベクターは、典型的には、Cas13タンパク質バリアントをコードするその産生用核酸の保存または操作のための原核生物ベクター(例えば、プラスミドまたはシャトルベクターまたは昆虫ベクター)である。Cas13dタンパク質をコードする核酸は、植物細胞、動物細胞(好ましくは、哺乳類細胞もしくはヒト細胞)、真菌細胞、細菌細胞、または原生動物細胞への投与のための発現ベクターにもクローニングされ得る。
本明細書に記載のCRISPRアレイと、Cas13ポリペプチド、Cas13dポリペプチドをコードするmRNA、及び/またはそのCas13dポリペプチドバリアントもしくは断片をコードするヌクレオチド配列を含む組換え発現ベクターとは、任意の適切な方法(電気穿孔によるものなど)を使用して細胞に導入される。ある特定の場合では、CRISPRアレイは、Casヌクレアーゼ(例えば、Cas13dポリペプチド)またはそのバリアントもしくは断片と複合体化されて、細胞(例えば、トランスクリプトーム摂動分析のためのインビトロの細胞)への導入のためのリボ核タンパク質(RNP)ベースの送達系を形成する。他の場合では、CRISPRアレイは、Casヌクレアーゼ(例えば、Cas13dポリペプチド)またはそのバリアントもしくは断片をコードするmRNAと共に細胞(例えば、トランスクリプトーム摂動分析のためのインビトロの細胞)に導入される。さらに他の場合では、CRISPRアレイは、Casヌクレアーゼ(例えば、Cas13ポリペプチド)またはそのバリアントもしくは断片をコードするヌクレオチド配列を含む組換え発現ベクターと共に細胞(例えば、トランスクリプトーム摂動分析のためのインビトロの細胞)に導入される。
いくつかの実施形態では、RNAシークエンシングまたはDNAシークエンシングが実施され、その実施方法には、限定されないが、全トランスクリプトーム解析、全ゲノム解析、ゲノムの全領域または標的領域のバーコードシークエンシング、及びそれらの組み合わせが含まれる。いくつかの実施形態では、方法は、(例えばフローサイトメトリーを使用して)細胞表面タンパク質を検出することを含む。ある特定の実施形態では、方法は、当該技術分野で報告される方法を使用する追加の分子モダリティでのプロファイリングと共に、本明細書で提供されるCRISPRアレイを検出または同定することを含み、当該技術分野で報告される方法には、例えば、単一細胞シークエンシング分析(例えば、10×Genomics Multiomeプラットホーム)、単一細胞RNA-シークエンシング(scRNA-seq)(例えば、Haque et al.A practical guide to single-cell RNA-sequencing f
or biomedical research and clinical applications,Genome Medicine,9,Article number:75(2017)、Hwang et al.Single-cell RNA sequencing technologies and bioinformatics pipelines.Exp Mol Med.2018 Aug 7;50(8):96を参照のこと)、細胞ハッシング(例えば、Stoeckius et al.Cell Hashing with barcoded antibodies enables multiplexing and doublet detection for single cell genomics.Genome Biol.2018;19:224を参照のこと)、Perturb-Seq.(例えば、Dixit et al.Perturb-seq:Dissecting molecular circuits with scalable single cell RNA profiling of pooled genetic screens.Cell.2016 Dec 15;167(7):1853-1866.e17を参照のこと)、CROP-seq(例えば、Datlinger et al.Pooled CRISPR
screening with single-cell transcriptome readout Nat Methods.2017 Mar;14(3):297-301を参照のこと)、CRISP-seq(例えば、Jaitin et al.Dissecting Immune Circuits by Linking CRISPR-Pooled Screens with Single-Cell RNA-Seq Cell.2016 Dec 15;167(7):1883-1896.e15を参照のこと)、拡張型CRISPR適合CITE-seq(Expanded CRISPR-compatible CITE-seq)(ECCITE-seq)(例えば、Mimitou et al.Multiplexed detection of
proteins,transcriptomes,clonotypes and CRISPR perturbations in single cells.Nat
Methods.2019 May;16(5):409-41を参照のこと)、及びトランスクリプトーム及びエピトープの細胞インデックス化-seq(CITE-seq)(例えば、Stoeckius et al.Simultaneous epitope and transcriptome measurement in single cells.Nat Methods.2017 Sep;14(9):865-868を参照のこと)が含まれる。
本明細書で使用される「逆転写」は、RNA分子のヌクレオチド配列をDNA分子にコピーするプロセスを指す。逆転写は、RNAテンプレートをRNA依存性DNAポリメラーゼ(逆転写酵素としても知られる)と接触させることによって実施され得る。逆転写酵素は、一本鎖RNAを一本鎖DNAに転写するDNAポリメラーゼである。使用されるポリメラーゼに応じて、逆転写酵素は、その後にRNAテンプレートを分解するためのRNaseH活性も有し得る。
本明細書で使用される「相補的DNA」または「cDNA」は、逆転写酵素の作用を介してRNAから逆転写された合成DNAを指し得る。cDNAは一本鎖または二本鎖であり得、RNA配列の一部と実質的に同一である配列またはRNA配列の一部の相補鎖である配列、の一方または両方を有する鎖を含み得る。
いくつかの実施形態は、プライマーの使用を含む。本明細書で使用される「プライマー」は、試料中に存在する標的ポリヌクレオチドまたはテンプレートポリヌクレオチドとのハイブリダイゼーションによって当該標的またはテンプレートに結合する短いポリヌクレオチド(一般に、その3’-OH基は遊離の状態である)を指し得、このポリヌクレオチドは、結合後に当該プライマーの伸長を促進して当該標的またはテンプレートと相補的な
ポリヌクレオチドを形成する。プライマーは、5~1000個またはそれを超える数のヌクレオチドを含むポリヌクレオチドを含み得る。いくつかの実施形態では、プライマーは、少なくとも4ヌクレオチドの長さ、5ヌクレオチドの長さ、10ヌクレオチドの長さ、15ヌクレオチドの長さ、20ヌクレオチドの長さ、25ヌクレオチドの長さ、30ヌクレオチドの長さ、35ヌクレオチドの長さ、40ヌクレオチドの長さ、45ヌクレオチドの長さ、50ヌクレオチドの長さ、60ヌクレオチドの長さ、70ヌクレオチドの長さ、80ヌクレオチドの長さ、90ヌクレオチドの長さ、100ヌクレオチドの長さ、またはこれらの長さのいずれか2つの範囲に含まれる長さを有する。
発現を得るために、Cas13タンパク質をコードする配列は、典型的には、転写を導くためのプロモーターを含む発現ベクターにサブクローニングされる。適切な細菌プロモーター及び真核生物プロモーターは当該技術分野でよく知られており、例えば、Sambrook et al.,Molecular Cloning,A Laboratory Manual(3d ed.2001)、Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990)、及びCurrent Protocols in Molecular Biology(Ausubel et al.,eds.,2010)に記載されている。操作されたタンパク質を発現させるための細菌発現系は、例えば、E.coli、Bacillus属の種、及びSalmonellaにおいて利用可能である(Palva et al.,1983,Gene 22:229-235)。そのような発現系向けのキットは商業的に利用可能である。哺乳類細胞、酵母、及び昆虫細胞向けの真核生物発現系は当該技術分野でよく知られており、商業的にも利用可能である。
一実施形態では、標的RNAはmRNAであり、調節または摂動は、標的RNAのタンパク質発現の抑制、排除、調整、または調節を含む。標的RNAには、限定されないが、mRNA、ウイルスRNA、非コードRNA、miRNA、piRNA、circRNA、合成RNA、及び他のRNAが含まれる。
正しい転写産物調節の存在を機能的に試験するために、標的RNAは、当業者に知られる標準的な方法によって分析され得る。例えば、変性ゲル電気泳動を実施することで、標的RNAが断片化しているかどうかを決定することができる。標的RNAに対応するタンパク質に指向化された抗体を使用することで、FACSを含む他の手法を実施することができる。正しい転写産物調節の存在の試験に有用な他の方法には、限定されないが、qPCR及びRNA-seqが含まれる。
一態様では、機能性スクリーニング法が提供される。方法は、開示の1つ以上のCRISPRアレイ(複数可)及び/または核酸分子(複数可)及び/またはベクター(複数可)及び/またはライブラリーを細胞培養物、組織、または対象の標的細胞と接触させることを含む。一実施形態では、方法は、標的細胞中の核酸分子またはベクターを増幅することと、任意選択で、核酸分子またはベクターを定量化することと、を含む。
一実施形態では、Cas13dタンパク質は、標的細胞において核酸分子またはベクターによって発現する。したがって、標的細胞においては、CRISPRアレイは、Cas13dまたはその変形形態と複合体を形成し、この複合体を標的RNAに導く。別の実施形態では、核酸分子またはベクターは、CRISPRアレイ(複数可)を含むまたは発現するものと同じ核酸分子またはベクターである。別の実施形態では、核酸分子またはベクターは、Cas13dタンパク質は発現するが、CRISPRアレイは発現せず、したがって、本明細書で使用されるように「Cas13d分子」または「Cas13dベクター」と称される。一実施形態では、Cas13d分子(またはCas13dベクター)とCRISPRアレイ(またはcrRNAを与える核酸分子及び/もしくはベクター)との比
は、約100:1~約1:100(それらの間の各比を含む)である。一実施形態では、比は、約10:1、約5:1、約4:1、約3:1、約2:1、約1:1、約1:2、約1:3、約1:4、約1:5、または約1:10である。別の実施形態では、比は、モル比である。
一実施形態では、コードされるCas13dタンパク質は、Ruminococcus
flavefaciens株XPD3002由来のRfxCas13dである。他のCas13dを利用することもでき、他のCas13dは、例えば、Anaerobic digesterメタゲノム15706由来のAdmCas13d、Eubacterium siraeum DSM15702由来のEsCas13d、腸メタゲノムアセンブリP1E0-k21由来のP1E0Cas13d、Ruminoccocus属の難培養種由来のUrCas13d、Ruminoccocus flavefaciens FD1由来のRffCas13d、及びRuminoccocus albus由来のRaCas13dである。別の実施形態では、Cas13dまたはそのバリアントは、核局在化シグナル(NLS)またはサイトゾルシグナルまたは核外移行シグナル(NES)をさらに含む。さらに別の実施形態では、Cas13dまたはそのバリアントは、標的RNAにニックを生じさせることが可能である。一実施形態では、Cas13dまたはそのバリアントは操作されており、ヌクレアーゼ活性は有さない。一実施形態では、Cas13dは、レポーター分子と複合体化される。
一実施形態では、方法は、標的細胞中の標的RNA(複数可)の1つ以上のレベルを低減する。別の実施形態では、方法は、標的RNA(複数可)を発現する1つ以上の遺伝子(複数可)を機能的にノックダウンまたはノックアウトする。さらに別の実施形態では、方法は、複数の標的細胞中の1つ以上の遺伝子(複数可)を並行してノックダウンまたはノックアウトする。
ある特定の実施形態では、接触ステップ(摂動ステップと称される)の前、間、または後に、標的細胞に選択圧または刺激が加えられる。そのような選択圧または刺激には、例えば、化学的薬剤もしくは生物学的薬剤、または標的細胞(複数可)を能動的かつ物理的に乱すことが含まれる。
ある特定の実施形態では、方法は、細胞生存率、細胞増殖、細胞アポトーシス、細胞死、細胞表現型、分子(例えば、標的RNA(複数可))の存在もしくは濃度、タンパク質もしくは細胞マーカーの発現、または標的細胞の刺激への応答、または標的細胞(複数可)を含む細胞培養物、組織、もしくは対象によって達成され得る機能、を評価することをさら含む。
方法は、生物学的試料を開示のCRISPRアレイ(またはcrRNAを発現する核酸もしくはベクター)と接触させることを含む。一実施形態では、CRISPRアレイは、レポーター分子と複合体化される。別の実施形態では、方法は、crRNA(複数可)と接触させるステップの前、と同時、または後に生物学的試料をCas13dまたはそのバリアントと接触させることをさらに含む。別の実施形態では、Cas13dまたはそのバリアントは、生物学的試料の標的細胞において本明細書に記載の核酸分子またはベクター(CRISPRアレイを与えるものと同じ核酸分子もしくはベクターであるか、または異なるものであり得る)によって発現する。
下記の実施例では、本明細書に記載の本開示の組成物及び方法の一般的な実施形態及び特定の実施形態の両方が開示されるが、こうした組成物及び方法は、本明細書で提供される教示の結果として明らかになる変形形態のいずれか及びすべてを包含すると解釈すべき
である。
実施例1:材料及び方法
細胞培養及びモノクローナル細胞株生成
HEK293FT細胞はThermoFisher(R70007)から入手し、NIH/3T3細胞及びTHP1細胞はATCC(CRL-1658、TIB-202)から入手した。HEK293FT細胞及びNIH/3T3細胞は5%CO下、37℃、DMEM中で維持した。このDMEMは、高濃度グルコース及び安定化L-グルタミン(Caisson DML23)を含み、ウシ胎仔血清(Serum Plus II Sigma-Aldrich 14009C)が10%添加されており、抗生物質は含まないものである。THP1細胞は、5%CO下、37℃で、抗生物質を含まないFBS10%添加RPMI中で増殖させた。ドキシサイクリン誘導性RfxCas13d-NLS HEK293FT細胞、THP1細胞、及びNIH/3T3細胞(Addgene #138149)、ならびにドキシサイクリン誘導性ヌクレアーゼ不活性RfxdCas13d-NLS HEK293FTは以前の報告のように生成させた(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))。フローサイトメーター(SONY SH800)を使用して個々の浮遊THP1細胞を選別して単一クローン株を選択した。単一gRNAのレンチウイルス組み込み、ピューロマイシン選択、及びフローサイトメトリーを使用して、均一に強力なCD46ノックダウンを生じさせるかについて各THP1-Cas13dクローンを評価した。
モノクローナルCas9エフェクタータンパク質発現HEK293FT細胞株は、希釈液を播種して上記のように得た(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))。Cas9エフェクター細胞株のそれぞれについて、一重sgRNA発現カセットのレンチウイルス組み込み、ピューロマイシン選択、及びフローサイトメトリーを使用して、CD55の均一かつ完全なノックアウトまたはノックダウンを与える能力について複数のクローンを評価した。KRAB-dCas9コンストラクト及びKRAB-dCas9-MeCP2コンストラクトのクローニングについては以前に報告されている(Morris,J.A.et al.bioRxiv 2021.04.07.438882(2021))。Cas9ヌクレアーゼについては、lentiCas9-Blast(Addgene #52962)を以前にクローニングした(Sanjana,N.E.et al.Nat.Methods 11,783-784(2014))。モノクローナルCRISPR Casエフェクター発現細胞はすべて、5μg/mLのブラストサイジンS(ThermoFisher A1113903)を使用して維持した。
個々のCas13ガイドRNA及びCas9ガイドRNAのクローニング
Cas13ガイドRNAクローニングは、以前の報告のように実施した(Sanjana,N.E.et al.Nat.Methods 11,783-784(2014))。具体的には、pLentiRNAGuide_001(Addgene #138150)にgRNAまたはバーコードオリゴをクローニングした。スペーサー配列の3’末端に逆転写ハンドルを有するガイドRNAコンストラクトを合成し、一緒にクローニングした。図2A~図2Dに示されるデータにおいて使用したCRISPRアレイを使用するガイドRNAコンストラクトは、ダイレクトリピート及び再構成BsmBI制限酵素認識と共にガイドを導入することによって段階的にクローニングしてCRISPRアレイの一連のクローニング及び伸長を行った。
直接捕捉Perturb-seqについては、すべてのsgRNA発現コンストラクトを段階的にクローニングした。最初に、以前の報告のように二重sgRNAオリゴをpJR85及びpJR89にクローニングした(Replogle,J.M.et al.N
at.Biotechnol.38,954-961(2020))。さらに、一重sgRNAをカスタムsgRNA発現プラスミドにクローニングした。10×GenomicsのマニュアルCG000184 RevCに記載のヒトU6(hU6)プロモーター駆動型のsgRNAスキャフォールド(内部CS1)(pLCR36)、またはウシU6(bU6)プロモーター駆動型のpJR73由来sgRNAカセット(Replogle,J.M.et al.Nat.Biotechnol.38,954-961(2020))(pLCR67)のいずれかを使用した。その後、pLCR67由来のbU6及びsgRNAカセットを二重sgRNAプラスミドにサブクローニングして三重sgRNA発現プラスミドを生成させた(図8Bも参照のこと)。直接捕捉Perturb-seqに向けて、1つのsgRNAを想定するプールについてはpLCR36一重sgRNAコンストラクト、2つのsgRNAを想定するプールについてはpJR85/pJR89コンストラクト、3つのsgRNAを想定するプールについてはpJR85/pJR89/pLCR67コンストラクトを使用した。コンストラクトはすべて、サンガーシークエンシングによって確認した。プラスミド(pLCR36及びpLCR67)は、刊行時までにはAddgeneで利用可能になる。
プール型のCas13dライブラリーの設計及びクローニング
プール型クローニングのためのライブラリーを2つ設計する。1つは、THP1細胞分化を引き起こす遺伝子を同定するものであり、もう1つは、CaRPool-seqを用いるコンビナトリアル標的化のためのものである。最初に、439個の個々の遺伝子を標的とする単一gRNA発現用のRfxCas13d gRNAライブラリーを設計した。TLR4シグナル伝達に関与する199個の対照遺伝子に加えて、以前のCas9ベースのプール型スクリーニングにおいてCD11b及びCD14の上方制御を引き起こした240個の標的遺伝子を選択した。それぞれについて、アイソフォーム発現が最も高い転写産物を選択し(CCLE-broadinstitute.org/ccle/datasets)、本発明者らが以前に報告したCas13設計アルゴリズム(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))を使用して潜在的gRNA配列をスコア付けした。各遺伝子について、コード領域に沿ってgRNAが均等に広がるようにしながら、効力四分位Q4(または十分なQ4 gRNAが見出されなかった場合はQ3)から10個のgRNAを選択した。gRNA配列に対するミスマッチ数が0~2である二次標的部位を含まないgRNAのみを選択した(Guo,X.et al.Cell Genomics 1,100001(2021))。全部で4390個のgRNAを設計し、410個の非標的化対照gRNA(いずれのhg19アノテーション転写産物に対してもミスマッチ数が3超のもの)を加えた。gRNAライブラリーを以前の報告のようにクローニングした(Konermann,S.et al.Cell 173,665-676(2018))。オリゴヌクレオチドプールを合成し(Twist)、ダイレクトリピート特異的フォワードプライマーを使用して増幅サイクル数8回の8×PCR反応を使用して増幅した。アンプリコンをpLentiRNAGuide_001及びpLentiRNAGuide_002(Addgene138150、138151)にGibsonクローニングした。偏りが最小の完成ライブラリー代表物(両ライブラリーについて90パーセンタイル/10パーセンタイルcrRNAリード比:1.8)をIlluminaシークエンシング(MiSeq)によって検証した。
CaRPool-seqライブラリーを設計するために、上記のプール型スクリーニングライブラリーに由来するすべてのgRNAエンリッチメントを手動で調べた。28個の選択標的遺伝子については、最もエンリッチされたgRNA(またはCD14及びATXN7L3については、最も枯渇したgRNA)を、重複gRNAを回避しつつ2つ選択した。各遺伝子について、これら2つのgRNAをペアにし、非標的化gRNAを加えた(n=28一重摂動、n=58アレイ)。17個の遺伝子については、すべてのペアの組み
合せを設計した(n=132遺伝子ペア、n=264アレイ)。9つの遺伝子については、同じ複合体に含まれる可能性のある遺伝子ペアのサブセットを設計した(n=22遺伝子ペア、n=44アレイ)。13個のアレイを非標的化対照アレイとして追加した。合計として、186種類の一重摂動コンストラクトまたは二重摂動コンストラクトを含む385個のアレイを設計しており、これらはそれぞれ、2つの独立した技術的反復gRNA組み合わせによって表される。ハミング距離が互いに4超であるランダムな15mer配列を設計した。細胞増殖に対する標的遺伝子の作用によって相対的なCRISPRアレイ存在量のバランスをとるようにし、プール中のアレイコピーの数を増やしてCaRPool-seq実験での脱落が最小になるようにした。合成用のオリゴは下記の方法で設計した:
PCRハンドル::BsmBI部位::DR::gRNA1::DR::gRNA2::LguI架橋::バーコード::BsmBI部位::PCRハンドル
オリゴヌクレオチドプールを合成し(Twist)、1ng/ulに希釈してから増幅した。外側PCRハンドルによって、PCRでオリゴプールを増幅することが可能であった(95C/2分、5×[95C/20秒、58C/20秒、72C/15秒]、72C/3分の50μl反応において1μlの酵素及び20ngのオリゴプールを使用して製造者の推奨事項に従ってPfu-Ultra-IIを使用した)。2×SPRIクリーンアップを使用してアンプリコンを精製した後、BsmBI消化及びSPRIクリーンアップに供した。T7-DNAリガーゼを使用してすべての精製産物をBsmBI消化pLCR65にライゲーションし、以前の報告のようにクローニングし(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))、コンストラクト当たり1000個超のコロニーを得た。得られたプラスミドプールをLguIで消化して第3のDR及び低分子RNAハンドルをライゲーションできるようにしてbcgRNA及びCRISPRアレイを完成させた。pLentiRNAGuide_002プラスミドからすべてのLguI部位を除去し、ターミネーター配列の5’にCS1捕捉配列を導入し、GFP-P2A-ピューロマイシンでピューロマイシン遺伝子を置き換えることによってpLCR65を生成させた。第3のDR及び低分子RNAハンドルを含むLguI挿入断片をpLentiRNAGuide_001にクローニングし、LguIで消化し、ゲル(2%eGel)で精製した。偏りが最小の完成ライブラリー代表物(90パーセンタイル/10パーセンタイルcrRNAリード比:相対的存在量階層別では2.6~4.8、全体では5.0)及び遺伝子ペアとbcgRNAとの結合の正しさ(>94%)をIlluminaシークエンシング(MiSeq)によって検証した。ライブラリークローニングの間に、決定的な点が2つ認められた:代替のポリメラーゼとしてKAPA及びQ5を使用すると、相対的なアレイ存在量の偏りが強くなり得る。さらに、オリゴプールのインプット量を増やしてPCRサイクル数を少なくすると、bcgRNAの再編成が減少し得る。さらに、2段階クローニング方針を選択したが、1段階クローニング方針でも同様の結果を得ることができると考えられる。pLCR65は、刊行時までにはAddgeneに寄託されることになる。
ウイルス産生及びウイルス形質導入
個々のgRNA発現プラスミド及びsgRNA発現プラスミドのウイルス産生については、6ウェル形式のウェル当たり1×10個のHEK293FT細胞を播種し、12~18時間経過後にトランスフェクションに供した。トランスフェクション反応当たり、7.5ulの1mg/mLポリエチレンイミン(PEI)及び2.325μgの総プラスミドDNA(825ngのpsPAX2:Addgene #12260、550ngのpMD2.G:Addgene #12259、1000ngのgRNA/sgRNA発現プラスミド)を使用した。トランスフェクションから6~8時間後、1%のウシ血清アルブミン(BSA)を含む2mlのDMEM+10%FBSと培地を交換した。さらに48時間後、ウイルス上清を収集し、4℃、1000×gで5分間遠沈して細胞デブリを除去し、使用まで-80Cで保存した。
ウイルスプールの産生については、10cmデッシュ形成において上記のようにプラスミドプールをトランスフェクトした(1×10個のHEK293FT細胞、70μlのPEI、6.4μgのpsPAX2、4.4μgのpMD2.G、及び9.2μgのプラスミドプール)。細胞デブリを遠沈(3分、1000×g)することによってウイルスプールを清澄化し、孔径0.45μmのフィルターに通してから-80℃で保存した。図1A~図1E及び図2A~図2Dに示されるCaRPool-seq実験、ならびに図3A~図3Eに示される直接捕捉Perturb-seq実験については、個々のプラスミドを等量でプールした。このようにして、1つ、2つ、または3つのsgRNAの別々のsgRNAプールを作成して全部で6つのプールを得た(Cas9ヌクレアーゼ向けに3つ、及びKRAB-dCas9(-MeCP2)向けに3つ)。
単一gRNAまたはCRISPRアレイを使用する実験については、1×10個のHEK293FT細胞またはTHP1細胞の形質導入を0.2~0.5のMOIで実施した。形質導入から24時間後の時点で1μg/mlのピューロマイシン(ThermoFisher A1113803)を用いて細胞の選択を開始した。この選択は、HEK293FT細胞については少なくとも48時間実施し、THP1については5日間実施した。CaRPoolseq実験(図1A~図1E及び図2A~図2D)ならびに直接捕捉Perturb-seq実験(図3A~図3E)については、3×10個の細胞(HEK293FT細胞またはNIH/3T3細胞)の形質導入を実施した。THP1細胞において実施したスクリーニングについては、条件当たり少なくとも12×10個の細胞の形質導入を実施した。HEK293FT細胞及びNIH/3T3細胞の選択は少なくとも2日間実施し、THP1細胞の選択は少なくとも5日間実施した。単一細胞スクリーニングについては、ピューロマイシン選択から48時間後の生存率が10%未満となる条件、またはGFP陽性細胞の割合が10%未満となる条件(MOI<0.1)を選択して、確実に、カバレッジが高くなり(>1000×相当量)、単一組み込み確率が95%超となるようにした。プール型スクリーニングは、0.13~0.45のMOIで実施して、>1000×のカバレッジを常に維持するようにした。Cas13d発現の誘導は、1μg/mlドキシサイクリン(Sigma D9891)を使用して実施した。細胞は、単一細胞実験を行うまで、ドキシサイクリン、ブラストサイジン、及びピューロマイシンと共に維持した。この期間の間、ドキシサイクリン、ブラストサイジン、及びピューロマイシンが添加された新鮮な培地へと細胞を2~3日ごとに継代した。
フローサイトメトリー
ピューロマイシンで選択した細胞を、選択開始(HEK細胞)またはCas13d誘導(THP1細胞)から2~7日後に収集した。dCas9 sgRNAの評価は、形質導入から7日後に実施した。細胞のそれぞれの細胞表面タンパク質を4℃で30分間染色し、蛍光活性化細胞選別によって細胞を測定した(Sony SH800)(BioLegend:CD46クローンTRA-2-10 #352405-3μl/1×10個細胞;CD55クローンJS11 #311311-5μl/1×10個細胞;CD71
クローンCYIG4 #334105-4μl/1×10個細胞、CD11bクローンICRF44 #301322-2μl/1×10個細胞)。フローサイトメトリー
分析(FlowJo v10)については、前方散乱光及び側方散乱光ならびにシグナル強度によって細胞をゲートして潜在的なマルチプレットを除外した。存在する場合、live-dead染色(LIVE/DEAD Fixable Violet Dead
Cell Stain Kit,Thermo Fisher L34963)を用いて細胞をさらにゲートした。各試料につき、少なくとも5,000個の細胞を分析した。細胞数がばらつく場合、常に、すべての試料から副試料を(無作為に)採取して、実験内の細胞数が同じになるようにした。
バルクガイドRNA検出
ピューロマイシンで選択した細胞を、選択開始から48時間以上経過後に収集した。約1×10個の細胞からRNAを抽出した(Zymo Direct-zol RNA microPrep)。オリゴ(dT)V30プライマーと共に捕捉配列特異的逆転写 プライマーを使用して全RNAを逆転写した(400ng RNA、4μl 5×RT緩衝液、1μl SuperasIN、1μl dNTP(各10mM)、1μl Maxima H Minus RT酵素、1.5μl 10μMテンプレートスイッチオリゴ、1μl 10μMオリゴ(dT)V30プライマー、1μl 10μM gRNA捕捉配列プライマー、反応体積20μl;53℃/90分、70℃/15分)。部分的TSO及び捕捉配列プライマーまたは遺伝子特異的プライマーを使用して1:2希釈cDNAからCas13 crRNA及びGAPDH mRNAを増幅した(3μl cDNA、10μl KAPA 2×マスターミックス、1μlプライマー(各10μM)、5μl H2O;PCR条件:98℃/45秒、18×[98℃/20秒、60℃/10秒、72℃/10秒]、72℃/5分)。オリゴヌクレオチドは、補足の表2に示される。
Cas13d gRNAオフターゲット予測
潜在的なCas13d gRNAオフターゲット(代替結合部位)を同定するために、下記のパラメーター(-strand minus-max_target_seqs 10000-evalue 10000-word_size 5-perc_identity 0.7)を用いてblastn(megablast)を使用してヒトトランスクリプトーム(Grch38 cdna.all、及びemsemblリリース97由来のncRNA)へのgRNAのアライメントを最初に実施した。次に、少なくとも17塩基がマッチするように(これよりもマッチ数が少ないと標的のノックダウンが生じないため)候補をさらにフィルタリングした。これらの候補は、100未満のblastn e値を示す。図6Eでは、弱いオフターゲット結合が生じる可能性があるにもかかわらず、これらの遺伝子にトランスクリプトーム摂動は認められないことが実証されている。
バルクRNA-seq
Cas13がオフターゲット効果を導入する可能性を、より慎重に試験するために、バルクRNAseq実験を実施した。このバルクRNAseq実験では、低発現転写産物の発現差異を検出する上で追加の能力が得られると予想される。バルクRNA-seq実験については、3つの個別の標的化(s)gRMA及び3つの個別の非標的化(s)gRMAを使用してCD55のノックダウン(Cas13d細胞、KRAB-dCas9-MeCP2細胞)またはノックアウト(Cas9ヌクレアーゼ細胞)を実施した。ガイドを発現するレンチウイルス(MOI0.2~0.5)を用いてモノクローナルHEK293FT細胞株の形質導入(3つの独立した形質導入)を行った。形質導入から24時間後にピューロマイシン(1μg/mL)での選択を開始し、Cas13d発現を誘導した(1μg/mlのドキシサイクリン)。形質導入から7日後、CD55の標的化が効率的に生じたことを、フローサイトメトリーを使用して確認し、全RNAを抽出した(Zymo Direct-zol RNA microPrep)。100ngの精製全RNAインプットを使用して改変バージョンのSmart-seq2プロトコール(protocols.io/view/barcoded-plate-basedsingle-cell-rna-seq-nkgdctw)を実施した。hg19参照を使用してDrop-seq tools v1.0 28でバルクRNA-seq試料を処理した。試料当たり平均で352611 UMI(+/-72067 UMI)が得られた。遺伝子発現差異は、FindMarkersにおいてSeurat’s DESeq2(Love,M.I.et al.Genome Biol.15,550(2014))を実行して評価した。
THP1細胞におけるプール型CRISPRスクリーニング
バルクでのマルチプレックス化Cas13dスクリーニングを実施するための実験手順は、以前の報告に軽微な改変を加えて実施した(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))。上記のようにTHP1細胞の形質導入及びピューロマイシン選択を実施した。細胞を完全に選択した後、Cas13d発現を誘導した(1μg/mLのドキシサイクリン)。新たなピューロマイシン、ブラストサイジン、及びドキシサイクリンを含む増殖培地を2~4日ごとに補充し、必要に応じて細胞を分け、ガイド相当量が>1000×となるように常に維持した。
単一ガイドRNAプール型スクリーニングについては、Cas13dの誘導から7日後及び14日後に1000×相当量を収集し、その後に選別した。2週間(14~16日)が経過後、FcXブロッキング緩衝液を使用し(BioLegend #422302;室温で10分)、その後にCD11bの染色(BioLegendクローンICRF44
#301322-4μl/1×106個細胞)またはCD14の染色(BioLegend クローンHCD14 #325608-4μl/1×10個細胞)(4℃で30分)のいずれかを実施して1500万個の細胞(約3000×相当量)を染色し、最終的に、DAPI(Sigma #D9542-0.4μg/ml)を含むPBSに細胞を再浮遊させて、すべてのアポトーシス細胞または死細胞を検出した。シグナル強度(CD11bまたはCD14:最低10~15%、最高10~15%)に基づいて細胞を選別した(Sony SH800)。細胞をPBSで洗浄し、シークエンシングライブラリー調製まで-80℃で凍結した。全部で4つの独立した形質導入物(2つのMOI及び2つの代替ダイレクトリピート)を調製し、4つすべての形質導入反復実験物についてCD14選別を実施し、3つの形質導入反復実験物についてCD11b選別を実施して、ビン当たり1×10~1.5×10個の細胞を収集した。
コンビナトリアル標的化プール型スクリーニングについては、3つの形質導入反復実験物(MOI 0.13~0.2)を調製した。Cas13dの誘導から8日後、インプット相当量(>1000×カバレッジ)を収集し、FcXブロッキング、CD11b、及びDAPIを上記のように用いて2000~3000万個の細胞を染色した。CD11b シグナル強度(最低15%、最高15%)に基づいて細胞を選別した。細胞をPBSで洗浄し、シークエンシングライブラリー調製まで-80℃で凍結した。単一gRNAプール型スクリーニングのライブラリー調製は、以前の報告のように実施した(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))。コンビナトリアル標的化プール型スクリーニングについては、CaRPool-seq bcgRNAリードアウトと同様のPCR方針を採用した。プール型スクリーニングリードアウトPCR1は不変のままとした。PCR2では、UMI及び細胞バーコードを反映する任意選択の28個の無作為化塩基を含む可溶性Nextera-Read1-CS1 feature捕捉プライマー、ならびにRPIx Read2 i7インデックスプライマーを使用して15bpのバーコード配列を増幅した。PCR3において、Feature SIプライマー2(10×Genomics)及びP7プライマーを使用してアンプリコンを完成させた。
プール型CRISPRスクリーニング分析
bcl2fastqを使用して、PCR2リバースプライマー中に存在するIllumina i7バーコードに基づいてリードをデマルチプレックスし、適用可能な場合は、カスタムpythonスクリプトを使用してリード中のカスタムi5バーコードによってリードをデマルチプレックスした。単一gRNAプール型スクリーニングについては、カスタムpythonスクリプトを使用してガイド配列に対して既知のアンカー配列を検索することによってリード1シークエンシングリードをトリミングして予想gRNA長とした。コンビナトリアルプール型スクリーニングについては、リード2中の最初の15塩基を抽出した。単一gRNAプール型スクリーニングについては、処理済リードの重複除去
(FASTXToolkit)を行って完全な重複をカウントした後、ストリングマッチングによる参照との比較を行って、完全にマッチするユニークなアライメントのみを残した(平均マッピング率82.3%、gRNAカウント数中央値167)。コンビナトリアルプール型スクリーニングについては、パラメーターを-v 1-m 1--best-strataとしてbowtie(Langmead,B.et al.Genome Biol.10,(2009))(v.1.1.2)を使用して前処理リードをバーコード参照にアライメントした(平均マッピング率97%;バーコードリードカウント数中央値635;1つのバーコードはインプット試料中に検出されなかった)。各データセットについて、DESeq2 29のものと同様のメジアン・オブ・レイシオ(median
of ratios)法を使用して生のカウント数を正規化し、SVA Rパッケージにおいて実行されるコンバット(combat)を使用してバッチ補正を行った(Leek,J.T.et al.Bioinformatics 28,882-883(2012))。選別ビンまたは時点と、示される参照試料との間のカウント数比を構築してガイドRNA及びバーコードのエンリッチメントを計算した後、log変換(logFC)に供した。単一gRNAまたはbcgRNAごとに、反復物にまたがる平均logFCを考慮した。単一gRNAプール型スクリーニングについては、標的遺伝子当たり4つの最良性能gRNAを使用して平均logFCを計算し、最良性能の決定は、10個すべてのgRNAにまたがる平均エンリッチメントの符号に応じて最高または最低のいずれかとして実施した。本発明者らが以前に報告したように(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))、logFCエンリッチメントは、一般に、増強DRを使用した試料においてより顕著であることが認められた。反復物と選択gRNAとの間の一貫性は、ロバストランクアグリゲーション(RRA)を使用して推定した(Kolde,R.et al.Bioinformatics 28,573-580(2012))。コンビナトリアルプール型スクリーニングについては、遺伝子ペアにつき両方の反復アレイの平均を計算した。プール型スクリーニング及びCaRPool-seq実験では、GFI1 g2は強い効果を与えないことが認められた。すべての分析において、GFI1 g2を含む技術的反復アレイは除外した。
直接捕捉Perturb-seq
6つのsgRNAプール(KO-1、KO-2、KO-3またはCRISPRi-1、CRISPRi-2、CRISPRi-3)のうちの1つをモノクローナルCRISPR-Casエフェクタータンパク質発現細胞株(Cas9ヌクレアーゼ、KRAB-dCas9、KRABdCas9-MeCP2)に感染させて、単一のベクターにおいて1~3つのsgRNAを供給し、細胞株とプールとの組み合わせを全部で9つ得た。選択後の細胞生存率を1.7~5.5%(MOI<0.1)として、単一の組み込みが生じる可能性が確実に高まるようにした。2つ以上のsgRNAを保有するベクターが導入されているBFP陽性細胞の割合を、フローサイトメトリーを使用してプールごとに測定することによってウイルス力価を確認した。各分割時にはピューロマイシン及びブラストサイジンを連続的に与えながら2~3日ごとに細胞を継代してsgRNAの存在量が多くなるように維持した(>1000×カバレッジ)。10×実験前には細胞の98%超がBFP陽性であることが確認された。形質導入から12日後に10×V3.0を実施した(Chromium Single Cell 3’ Gene Expression v3 with Feature Barcoding technology for CRISPR screening、#1000074、#1000075、#1000079)。CITE-seqプロトコール(Stoeckius,M.et al.Nat.Methods 14,865-868(2017))に従って5つのTotalSeq-A抗体のプール(0.75ug/抗体/2×10個細胞)で細胞を染色した。さらに、細胞ハッシング(Stoeckius,M.et al.Genome Biol.19,1-12(2018))を使用して、9つの細胞株プール組み合わせを追跡した。ラン前
に、細胞生存率を決定した(≧96%)。1つの10×レーンでのランを実行することで、本発明者らのハッシュタグ付け実験設計を活用して、38,600個の細胞をオーバーロードした。10×Genomics細胞ハッシング及びCITE-seqプロトコールに従って、mRNAライブラリー、sgRNA特徴量ライブラリー、ハッシュタグ(ハッシュタグ由来オリゴ(HTO))ライブラリー、タンパク質(抗体由来オリゴ(ADT))ライブラリーを構築した。すべてのライブラリーを1回のNextSeq75サイクル高アウトプットランで一緒にシークエンシングした。
直接捕捉Perturb-seq分析
mRNAライブラリーから得られたシークエンシングリードを、Cellranger(v3.1)を使用してhg38(ensembl v97)ゲノムにマッピングした。同時に、ガイドRNAリードをsgRNA特徴量参照にマッピングした。特徴量マッピングの前に、cutadaptを使用して5’アダプターのトリミングを実施して、特徴量の5’に位置する可変長のポリG区間を考慮し、得られるsgRNAリードの長さが18塩基となるようにトリミングした。HTOライブラリー及びADTライブラリーのカウントマトリックスを作成するために、CITE-seq-countパッケージ(v1.4.2)を使用した(github.com/Hoohm/CITE-seq-Count)。その後、Seurat Rパッケージ(v4.0)(Hao,Y.et al.Cell 184,3573-3587.e29(2021))へのインプットとしてカウントマトリックスを使用して下流の分析を実施した。16842個の細胞が検出された。margin=2として(特徴量全体にわたる正規化の代わりに細胞全体にわたる正規化がなされるように)有心対数比変換手法を使用してHTO及びsgRNAのカウント数を正規化した。実験条件を細胞に割り当てるアイデンティティー付与及び細胞ダブレットの除外を行うために、SeuratのHTODemux機能をデフォルトパラメーターで使用した。
基本的なモデリング手法を変えずにHTODemuxをカスタマイズして、第2及び第3のsgRNAの割り当てのアイデンティティーを復帰させた。HTOプールの割り当てに基づいて、予想sgRNA数の数が正しくない細胞にフラグを立てた。さらに、細胞の形質導入に使用したsgRNAプールに存在しないsgRNAの予想外の組み合わせを含む細胞にもフラグを立てた。
図3A~図3Eに示される分析については、sgRNAの数及びアイデンティティーが正しい細胞のみを残した。ADTカウント数を対数正規化してから、do.scale=FALSE及びvars.to.regress=“PerturbSeq.approach”としてScaleDataを実行した。対数正規化した回帰ADT数に対して、5つすべての特徴量を使用してPCAを実施した後、4次元を使用するUMAP次元削減を実施した。NT細胞、及び3つすべての(s)gRNA(CD46、CD55、CD71)を受容した細胞についてPerturb-seq手法にわたって標的ノックダウンを評価するために、標的としなかったADT特徴量(CD29、CD56)にわたる比の中央値を使用して細胞ごとのスケール係数を導き出して細胞ADTカウント数を正規化し、この正規化ADTカウント数を、Perturb-seqごとにNT細胞の平均ADTカウント数で割った。
Cas13 RNA Perturb-seq(CaRPool-seq)ライブラリーの調製
図1A及び図5に示されるX型のCas13 CRISPRアレイ構成(追加のPCRハンドル)を使用した。具体的には、最後のアレイ位置にbcgRNAを配置し、5’ Illumina低分子RNA PCRハンドルと、15塩基対長のバーコードと、10×Feature Barcoding technologyと適合する3’捕捉配列
1(CS1)と、から構成されるスペーサー配列を当該bcgRNAに含めた。この組成によって、フォワードプライマーとリバースプライマーとの特有の組み合わせを用いてbcgRNAアンプリコンを特異的に増幅することが可能であった。さらに、Illumina 5’PCRハンドルを使用することで、bcgRNAアンプリコンを効率的にシークエンシングすることが可能であり、リード2の最初の塩基が最初のバーコード塩基になる。この構成は多くの利点を有するが、他のPCRプライマー配列または捕捉配列も可能であり得る。
10×Genomics 3’キット(Chromium Single Cell 3’ Gene Expression v3 with Feature Barcoding technology for CRISPR screening、#1000074、#1000075、#1000079)を使用してCaRPool-seq実験を実施した。bcgRNA由来オリゴのライブラリーの構築については、その概要が図5に示され、改変をいくつか施したが、大筋はFeature Barcodingのための10×GenomicsユーザーガイドCG000184 RevCに従って実施した。具体的には、GEM-RTを溶出して33ul中に含め、0.4μMのADT添加プライマー(bcgRNA及びADT用)ならびに0.2μMのHTO添加プライマーを含む2μlを添加し、その後にcDNA増幅に供した。mRNA画分向けに0.6×SPRIクリーンアップを使用してcDNAを精製した。さらに1.4×SPRIを追加(0.6+1.4=2×SPRI)することによって、ADT、HTO、及びbcgRNA cDNAを含む上清を精製した後、追加の2×SPRIクリーンアップに供した。この短い精製断片を3つのプールに均等に分割した(例えば、3×20μl)。以下に記載のようにHTOライブラリー及びADTライブラリーを構築するために、それぞれにつき1つのプールを使用した。残りのプールの半分(10μl)を使用することで、2つのPCRレシピを使用してbcgRNAライブラリーを構築した。PCR1では、bcgRNAアンプリコンにIllumina P5ハンドル及びP7ハンドルを付加する(100μl
PCR1:50μl 2×KAPA Hifi PCRマスターミックス、最大45μl bcgRNA PCRテンプレート、2.5μl Feature SIプライマー2 10μM、2.5μl TruSeq低分子RNA RPIxプライマー(i7インデックスを含む)10μM;95℃ 3分、12×[95℃ 20秒、60℃ 8秒、72℃ 8秒]、72℃ 1分)。PCR2では、P5プライマー及びP7プライマーを用いて増幅を実施する(100μl PCR2:50μl 2×KAPA Hifi PCRマスターミックス、最大45μlの精製PCR1産物、2.5μl P5プライマー 10μM、2.5μl P7プライマー 10μM;95℃ 3分、4×[95℃ 20秒,60℃ 8秒,72℃ 8秒]、72℃ 1分)。最終的なbcgRNAアンプリコンは203bpの長さを有し、標準的なIlluminaシークエンシングプライマーを用いて標準的なIlluminaシークエンシングプラットホームでシークエンシングすることが可能なものである(≧28サイクル リード1、≧15サイクル リード2)(図5及び図6A)。
CaRPool-seq実験
Cas13d-NLSを発現するHEK293FT細胞、NIH/3T3細胞、またはTHP1細胞の形質導入及び処理を上記のように実施した。種混合では、非標的化gRNAと一緒に、種当たり3つのbcgRNAのプールを使用した。HEK293FT CaRPool-CITE-seq実験には、4つのgRNAを巡るさまざまなアレイ構成セットにバーコードを付与した29個のCRISPRアレイを含めた。こうすることによって、CRISPRアレイ内のgRNA位置、細胞当たりの相対的なgRNA量の効果、及び複数のRNA転写産物のコンビナトリアル標的化を評価することが可能になった。CaRPool-seq種混合及びCaRPool-CITE-seqは、10×Genomics 3’v3キットの1つのレーンで同時に実施した。CaRPool-seqは、
10×Genomics 3’v3キットの4つのレーンを使用して、Cas13dの誘導(1μg/mLのドキシサイクリン)から5日後のTHP1細胞に対して実施した。THP1 CaRPool-seqライブラリーの設計及びクローニングは上記のように実施した。ランの実行前には、実験ごとに細胞生存率が95%であることを確認した。
HEK293FT CaRPool-seq実験では、CITE-seqプロトコール(Stoeckius,M.et al.Nat.Methods 14,865-868(2017))に従って5つのTotalSeq-A抗体のプール(0.75ug/抗体/2×10個細胞)で染色を実施した。同様に、FcXブロッキング緩衝液(BioLegend#422302;室温で10分)でTHP1細胞を最初に処理した後、22個のTotalSeq-A抗体のプールで細胞を染色した。実験アイデンティティーの追跡及びマルチプレットの同定を実施するために、細胞ハッシングプロトコール(Stoeckius,M.et al.Genome Biol.19,1-12(2018))に従って(CITE-seq抗体での染色後に)試料にハッシュタグを付加した。10×Genomics細胞ハッシングプロトコール及びCITE-seqプロトコールに従ってmRNAライブラリー、ハッシュタグ(ハッシュタグ由来オリゴ(HTO))ライブラリー、タンパク質(抗体由来オリゴ(ADT))ライブラリーを構築した。
種混合実験ライブラリー及びHEK293FT CaRPool-seq実験ライブラリーは、1回のNextSeq75サイクル高アウトプットランで一緒にシークエンシングした。THP1 CaRPool-seqライブラリーは、XP S4 2×100 v1.5ワークフローを使用してNovaSeq6000でシークエンシングした。mRNAライブラリーから得られたシークエンシングリードを、Cellrangerソフトウェア(v3.0.1)を使用してhg38(アンサンブルv97)とmm10との統合ゲノム参照にマッピングするか、またはTHP1実験についてはCellranger v6.0.0を使用してhg38にマッピングした。同時に、Cellrangerを使用してバーコードガイドRNAライブラリーリードをバーコード参照にマッピングした。HTOライブラリー及びADTライブラリーのカウントマトリックスを作成するために、CITE-seq-countパッケージ(v1.4.2)を使用した(github.com/Hoohm/CITE-seq-Count)。その後、すべての下流の解析を実施する上で、カウントマトリックスをSeurat Rパッケージ(v4.0)33へのインプットとして使用した。
CaRPool-seqデータ解析
種混合実験及びHEK293FT CaRPool-seq実験から得られた細胞を一緒に処理した。UMI数が2,500未満の細胞は除外した。margin=2として(特徴量全体にわたる正規化の代わりに細胞全体にわたる正規化がなされるように)有心対数比変換手法を使用してHTO及びsgRNAのカウント数を正規化した。細胞ダブレットの同定及び細胞への実験条件の割り当てにはHTODemux機能を使用した。ヒト細胞にのみハッシュタグを付加し、マウスNIH/3T3細胞を、ハッシュタグを有さない唯一の細胞集団とした。CaRpool-CITE-seq実験(HTO-01~HTO-08)に含まれるすべてのハッシュタグダブレットを除外し、種混合実験のヒト細胞(HTO-10)に対してもこの除外を行った。さらに、単一のHTO-01~HTO-08で標識された細胞については、マウスリードの割合が10%超である場合はそうした細胞をすべて除外し、少なくとも10%のマウスリードが存在しないとしても、いずれのHTOも有さない細胞も除外した。このようにして、CaRPool-seq種混合実験~CaRPool-CITE-seq実験のダブレットはすべて除外した一方で、CaRPool-seq種混合ブランチの一部としてのマウス細胞とヒト細胞との間の潜在的なコリジョン/ダブレットは残した。この点において、実験を2つの別々の目的に分けた。CaRPool-seq種混合実験については、RNA及び種特異的bcgRNAについて
ヒトリードの割合を定量化することによって種アイデンティティーを決定した(ヒト:>0.9、マウス:<0.1、コリジョン:0.9~0.1)。HEK293FT CaRPool-CITE-seq実験については、マウスの特徴量及びRNAカウント数をすべて除去した後に、標準的なSeuratワークフローを使用してRNAカウント数を対数正規化した。MultiSeqDemux(autoThresh=T)を使用してバーコードガイドRNAアイデンティティーを決定した。割り当てられたbcgRNAを含まない細胞、及び複数のbcgRNAが割り当てられた細胞は除外した。
THP1実験については、上記のようにHTOdemuxを使用してHTOでのデマルチプレックスを実施した後、52,496個の単一細胞を検出した(nFeature_RNA>1000、nFeature_RNA<8000、percent.mt<20)。モデルベースのbcgRNA割り当て(HTODemuxまたはMultiSeqDemux)では、観察される表現型変化によって裏付けられる満足のいく結果が得られず、この理由は、bcgRNA特徴量の数が多いことによって強いられるモデル制限に起因するものであり得る。代わりに、下記のルールを適用することによってbcgRNAを単一細胞に割り当てた。
UMIカウント数が最も多いbcgRNA(g1)のUMIカウント数と、存在する場合は、2番目の検出bcgRNA(g2)のUMIカウント数と、を比較した。g2のbcgRNAカウント数は、ライブラリー調製から生じた偽のカウント数に由来するか、または複数のウイルスエレメントの組み込み(bcgRNAマルチプレット)に由来するものであり得る。g1<5である細胞は陰性と見なした。1)g1={5~9}であり、かつg2={0-1}である場合、または2)g1>9であり、かつg1/(g1+g2)>0.8であり、かつg2<11である場合は、g1を割り当てた。他の細胞はすべて、bcgRNAマルチプレットと見なした。単一のbcgRNAを含む31,308個を割り当てた。CaRPoolseqライブラリーに含めた技術的反復の遺伝子発現差異の結果の比較から、GFI1 g2はCD11b ADTの上方制御を引き起こさず、予想される遺伝子発現シグネチャーの上方制御を引き起こさないことが認められた。GFI1 g2を伴う細胞(n=601)はすべて除外した。遺伝子ペアまたは個々のCRISPRアレイについての細胞表面タンパク質ADTレベルの変化は、FindMarkersのウィルコクソンの順位和検定を使用して、NT対照細胞と対比で計算した。変化は、細胞群当たり無作為に選択した30個以下の細胞を用いて発現差異分析を10回繰り返して細胞数の差異を考慮することによって決定した。
直接捕捉Perturb-seq実験におけるsgRNA検出の推定
Feature Barcoding technologyを介してsgRNAを直接的に捕捉する一重sgRNA標的化及び二重sgRNA標的化のsgRNA割り当て率については、公開されているものを使用した(Replogle,J.M.et al.Nat.Biotechnol.38,954-961(2020))。正確に1つのsgRNAの割り当て率(一重ガイド実験での80%)を平均化すると共に、細胞当たり正確に2つのsgRNAの割り当て率(二重ガイド実験での67%)の平方根をとることによって、平均sgRNA割り当て率を80.9%と決定した。本発明者らのシミュレーションでは、低いMOIでの感染の間には細胞によって単一のウイルス粒子が取り込まれることになると想定される。以前に報告された2つのsgRNA実験と同様に、独立して発現する最大で3つのsgRNAが単一の組み込み事象によって送達され得る(Replogle,J.M.et al.Nat.Biotechnol.38,954-961(2020))。各sgRNAのsgRNA検出は独立事象であると想定される。これらは、検出及び編集の確率pにsgRNA特徴量の数nをかけること(pn)によってモデル化することができる。得られる曲線は、正確にn個のsgRNAを受容した細胞の割合を示す(図3B)。
単一細胞データにおける遺伝的相互作用(GI)のモデリング
二重摂動のトランスクリプトームプロファイルを紐解くために、以前に導入された線形回帰モデル(Norman,T.M.et al.Science.365,786-793(2019))を使用し、この線形回帰モデルをRにおいて実行した。最初に、すべての細胞について、対照群(非標的化細胞)の平均値及び標準偏差に対して対数正規化遺伝子発現カウント数をz標準化した。このようにして、各細胞由来のベースライン発現プロファイルを差し引いており、NT条件に対する各摂動由来の偏差の直接的な比較を実施することができる。次に、遺伝子ペアによって細胞を群化し、特徴量ごとに細胞全体の平均値を計算することによって疑似バルクz標準化プロファイル[一重摂動(a,b)及び二重摂動(ab)]を計算した。平均NT細胞プロファイルを、すべてがゼロのベクトルに戻した。平均UMIカウント数が0.5超の1,530個の遺伝子の平均プロファイルを生成させた。すべての細胞群が少なくとも25個の細胞によって代表された場合に遺伝子ペアを含めた。
以前に導入されたように(Norman,T.M.et al.Science.365,786-793(2019)、
δab=c1δa+c2δb+ε
を使用して平均z標準化プロファイルをモデリングした。
δaは、一重摂動aに割り当てられた細胞の疑似バルクz標準化プロファイルであり、δbは、一重摂動bに割り当てられた細胞の疑似バルクz標準化プロファイルであり、δabは、二重摂動abに割り当てられた細胞の疑似バルクz標準化プロファイルである。c及びcは、データにフィッティングされた定数であり、aδプロファイル及びδbプロファイルの相対的な重みを示す。ベクトルεは、モデルフィットに対する残差を集めたものである。本発明者らのプロットでは、aは遺伝子ペア中の第1の遺伝子であり、bは第2の遺伝子である。cはaに対応し、cはbに対応する。
MASSパッケージ由来のrlm機能を使用して、以前に導入されたモデルフィッティング手順(Norman,T.M.et al.Science.365,786-793(2019))を実行し、平均係数(c及びc)ならびに残差εを抽出した。6つの尺度を集めて、以前の報告のようにフィッティングを評価した(Norman,T.M.et al.Science.365,786-793(2019))(エネルギーパッケージ由来のdcor機能):
モデルフィッティング:dcor(ca+ca,ab)
ドミナンス:|log10(c/c)|
マグニチュード:(c2+c2)1/2
一重プロファイルと二重プロファイルとの類似性:dcor([a,b],ab)
一重プロファイルの類似性:dcor(a,b)
寄与の均等度:min(dcor(a,ab),dcor(b,ab))/max(dcor(a,ab),dcor(b,ab))
各特徴量及びその解釈については、この文献(Norman,T.M.et al.Science.365,786-793(2019))中に詳述されている。特徴量を標準化(margin=2)してから階層的クラスタリング(dist=euclidean、methods=ward)を行ってデンドログラムを作成した。
実施例2:Cas13 RNA Perturb-seqを用いる単一細胞でのRNA転写産物の効率的なコンビナトリアル標的化
VI型CRISPR Casタンパク質(VI-DファミリーメンバーRfxCas13dなど)は、標的RNAをノックダウンすることができるプログラム可能なRNA依存
性RNA標的化ヌクレアーゼである。注目すべきことに、RfxCas13dは、CRISPRアレイをプロセシングして複数の成熟CRISPR RNA(crRNA)にする能力も有しており(Konermann,S.et al.Cell 173,665-676(2018))、RNAレベルでコンビナトリアル摂動を生じさせる上で魅力的な選択肢となっている。最近、本発明者らは、RfxCas13dが著しい標的RNAノックダウンを誘発し得ることを確認し、異なる転写産物を包括的にカバーする数千のgRNAから、最適に標的化を行う上での一連の規則を見出した(Wessels,H.H.et al.Nat.Biotechnol.38,722-727(2020))。したがって、プール型CRISPR-Cas13スクリーニングを単一細胞リードアウトと組み合わせて、コンビナトリアルかつマルチモーダルなプール型遺伝子スクリーニングを実施することを探求した。
Cas13 RNA Perturb-Seq(CaRPool-seq)を行うための本発明者らの方法は、個別または多重のgRNA摂動を各細胞に送達し、単一細胞シークエンシング実験の間にそのアイデンティティーを検出する上での分子戦略を最適化することによって可能になっている。VI A型、VI C型、及びVI D型のCas13
crRNAは、短い5’ダイレクトリピート(DR)及び3’末端の可変スペーサー(ガイドRNA(gRNA)とも呼ばれる)からなり、それ故に、逆転写のための共通プライミング部位を有さない。本発明者らは、23ntの標的スペーサーの3’末端に10×Genomics適合性の「捕捉」配列を付加することによってgRNAを直接的に検出するための手法を開発した(図1A)。本発明者らは「間接」捕捉方針(CRISPRアレイのうちの専用のcrRNAがアレイ特異的バーコード(バーコードgRNA(bcgRNA))を含む)も探求し、bcgRNA及びgRNAの異なる位置構成を試験した(図1A)。細胞表面タンパク質を標的とし、フローサイトメトリーを介してノックダウンを測定すると共に(図1B及び図4A~図4G)、RT-PCRを介してcrRNA検出を定量化すること(図1C)によって各方法の能力を評価した。すべての方法において強固なノックダウンの誘導に成功したが(図1B)、最適化構成を有する間接的ガイド捕捉において、最も強いcrRNA転写産物検出能力が得られることを見出した(構成X;図1C)。
こうした結果は、共通RTハンドルをgRNAに直接的に付加するか、またはCRISPRアレイの一部としての個別bcgRNAとして共通RTハンドルを付加することによってRfxCas13d crRNAを改変することで、逆転写及び増幅を可能にし得ることを実証するものである。注目すべきことに、本発明者らの間接検出方針は、こうした摂動の集約的アイデンティティーをコードする検出可能なbcgRNAと共に複数のgRNAを単一細胞に送達する上で非常に適するものである。さらに、本発明者らの改変crRNAにおいて逆転写ハンドルとIllumina PCRプライミング配列との特有のセットを利用することで(図5)、こうした摂動をscRNA-seqと並行して確実に検出できるだけなく、追加の分子モダリティでのプロファイリング(例えば、トランスクリプトーム及び表面タンパク質のプロファイリングを同時に行うためのCITE-seq)を行う際にも確実に検出できる。最終的に、本発明者らは、安定構造を形成するRNAエレメント(「evopreQ1シュードノット」)をbcgRNAの3’末端に導入することで、bcgRNAの定量的回収がさらに6倍に改善することをさらに見出しており、この改善は、bcgRNAの核酸分解への対抗に起因し得るものである(実施例3を参照のこと)。
原理の証明として、単一細胞種混合実験においてbcgRNAの検出及び割り当てを行う能力についてCaRPool-seqを最初に試験した。非標的化(NT)gRNA及び種特異的bcgRNAを含む3つのCRISPRアレイのウイルスプールを、RfxCas13dを発現するヒトHEK293FT細胞及びマウスNIH/3T3細胞に個別に
形質導入した。10×Genomics Chromium系(v3)を用いてヒト細胞とマウス細胞との混合物をプロファイルして、両方の細胞トランスクリプトーム及びbcgRNAを検出することを目指した。2387個の細胞のうち、78.5%が単一のbcgRNAを発現することが明らかになった(1つ超のbcgRNAを発現した細胞は1.1%、bcgRNAが検出されなかった細胞は20.4%)。さらに、シングレット細胞においてはRNAとbcgRNA標識との間の一致率が極めて高いこと(99.2%)も認められた(図1D及び図1E)。こうした数値は、単一細胞リードアウトへと効率的かつ正確にデマルチプレックスできるプール型摂動スクリーニングがCaRPool-seqによって可能になることを実証するものである。
次に、単一細胞分解能で複数の分子モダリティでのコンビナトリアル摂動を区別する能力についてCaRPool-seqを試験した。3つの細胞表面タンパク質(CD46、CD55、及びCD71)を標的とするgRNA、ならびにNT gRNAを設計した。最大で3つのgRNA及びbcgRNAをそれぞれが含む29個のcrRNAアレイを創出して、これらの遺伝子が個別にまたは組み合わせで摂動を受けるようにした。すべてのcrRNAのウイルスプールをHEK293FT細胞に形質導入し、CITE-seqリードアウトと共にCaRPool-seqを実施することで(図2A及び図6A)、CD46、CD55、及びCD71の表面タンパク質レベルと関連付けて細胞トランスクリプトーム及び抗体由来タグ(ADT)の両方に対する各摂動を評価することが可能であった。
9,355個の単一細胞プロファイルを取得し、検出されたbcgRNAに基づいてそれらの単一細胞プロファイルを群へとデマルチプレックスした(図6B;74.7%が単一のbcgRNAを発現し、80.8%が少なくとも1つのbcgRNAを発現した)。摂動後に観察された各標的遺伝子のタンパク質レベルの平均低下率は平均で76.5%(+/-5.7%)であり、Cas13が強固な分子摂動を与える明確な証拠が得られた(図2B~図2D)。さらに、一重gRNA摂動と比較して多重gRNA crRNAアレイのノックダウンの強度は同様であった(図2B及び図7C)。26個すべての標的化gRNA群のトランスクリプトーム疑似バルクプロファイルを調べると、各標的転写産物のmRNA発現は、3つの遺伝子の転写産物に同時に摂動を与えた場合でさえ減少することが認められた(図6C及び図6D中の15個の例)。トランスクリプトームノックダウンの平均強度(平均15%、sd5.2%)は、観察されたタンパク質減少と比較して一貫して低下していた。このことは、Cas13によって示されたノックダウンの様式と一致する。標的RNAは連続的に産生されており、標的がタンパク質へと翻訳され得る前には分解される。さらに、Cas9ヌクレアーゼによる標的化の結果、ナンセンス変異依存分解によって分解されるRNAが生じる頻度(Tuladhar,R.et al.Nat.Commun.10,1-10(2019))と同様の頻度で、scRNA-seqによって検出可能であるが、機能性タンパク質への翻訳は不可能なRNA分子がCas13切断によって生じる可能性があり、このことは、測定されるRNAノックダウンのレベルが、Cas13摂動の表現型効果を過小評価するものであることを示唆している。重要なことに、本発明者らは、Cas13d介在性の遺伝子ノックダウンが高度に特異的であることを明らかにし、3つの標的遺伝子摂動のいずれにおいてもオフターゲット効果の証拠は存在しなかった(図6E及び図6F)。
次に、3つの異なるCas9エフェクター(Cas9ヌクレアーゼ、第一世代CRISPR阻害(CRISPRi)系(KRABdCas9(Gilbert,L.A.et al.Cell 154,442(2013)、Morris,J.A.et al.bioRxiv 2021.04.07.438882(2021)))、及び第2世代二重エフェクターCRISPRi系(KRAB-dCas9-MeCP2(Morris,J.A.et al.bioRxiv 2021.04.07.438882(2021
)、Yeo,N.C.et al.Nat.Methods 15,611-616(2018)))を使用して直接捕捉Perturb-Seq(Replogle,J.M.et al.Nat.Biotechnol.38,954-961(2020))に対してCaRPool-seqの能力をベンチマーク評価した。CaRPool-seqでは、gRNAアイデンティティーの組み合わせを1つのbcgRNAがコードする一方で、直接捕捉Perturb-Seqでは、摂動当たり1つのsgRNA特徴量を独立して検出する必要がある(図3A)。以前に報告した本発明者らの実験系を再現して、同じ3つの細胞表面マーカー(CD46、CD55、及びCD71)を単独または組み合わせで標的とした。確立されたCRISPR-KO(Doench,J.G.et al.Nat.Biotechnol.34,184-191(2016))及びCRISPRi(Sanson,K.R.et al.Nat.Commun.9,1-15(2018))に由来する3つのsgRNAを標的ごとに評価した。sgRNAライブラリー(図8A)及び選択したPerturb-Seq用の最良sgRNA(図8B)。さらに、一重摂動、二重摂動、または三重摂動をコードするベクターの標的になる細胞を標識するために細胞ハッシング(Stoeckius,M.et al.Genome Biol.19,1-12(2018))を利用した。CaRPool-seqで行ったように、各細胞におけるgRNA、RNA、及びADTのレベルを定量化した。
本発明者らのベンチマーク分析から、CaRPool-seqとは対照的に、Cas9ベースの代替手法ではコンビナトリアル摂動の効率的な同定及び検出に苦慮することが明らかになった(図3B)。例えば、KRAB-dCas9-MeCP2実験では、3つの遺伝子を標的とするベクターを受容した細胞が1,570個回収された。こうした細胞のうちで、シークエンシング後に正しい3つのsgRNAと紐づいたものはわずか779個(49.6%)であった。残りの細胞では、摂動数が少なすぎるもの(gRNA数が0、1、もしくは2であったもの、31.2%)、多すぎるもの(gRNA数が4以上であるもの、10.0%)、または3つのgRNAの組み合わせが不適切なもの(9.2%)が検出された。こうした観察された下落は、複数のgRNAを独立して検出した場合の理論的予測回収率と完全に一致しており、現存する手法を用いて複数の摂動を効率的にプロファイリングすることが困難であることを強調するものである。CaRPool-seqはコンビナトリアル摂動を単一のbcgRNAと紐づけるものであるため、一重摂動と多重摂動との間で検出効率は不変である。
次に、摂動の強度を方法間で比較した。bcgRNA(CaRPool-seq)に基づくか、またはgRNAの独立検出(Perturb-Seq)に基づいて3つの摂動の検出に成功した細胞に最初に注目した。こうした細胞に注目した場合、すべての方法が、3つすべての表面タンパク質を同様かつ強力に枯渇させることに成功していた(Cas13d:74.5%、Cas9;75.5%、KRAB-dCas9;75.2%、KRABdCas9-MeCP2;77.3%)(図3C)。次に、すべての細胞をそのADTレベルに基づいて分析した。CaRPool-seq細胞及びPerturb-Seq細胞は一緒にクラスターされ(図3D)、gRNAアイデンティティーによっても群化され(図3E及び図8C)、このことによって、すべての方法の間で表現型タンパク質摂動の強度が同様であることが再び実証された。本発明者らは、CaRPool-seq及びPerturb-Seqは両方共、コンビナトリアル摂動を効率的に単一細胞に導入し得ると結論付けている。一方で、CaRPool-seqは、これらの摂動を成功裏に同定及び検出する能力において明確な利点を有しており、それ故に、コンビナトリアル単一細胞CRISPRスクリーニングを実施する上で魅力的な手法となる。
遺伝的相互作用を特徴付けるCaRPool-seqのスループット及び潜在力を実証するために、158個のコンビナトリアル遺伝子ペアのマルチプレックス化スクリーニングを実施した。以前に同定された白血病分化調節因子の間の潜在的な相互作用(化学療法
及び小分子薬物に対する応答に影響を与え得る)を特徴付けることを目指した(Wessels,H-H et al.Efficient combinatorial targeting of RNA transcripts in single cells with Cas13 RNA Perturb-seq,bioRxiv 2022.02.02.478894を参照のこと。当該文献は、参照によって本明細書に組み込まれる)。ドキシサイクリン誘導性Cas13dカセットを安定的に組み込んだヒトMLL-AF9 NRASG12D AML細胞株(THP-1細胞)をモデル系として生成させた。遺伝子当たり10個のgRNAを含む439個の遺伝子の標的化ライブラリーを使用してバルクCas13d CRISPRスクリーニングを実施した。Cas13dの誘導から13~16日目に、CD14及びCD11b(単球分化の免疫表現型マーカー)の表面発現に基づいて細胞をビンに選別した。低発現ビンと高発現ビンとの間でgRNA相当量を比較することによって、分化に影響を与える26個の遺伝子(及び、各遺伝子につき、2つの最良性能の非重複gRNA)を選択した。フローサイトメトリーリードアウトと共に個別の摂動を与えることで、これらの遺伝子のそれぞれがCD11b発現を調節するかを検証した。これらの遺伝子の大半は、DNA結合及びクロマチンリモデリング機能と関連するものであり、以前に同定されたAML分化調節因子のサブセットを含むものである。
次に、これらの調節因子に対するコンビナトリアル摂動の効果についてCaRPool-seqを試験した。385個のcrRNAアレイのプール型ライブラリーを細胞に感染させた。このライブラリーは、28個の一重摂動(26個の調節因子及び2つの陰性対照遺伝子)ならびに158個の摂動ペアをコードするものである。独立したgRNAを使用する各摂動向けの技術的反復、及びNT対照も含めた。31,308個のデマルチプレックス単一細胞についてトランスクリプトーム、細胞表面タンパク質レベル、及びgRNA発現のプロファイリングを実施した。
最初に、各摂動について表面タンパク質発現のレベルをNT対照と比較した。予想通り、各一重遺伝子摂動はCD11b発現に影響を与えることが明らかになり、観察されたlog変化倍率はバルクCRISPRスクリーニングのgRNAエンリッチメントのレベルと強く一致した(R=0.86)。すべての摂動について観察されたlog変化倍率もまた、技術的反復摂動にわたって再現性(R=0.82)を有していた。次に、158個の二重遺伝子摂動で観察された効果を2つの一重摂動から得られた効果と比較した。強力な相関が観察され、個別のノックダウンの平均と比較して典型的には二重摂動の方が強いが、二重摂動は積よりは弱いものであることが明らかになった。相乗効果及び減弱効果も共に観察された。例えば、ヒストン脱メチル化酵素KDM1A及びヒストンデアセチラーゼHDAC3の個別ノックダウンは、CD11bを、それぞれ強く(logFC2.41)及び弱く(logFC0.53)上方制御するが、二重摂動は相乗効果(logFC2.85)を引き起こす。対照的に、EP300の個別ノックダウンもまた、CD11bを上方制御(logFC1.57)するが、KDM1Aとの二重摂動(logFC2.05)は個別のKDM1Aノックダウンと比較して弱かった。こうした知見を、本発明者らのCas13d CD11bプール型スクリーニングから得られたデータを使用して検証した。
次に、本発明者らのCaRPool-seqデータセットにおいて一重摂動及び二重摂動の両方の転写プロファイルを探索した。予想通り、一重摂動を与えた細胞において上方制御された遺伝子モジュールは、典型的には、骨髄系細胞の分化及び機能と関連する遺伝的プログラムと関連していた。回帰モデルのフィッティングを行う最近の先駆的フレームワーク(Norman,T.M.et al.Science.365,786-793(2019))を適用して、二重摂動を与えた細胞において観察された摂動応答を一重遺伝子摂動応答の線形結合として紐解いた。エピスタシス、遺伝的抑制、及び相乗関係を含
めて、このモデルのフィッティング及び係数は、複数の型の遺伝的相互作用を説明するものである。こうしたモデルを本発明者らの摂動ペアのそれぞれにフィッティングさせることで、多様な遺伝的相互作用が明らかになり、こうした遺伝的相互作用を4つの群に広くクラスター化した。クラスター1に含まれる33個の遺伝子ペアについては、それぞれの個々の遺伝子のプロファイルが二重摂動応答に均等に寄与することが明らかになり、線形モデルは強いフィッティングを示した。陽性対照として、このクラスターに含まれるペアの多くが、同じ複合体に含まれる2つのタンパク質(すなわち、MED14/MED24;SUPT16H/SUPT6H)の摂動に相当するものであった。このクラスターは、同様の摂動シグネチャーを共有する別々の複合体に存在するタンパク質のペア(メディエーター複合体及びSWI/SNF複合体のMED24/SMARCD1)にも相当した。KDM1A及び転写リプレッサーGSE1の二重摂動もこのクラスターに分類され、このことは、抑制されるプロモーターへの共局在化によって骨髄分化を抑制する協同的相互作用を示唆する以前の研究と一致した。
クラスター4では、一方の遺伝子の効果がもう一方よりも優位であると思われる遺伝的相互作用が同定された。一般に、KDM1Aノックダウンを異なるクロマチン調節因子とペアにした場合に転写応答が大きく異なることが認められた。例えば、両方の遺伝子にコンビナトリアル摂動を与えた場合、KDM1Aシグネチャーよりも強力にEP300シグネチャーが現れることから明らかになった。二重摂動を与えた細胞では、個別のKDM1A摂動と比較して、前駆遺伝子(すなわち、前駆マーカーAZU1)の発現が高まり、分化マーカー遺伝子(骨髄マーカーS100A4)の発現が低下した。対照的に、ポリコーム抑制性複合体メンバーRING1の摂動とペアにした場合はKDM1A応答シグネチャーが優位になった。HDAC3との二重摂動では、KDM1A転写応答シグネチャーが増強され、このことは、こうした細胞の免疫表現型の結果についての以前の本発明者らの報告と一致した。こうした発見は、KDM1AアンタゴニストとHDAC阻害剤との併用療法が応答を増強するという最近の知見についての分子的な説明の裏付け及び付与にもなる。相互作用応答にわたる不均一性はKDM1Aに特有のものであったわけはなく、本発明者らの研究における多くの遺伝的調節因子にも当てはまり、規模を拡大して複雑な遺伝的相互作用を強固に特徴付ける能力をCaRPool-seqが有することを強調するものである。
まとめると、本発明者はCaRPool-seqを開発し、CaRPool-seqは、単一細胞シークエンシングベースのリードアウトと共にCRISPR Cas13 RNA標的化スクリーニングを実施するための柔軟な方法である。本発明者らは、単一のCRISPRアレイ(後に切断されて個別のcrRNAとなる)の一部として複数のgRNAを送達するように最適化された方針を導入した。本発明者らは、この方針がコンビナトリアル摂動の実施によく適合することを実証しており、こうした摂動のアイデンティティーは、scRNA-seq及びCITE-seqを含む複数の分子モダリティと共に確実に検出され得る単一のバーコードにコードされる。
複数の摂動を単一細胞に割り当てる場合、Cas9ベースの技術と比較してCaRPool-seqが効率的かつ正確であることを本発明者らはベンチマーク評価を介して示している。個別の摂動を用いた場合でさえ、使用者は、依然としてCaRPool-seqから恩恵を受けることになる。具体的には、Cas13dは、RNA標的化酵素として、特定のRNAアイソフォーム、または環状RNA分子、エンハンサーRNA分子、もしくはアンチセンスRNA分子でさえ標的とすることに比類なく適用することができる。RNA指向化手法は、局所遺伝子クラスターの単一メンバーを標的とする場合にも最適であり得、こうした局所遺伝子クラスターでは、代替のKRAB介在性抑制方針は「拡散」を招き、オフターゲット効果を導入し得る。CaRPool-seqは、追加の細胞モダリティ(細胞表面タンパク質レベルなど)をプロファイリングできるものであり、将来的には
、追加の分子モダリティ(細胞内タンパク質レベル及びクロマチン到達性を含む)への拡張も可能なものである。
コンビナトリアルスクリーニングは、遺伝的制御ネットワークの構造に実質的な新たな光を当てる潜在力を有するだけでなく、望ましい細胞表現型を達成するコンビナトリアル摂動を同定する潜在力も有する。AML分化調節因子の本発明者らのCaRPool-seq分析では、最近開発された計算フレームワークから恩恵を受けて、マルチプレックス化摂動スクリーニングから遺伝的相互作用が同定された。こうした型のデータは、複雑な経路及び細胞回路の系統的再構築に有用なリソースとなる。さらに、AML分化表現型を増強するコンビナトリアル摂動を本発明者らが同定したことは、効率的な多剤併用療法が以前に同定されたことと一致しており、このことは、薬物併用治療の候補を選ぶ上で将来の実験が役立ち得ることを示唆している。CaRPoolseqは、マルチプレックス化単一細胞摂動のための方法の増え続けるツールボックスに対する強力な追加要素となる。
実施例3:bcgRNAの3’末端への安定な構造化RNAエレメントの付加
外部から投与したcrRNAがCas13dの存在下では急速な細胞RNA分解機構から保護されることが最近示されており(Mendez-Mancilla,A.et al.Cell Chem.Biol.1-7(2021)doi:10.1016/j.chembiol.2021.07.011)、この理由は、crRNAがCas13d
RNP複合体中に包埋されているときには、RNAseによる分解をcrRNAが受けなくなることにあり得る。本発明者らは、標準的な標的化gRNAよりもbcgRNAが長いことに気が付いた。結果的に、逆転写ハンドルはCas13d RNP複合体の外側に突出する可能性があり(Zhang,C.et al.Cell.175,212-223(2018))、それ故に、内在性RNAヌクレアーゼによる3’核酸分解を受ける可能性がある。したがって、bcgRNAの3’末端に安定な構造化RNAエレメントを付加することで、核酸分解に対抗し、bcgRNAの検出感度が改善され得るという仮説を立てた(図9A)。
細胞表面タンパク質(CD46、CD55、及びCD71)を標的としてCITE-seqリードアウトと共にCaRPool-seqを実施し、bcgRNA検出を評価することで、逆転写ハンドルの3’に配置した場合の6つの構造化RNAの効果を比較した(図9B)。タンパク質ADT発現レベルに関する単一細胞類似性を評価し、標的遺伝子による細胞のクラスター化が再現されることが明らかになった(図9C)。用いた安定化RNAエレメントに由来するアイデンティティーが細胞のクラスター化に影響を与えることはなかった(図9D)。実際、安定化RNAエレメントの間で標的ノックダウンは同様であることが明らかになった(図9E)。MALAT1三重構造を使用した場合にのみ、標的のわずかな減少を引き起こし、この減少は、必要なヌクレオチド置換の結果としてフォールディングが不適切になったことに起因し得る。2つの構造(ジカウイルス由来xrRNA1ダンベル;evopreQ1シュードノット)はbcgRNA検出量を強固に増加させた(図9F)。evopreQ1シュードノットエレメントは以前に使用されており、これによってプライム編集効率が約2倍に改善されている(Nelson,J.W.et al.Nat.Biotechnol.(2021)doi:10.1038/s41587-021-01039-7)。CaRPool-seqについては、evopreQ1エレメントは、本発明者らの最初の設計と比較してbcgRNA検出感度を6倍に高めた(図9G)。この感度上昇は、シグナル対ノイズ比を系統的に改善して、偽の二次的なbcgRNA UMIカウント数から真のbcgRNA UMIカウント数を区別するものでもある(図9H)。
参考文献
1.Dixit,A.et al.Perturb-Seq:Dissecting M
olecular Circuits with Scalable Single-Cell RNA Profiling of Pooled Genetic Screens.Cell 167,1853-1866(2016).
2.Datlinger,P.et al.Pooled CRISPR screening with single-cell transcriptome readout.Nat.Methods.14,297-301(2017).
3.Jaitin,D.A.et al.Dissecting Immune Circuits by Linking CRISPR-Pooled Screens with Single-Cell RNA-Seq.Cell 167,1883-1896(2016).
4.Mimitou,E.P.et al.Multiplexed detection of proteins,transcriptomes,clonotypes and CRISPR perturbations in single cells.Nat.Methods 16,409-412(2019).
5.Adamson,B.et al.A Multiplexed Single-Cell CRISPR Screening Platform Enables Systematic Dissection of the Unfolded Protein Response.Cell 167,1867-1882(2016).
6.Replogle,J.M.et al.Combinatorial single-cell CRISPR screens by direct guide RNA capture and targeted sequencing.Nat.Biotechnol.38,954-961(2020).
7.Norman,T.M.et al.Exploring genetic interaction manifolds constructed from rich
single-cell phenotypes.Science(80-.).365,786-793(2019).
8.Michlits,G.et al.Multilayered VBC score predicts sgRNAs that efficiently generate loss-of-function alleles.Nature Methods 17,(2020).
9.Papalexi,E.et al.Characterizing the molecular regulation of inhibitory immune checkpoints with multi-modal single-cell
screens.bioRxiv(2020).
10.Konermann,S.et al.Transcriptome Engineering with RNA-Targeting Type VI-D CRISPR Effectors.Cell 173,665-676(2018).
11.Wessels,H.H.et al.Massively parallel Cas13 screens reveal principles for guide RNA design.Nat.Biotechnol.38,722-727(2020).
12.Stoeckius,M.et al.Simultaneous epitope and transcriptome measurement in single cells.Nat.Methods 14,865-868(2017).
13.Anzalone,A.V.,Lin,A.J.,Zairis,S.,Rabadan,R.& Cornish,V.W.Reprogramming eukaryotic translation with ligand-responsive synthetic RNA switches.Nat.Methods 13,453-458(2016).
14.Nelson,J.W.et al.Engineered pegRNAs i
mprove prime editing efficiency.Nat.Biotechnol.(2021).doi:10.1038/s41587-021-01039-7
15.Tuladhar,R.et al.CRISPR-Cas9-based mutagenesis frequently provokes on-target mRNA misregulation.Nat.Commun.10,1-10(2019).
16.Gilbert,L.A.et al.CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes.Cell 154,442(2013).
17.Morris,J.A.et al.Discovery of target genes and pathways of blood trait loci using pooled CRISPR screens and single cell RNA sequencing.bioRxiv 2021.04.07.438882(2021).
18.Yeo,N.C.et al.An enhanced CRISPR repressor for targeted mammalian gene regulation.Nat.Methods 15,611-616(2018).
19.Doench,J.G.et al.Optimized sgRNA design to maximize activity and minimize off-target effects of CRISPR-Cas9.Nat.Biotechnol.34,184-191(2016).
20.Sanson,K.R.et al.Optimized libraries for CRISPR-Cas9 genetic screens with multiple modalities.Nat.Commun.9,1-15(2018).
21.Stoeckius,M.et al.Cell Hashing with barcoded antibodies enables multiplexing and doublet detection for single cell genomics.Genome Biol.19,1-12(2018).
22.Wang,E.et al.Surface antigen-guided CRISPR screens identify regulators of myeloid leukemia differentiation.Cell Stem Cell 28,718-731(2021).
23.Nicosia,L.et al.Pharmacological inhibition of LSD1 triggers myeloid differentiation by targeting GSE1 oncogenic functions in AML.Oncogene(2021).doi:10.1038/s41388-021-02123-7
24.Fiskus,W.et al.Highly effective combination of LSD1(KDM1A)antagonist and pan-histone deacetylase inhibitor against human AML cells.Leukemia 28,2155-2164(2014).
25.Lensch,S.et al.Dynamic spreading of chromatin-mediated gene silencing and reactivation between neighboring genes in single cells.J.Apl.Teknol.Pangan(2021).doi:10.1101/2021.11.04.467237
26.Sanjana,N.E.,Shalem,O.& Zhang,F.Impro
ved vectors and genome-wide libraries for CRISPR screening.Nat.Methods 11,783-784(2014).
27.Guo,X.et al.Transcriptome-wide Cas13 guide RNA design for model organisms and
viral RNA pathogens.Cell Genomics 1,100001(2021).
28.Macosko,E.Z.et al.Highly parallel genome-wide expression profiling of individual cells using nanoliter droplets.Cell 161,1202-1214(2015).
29.Love,M.I.,Huber,W.& Anders,S.Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2.Genome Biol.15,550(2014).
30.Langmead,B.,Trapnell,C.,Pop,M.& Salzberg,S.L.Ultrafast and memory-efficient alignment of short DNA sequences to the human genome.Genome Biol.10,(2009).
31.Leek,J.T.,Johnson,W.E.,Parker,H.S.,Jaffe,A.E.& Storey,J.D.The sva package for
removing batch effects and other unwanted variation in high-throughput experiments.Bioinformatics 28,882-883(2012).
32.Kolde,R.,Laur,S.,Adler,P.& Vilo,J.Robust rank aggregation for gene list integration and meta-analysis.Bioinformatics 28,573-580(2012).
33.Hao,Y.et al.Integrated analysis of multimodal single-cell data.Cell 184,3573-3587.e29(2021).
本明細書で引用される特許及び非特許刊行物はすべて、それらの全体が参照によって本明細書に組み込まれる。2021年3月1日出願の米国仮特許出願第63/154,985号及び2022年2月3日出願の米国仮特許出願第63/306,343号は、それらの全体が参照によって本明細書に組み込まれる。「NYG-LIPP-131PCT_ST25.txt」という名称の配列表が本明細書と共に提出され、そこに記載される配列及びテキストは、参照によって本明細書に組み込まれる。本発明は特定の実施形態を参照して説明されているが、本発明の趣旨から逸脱することなく改変を施せることが理解されよう。そのような改変は、添付の特許請求の範囲に含まれることが意図される。

Claims (29)

  1. ダイレクトリピート(DR)配列及びgRNA配列をそれぞれが含む1つ以上のcrRNA配列と、バーコードガイドRNA(bcgRNA)と連結された5’ダイレクトリピート(DR)配列と、を含むCRISPRアレイを含む核酸であって、前記bcgRNAが、
    (a)バーコード配列と、
    (b)逆転写ハンドルと、
    を5’から3’の順に含む、前記核酸。
  2. 前記bcgRNAが、
    (a)PCRハンドルと、
    (b)バーコード配列と、
    (c)逆転写ハンドルと、
    5’から3’の順に含む、請求項1に記載の核酸。
  3. 前記CRISPRアレイが、1つ、2つ、3つ、またはそれを超える数のcrRNA配列を含む、請求項1または2に記載の核酸。
  4. 前記1つ以上のcrRNA配列がそれぞれ、標的RNA配列と相補的な少なくとも20個のヌクレオチドの配列を含むgRNAを含む、請求項1~3のいずれか1項に記載の核酸。
  5. 前記1つ以上のcrRNA配列がそれぞれ、標的RNA配列と相補的な23個のヌクレオチドの配列であるgRNAを含む、請求項1~4のいずれか1項に記載の核酸。
  6. 前記CRISPRアレイ中に存在する前記crRNAがそれぞれ、異なるgRNA配列を有する、請求項1~5のいずれか1項に記載の核酸。
  7. 前記CRISPRアレイ中に存在する前記crRNAの2つ以上が、同じgRNA配列を含む、請求項1~5のいずれか1項に記載の核酸。
  8. 前記CRISPRアレイ中に存在する前記crRNA配列がそれぞれ、標的転写産物の異なる領域に特異的である、請求項1~6のいずれか1項に記載の核酸。
  9. 前記CRISPRアレイが、複数の転写産物を標的とするガイドRNA(gRNA)配列を有するcrRNA配列を含む、請求項1~8のいずれか1項に記載の核酸。
  10. 前記bcgRNAが、前記CRISPRアレイの前記1つ以上のcrRNA配列の下流(3’)に存在する、請求項1~9のいずれか1項に記載の核酸。
  11. 前記bcgRNAが、前記CRISPRアレイの前記1つ以上のcrRNA配列の上流(5’)に存在する、請求項1~9のいずれか1項に記載の核酸。
  12. 前記ダイレクトリピートが、CRISPR-Cas13酵素と結合することが可能であり、前記CRISPR-Cas13酵素が、任意選択で、Cas13dである、請求項1~11のいずれか1項に記載の核酸。
  13. 前記逆転写ハンドルが、ポリA配列、CS1、またはCS2を含む、請求項1~12のいずれか1項に記載の核酸。
  14. 前記バーコードが、8~15個のヌクレオチドを含む、請求項1~13のいずれか1項に記載の核酸。
  15. 前記CRISPRアレイが、その3’末端に安定化RNAエレメントをさらに含む、請求項1~14のいずれか1項に記載の核酸。
  16. 安定化RNAエレメントが、MALAT1エレメント、NEAT1(MENβ)エレメント、spnpreQエレメント、ZIKV xrRNA1エレメント、mpknotエレメント、またはevopreQエレメントである、請求項15に記載の核酸。
  17. 前記安定化RNAエレメントが、配列番号39、40、41、42、43、または44を含む、請求項15または16に記載の核酸。
  18. 請求項1~17のいずれか1項に記載の核酸を含む発現カセット。
  19. 請求項18に記載の発現カセットを含むベクターであって、前記ベクターが、非ウイルスベクターまたはウイルスベクターである、前記ベクター。
  20. 前記非ウイルスベクターが、プラスミドである、請求項19に記載のベクター。
  21. 前記プラスミドが、CRISPR-Cas酵素をコードする配列を含み、前記CRISPR-Cas酵素が、任意選択で、Cas13酵素またはCas12酵素である、請求項20に記載のベクター。
  22. 前記Cas酵素が、VI型CRISPR-Cas酵素である、請求項21に記載のベクター。
  23. 前記ウイルスベクターが、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、またはアデノ随伴ウイルスベクターである、請求項19に記載のベクター。
  24. 請求項1~17のいずれか1項に記載の核酸と、CRISPR-Cas酵素と、を含む宿主細胞であって、前記CRISPR-Cas酵素が、任意選択で、Cas13酵素またはCas12酵素である、前記宿主細胞。
  25. 単一細胞トランスクリプトームへの1つ以上の遺伝子摂動の導入方法であって、前記方法が、請求項24に記載の宿主細胞を培養することを含む、前記方法。
  26. 遺伝子摂動プロファイリングの実施方法であって、前記方法が、
    (a)請求項24に記載の宿主細胞を取得することと、
    (b)前記細胞からRNAを単離することと、
    (c)前記逆転写ハンドルに特異的なプライマーと前記RNAとを接触させることを含む逆転写を実施することと、
    (d)前記バーコード配列を同定することと、
    (e)1つ以上の転写産物または遺伝子産物の発現を検出することと、
    を含み、
    CRISPR-Cas酵素によって、1つ以上の摂動が前記細胞トランスクリプトームに導入される、前記方法。
  27. 遺伝子摂動プロファイリングの実施方法であって、前記方法が、
    (a)請求項24に記載の宿主細胞を取得し、フルオロフォア結合型抗体で前記細胞を標識し、フローサイトメトリーを使用して前記細胞を選別することと、
    (b)前記細胞からRNAを単離することと、
    (c)前記逆転写ハンドルに特異的なプライマーと前記RNAとを接触させることを含む逆転写を実施することと、
    (d)前記バーコード配列を同定することと、
    (e)1つ以上の転写産物または遺伝子産物の発現を検出することと、
    を含み、
    CRISPR-Cas酵素によって、1つ以上の摂動が前記細胞トランスクリプトームに導入される、前記方法。
  28. (d)が、前記PCRハンドルに特異的なプライマーを使用して前記バーコード配列を増幅することを含む、請求項26または28に記載の方法。
  29. (e)が、フローサイトメトリー分析、細胞ハッシング、単一細胞シークエンシング分析、単一細胞RNAシークエンシング(scRNA-seq)、Perturb-seq、CROP-seq、CRISP-seq、ECCITE-seq、トランスクリプトーム及びエピトープの細胞インデックス化(CITE-seq)のうちの1つ以上を含む、請求項26~28のいずれか1項に記載の方法。
JP2023553669A 2021-03-01 2022-03-01 細胞トランスクリプトームのコンビナトリアル標的化のための方法及び組成物 Pending JP2024519513A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163154985P 2021-03-01 2021-03-01
US63/154,985 2021-03-01
US202263306343P 2022-02-03 2022-02-03
US63/306,343 2022-02-03
PCT/US2022/018364 WO2022187262A1 (en) 2021-03-01 2022-03-01 Methods and compositions for combinatorial targeting of the cell transcriptome

Publications (1)

Publication Number Publication Date
JP2024519513A true JP2024519513A (ja) 2024-05-15

Family

ID=83154405

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023553669A Pending JP2024519513A (ja) 2021-03-01 2022-03-01 細胞トランスクリプトームのコンビナトリアル標的化のための方法及び組成物

Country Status (6)

Country Link
US (1) US20240124873A1 (ja)
EP (1) EP4301868A1 (ja)
JP (1) JP2024519513A (ja)
AU (1) AU2022229789A1 (ja)
CA (1) CA3210284A1 (ja)
WO (1) WO2022187262A1 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10648020B2 (en) * 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems

Also Published As

Publication number Publication date
AU2022229789A9 (en) 2023-10-12
WO2022187262A1 (en) 2022-09-09
US20240124873A1 (en) 2024-04-18
CA3210284A1 (en) 2022-09-09
EP4301868A1 (en) 2024-01-10
AU2022229789A1 (en) 2023-09-21

Similar Documents

Publication Publication Date Title
US20180340176A1 (en) Crispr-cas sgrna library
EP3653709B1 (en) Methods for modulating dna repair outcomes
Liu et al. Identification of functional exonic splicing enhancer motifs recognized by individual SR proteins
KR102602047B1 (ko) Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
US20180112255A1 (en) Crispr mediated in vivo modeling and genetic screening of tumor growth and metastasis
CN110520528A (zh) 高保真性cas9变体及其应用
CA3111432A1 (en) Novel crispr enzymes and systems
CN112410377A (zh) VI-E型和VI-F型CRISPR-Cas系统及用途
US20230407281A1 (en) Novel crispr-associated systems and components
CA3223527A1 (en) Novel crispr enzymes and systems
EP1546345B1 (en) Genome partitioning
JP2022547524A (ja) 新規crispr dnaターゲティング酵素及びシステム
US20220315913A1 (en) Novel crispr dna targeting enzymes and systems
JP2022540153A (ja) 新規crispr dnaターゲティング酵素及びシステム
US20230016656A1 (en) Novel crispr dna targeting enzymes and systems
WO2023208256A1 (zh) 经分离的Cas13蛋白、基于它的基因编辑系统及其用途
JP2023182637A (ja) 制御性t細胞を改変するための組成物および方法
JP2024519513A (ja) 細胞トランスクリプトームのコンビナトリアル標的化のための方法及び組成物
Xu et al. Novel miniature CRISPR–Cas13 systems from uncultivated microbes effective in degrading SARS-CoV-2 sequences and influenza viruses
US20240055077A1 (en) SYSTEM AND METHOD FOR PREDICTING ACTIVITY AND SPECIFICITY OF 17 SMALL Cas9s USING DEEP LEARNING
US20240124881A1 (en) Compositions for use in the treatment of chd2 haploinsufficiency and methods of identifying same
Zirak Systemwide in vivo, multi-omics and computational approaches to understand tumor immune coevolution and RNA secretion
Frangieh Methods and models of screening genomic variants
Farberov et al. Systematic analysis of the target recognition and repression by the Pumilio proteins
Putzbach Toxicity Mediated by Seed-Dependent Off-Target Effects in RNA Interference

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240418