JP2022546701A - 新規crispr dnaターゲティング酵素及びシステム - Google Patents

新規crispr dnaターゲティング酵素及びシステム Download PDF

Info

Publication number
JP2022546701A
JP2022546701A JP2022513214A JP2022513214A JP2022546701A JP 2022546701 A JP2022546701 A JP 2022546701A JP 2022513214 A JP2022513214 A JP 2022513214A JP 2022513214 A JP2022513214 A JP 2022513214A JP 2022546701 A JP2022546701 A JP 2022546701A
Authority
JP
Japan
Prior art keywords
crispr
nucleic acid
sequence
seq
target nucleic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022513214A
Other languages
English (en)
Other versions
JPWO2021041569A5 (ja
Inventor
デイビッド エー. スコット,
デイビッド アール. チェン,
ウィンストン エックス. ヤン,
ティア エム. ディトマソ,
Original Assignee
アーバー バイオテクノロジーズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アーバー バイオテクノロジーズ, インコーポレイテッド filed Critical アーバー バイオテクノロジーズ, インコーポレイテッド
Publication of JP2022546701A publication Critical patent/JP2022546701A/ja
Publication of JPWO2021041569A5 publication Critical patent/JPWO2021041569A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本開示は、標的化した形で核酸を操作するための新規システム、方法、及び組成物について記載する。本開示は、核酸を標的化して修飾するための、天然に存在しないエンジニアリングされたCRISPRシステム、成分、及び方法について記載する。各システムが、一体となって核酸を標的化する1つ以上のタンパク質成分と1つ以上の核酸成分とを含む。

Description

関連出願
本願は、2019年8月27日に提出された米国仮特許出願第62/892358号、2019年8月27日に提出された米国仮特許出願第62/892382号、2019年8月27日に提出された米国仮特許出願第62/892390号、2019年8月27日に提出された米国仮特許出願第62/892446号、2019年8月27日に提出された米国仮特許出願第62/892434号、2019年8月28日に提出された米国仮特許出願第62/893064号、2019年8月28日に提出された米国仮特許出願第62/893059号、及び2019年9月5日に提出された米国仮特許出願第62/896277号の優先権の利益を主張し、これらの各々の全内容は、本明細書によって参照により援用される。
配列表
本出願は、ASCII形式で電子的に提出され、全体として参照により本明細書で援用される配列表を含む。2020年8月26日に作成された前記ASCIIコピーは、A2186-7018WO_SL.txtというファイル名で、サイズは1,301,348バイトである。
本開示は、新規のクラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats:CRISPR)及びCRISPR関連(Cas)遺伝子を使用する遺伝子発現のゲノム編集及び調節のためのシステム及び方法に関する。
近年、ゲノムシーケンシング技術及び解析の進歩により、原核生物の生合成経路からヒト病理に及ぶまでの多種多様な自然領域における生物学的活性の遺伝的基礎に関して重要な洞察が得られている。得られた大量の情報を完全に理解し、評価するためには、対応したゲノム及びエピゲノム操作のシーケンス技術の規模、有効性、及び容易さの向上が必要となる。このような新規技術は、バイオテクノロジー、農業、及びヒト治療薬を含めた数多くの領域における新規適用の開発を加速させることになる。
クラスター化して規則的な配置の短い回文配列リピート(CRISPR)及びCRISPR関連(Cas)遺伝子は、まとめてCRISPR-Cas又はCRISPR/Casシステムとして知られ、外来の遺伝的エレメントから特定の種を防御する古細菌及び細菌の適応免疫系である。CRISPR-Casシステムは極めて多様な一群のタンパク質エフェクター、非コードエレメント、並びに遺伝子座構成を含み、その幾つかの例がエンジニアリングされ、適合されることにより、重要なバイオテクノロジーの進歩が生み出されている。
宿主防御に関与するこのシステムの成分には、核酸を修飾する能力を有する1つ以上のエフェクタータンパク質と、エフェクタータンパク質をファージ核酸上の特異的配列に標的化することを担うRNAガイドエレメントとが含まれる。RNAガイドはCRISPR RNA(crRNA)で構成され、1つ又は複数のエフェクタータンパク質による標的核酸の操作を実現するために追加的なトランス活性化型RNA(tracrRNA)を必要とすることもある。crRNAは、crRNAへのタンパク質結合を担うダイレクトリピートと、所望の核酸標的配列に相補的なスペーサー配列とからなる。CRISPRシステムは、crRNAのスペーサー配列を修飾することにより、別のDNA又はRNA標的を標的化するよう再プログラム化し得る。
CRISPR-Casシステムは、大きく2つのクラスに分けることができる:クラス1システムは、一緒になってcrRNAの周りに複合体を形成する複数のエフェクタータンパク質で構成され、クラス2システムは、RNAガイドと複合体化して核酸基質を標的化する単一のエフェクタータンパク質からなる。クラス2システムのシングルサブユニットのエフェクター組成は、エンジニアリング及び適用移行に一層簡便な成分セットを提供し、したがってこれまでプログラム可能なエフェクターの重要な供給源となっている。それにも関わらず、核酸及びポリヌクレオチド(即ち、DNA、RNA、又は任意のハイブリッド、誘導体、又は修飾体)を修飾するための、その独自の特性によって新規適用を実現する、より小さなエフェクター及び/又はユニークなPAM配列要件を有するエフェクターなどの現在のCRISPR-Casシステムを越える更なるプログラム可能なエフェクター及びシステムが依然として必要とされている。
この開示は、最初にゲノムデータベースから計算により同定され、その後、エンジニアリングされ、実験的に検証された、新規の単一エフェクタークラス2 CRISPR-Casシステムのための非天然のエンジニアリングされたシステム及び組成物を提供する。特に、これらのCRISPR-Casシステムの成分の同定により、非天然環境、例えば、システムが最初に発見されたもの以外の細菌、又は哺乳動物細胞などの真核細胞における使用が可能になる。これらの新規エフェクターは、既存のクラス2 CRISPRエフェクターのオルソログ及びホモログと比較して配列及び機能が異なる。
一態様において、本開示は、配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.133120のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.133120のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号51~72、85~87、95~100、又は900~915のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号51、95、又は85のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。一部の実施形態において、CRISPR関連タンパク質は、表3のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、表4に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表4の対応する行の第1又は第2のダイレクトリピートヌクレオチド配列)、又は表32に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表32のプレcrRNAダイレクトリピート配列又は成熟crRNAダイレクトリピート配列)と、少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1(CLUST.133120 3300027740)又は配列番号1(CLUST.133120 3300017971)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1~50(CLUST.133120)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAMは核酸配列を含み、これは5’-TTN-3’、又は5’-TN-3’として記載される核酸配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号1のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-TTN-3’として記載される核酸配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号2のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-TN-3’として記載される核酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は20~35ヌクレオチドを含む。
別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1又は配列番号2に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1~50に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-TTN-3’又は5’-TN-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号51~72、85~87、95~100、又は900~915のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は20~35ヌクレオチドを含む。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1又は配列番号2に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号1~50(CLUST.133120)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-TTN-3’又は5’-TN-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号51~72、85~87、95~100、又は900~915のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は20~35ヌクレオチドを含む。
一態様において、本開示は、配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.099129のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.099129のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号146~162、180~183、又は200~215のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号101のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号146、181、又は200のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、表10のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、表11に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表11の対応する行の第1又は第2のダイレクトリピートヌクレオチド配列)、又は表7に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表7のプレcrRNAダイレクトリピート配列又は成熟crRNAダイレクトリピート配列)と、少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号101(CLUST.099129 SRR6837557)、配列番号102(CLUST.099129 3300012971)、又は配列番号103(CLUST.099129 3300005764)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号101~145(CLUST.0991297)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAMは核酸配列を含み、これは5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’(配列番号920)として記載される核酸配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号101のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-GTN-3’として記載される核酸配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号102のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-TG-3’として記載される核酸配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号103のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-TR-3’又は5’-RATG-3’(配列番号920)として記載される核酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は26~51ヌクレオチドを含む。
別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号101、配列番号102、又は配列番号103に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号101~145に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’(配列番号920)として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号146~162、180~183、又は200~215のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は26~51ヌクレオチドを含む。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号101、配列番号102、又は配列番号103に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号101~145に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号146~162、180~183、又は200~215のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は26~51ヌクレオチドを含む。
一態様において、本開示は、配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.342201のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.342201のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号342~362、384~402、451、452、又は454のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号301のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号342又は451のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、表17のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、表14に掲載される対応するダイレクトリピートヌクレオチド配列、又は表18に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表18の対応する行の第1又は第2のダイレクトリピートヌクレオチド配列)と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号301(CLUST.342201 3300006417)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号301~341(CLUST.342201)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAMは核酸配列を含み、これは5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、又は5’-RAAD-3’(配列番号923)として記載される核酸配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号301のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-AAG-3’、5’-AAD-3’、又は5’-AAR-3’として記載される核酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約12ヌクレオチド~約62ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は19~40ヌクレオチドを含む。
別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号301に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号301~341に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号342~362、384~402、451、452、又は454のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約12ヌクレオチド~約62ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は19~40ヌクレオチドを含む。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号301に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号301~341に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号342~362、384~402、451、452、又は454のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は約12ヌクレオチド~約62ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は19~40ヌクレオチドを含む。
一態様において、本開示は、配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.195009のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.195009のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号522~532、535、又は539~549のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号501のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号522又は539のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、表23のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、表20に掲載される対応するダイレクトリピートヌクレオチド配列、又は表24に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表24の対応する行の第1又は第2のダイレクトリピートヌクレオチド配列)と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号501(CLUST.195009 SRR6201554)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号501~521(CLUST.195009)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAMは核酸配列を含み、これは5’-TTN-3’として記載される核酸配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号501のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-TTN-3’として記載される核酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は20~39ヌクレオチドを含む。
別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号501に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号501~521に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-TTN-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号522~532、535、又は539~549のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は20~39ヌクレオチドを含む。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号501に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号501~521に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-TTN-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号522~532、535、又は539~549のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約55ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は20~39ヌクレオチドを含む。
一態様において、本開示は、配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、CLUST.057059のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。一態様において、本開示は、CRISPR関連タンパク質が配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、CLUST.057059のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムを提供し、ここで、CRISPR関連タンパク質は、RNAガイドに結合し、スペーサー配列に相補的な標的核酸配列を修飾することができる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号683~734又は751~802のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号601のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、配列番号683又は751のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、表29のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、ダイレクトリピート配列は、表26に掲載される対応するダイレクトリピートヌクレオチド配列、又は表30に掲載される対応するダイレクトリピートヌクレオチド配列(例えば、表30の対応する行の第1又は第2のダイレクトリピートヌクレオチド配列)と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号601(CLUST.057059 3300023179)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号601~682(CLUST.057059)に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質はプロトスペーサー隣接モチーフ(PAM)の認識能を有し、ここで、PAMは核酸配列を含み、これは5’-GTN-3’として記載される核酸配列を含む。
一部の実施形態において、CRISPR関連タンパク質は、配列番号601のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含み、PAM配列は、5’-GTN-3’として記載される核酸配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、RNAガイドのスペーサー配列は20~44ヌクレオチドを含む。
別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む。別の態様において、本開示は、細胞(例えば、遺伝子修飾された細胞)を提供し、ここで、細胞は、CRISPR関連タンパク質が配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号601に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号601~682に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-GTN-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号683~734又は751~802のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、スペーサー配列は20~44ヌクレオチドを含む。
別の態様において、本開示は、標的核酸を修飾する方法であって、配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むCRISPR関連タンパク質;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイドを含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。別の態様において、本開示は、標的核酸を修飾する方法であって、CRISPR関連タンパク質が配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又はCRISPR関連タンパク質をコードする核酸;及びダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド、又はRNAガイドをコードする核酸を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含む方法を提供し、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号601に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、配列番号601~682に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、5’-GTN-3’として記載される核酸配列を含むPAM配列の認識能を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、ダイレクトリピート配列は、配列番号683~734又は751~802のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む。
一部の態様において、本開示は、哺乳動物細胞において標的核酸へ挿入又は欠失を導入する方法を提供し、方法は、(a)本明細書に記載されるCRISPR関連タンパク質をコードする核酸配列であって、例えば、CRISPR関連タンパク質が配列番号1~50、101~145、301~341、501~521、又は601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むもの;及び(b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド(又はRNAガイドをコードする核酸)、例えば、本明細書に記載されるRNAガイド、のトランスフェクションを含み、ここで、CRISPR関連タンパク質はRNAガイドへの結合能を有し、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。一部の実施形態において、CRISPR関連タンパク質は、配列番号1、101、301、501、又は601のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む。一部の実施形態において、CRISPR関連タンパク質は、配列番号1、101、301、501、又は601のいずれか1つのアミノ酸配列を含む。一部の実施形態において、トランスフェクションは、一過性トランスフェクションである。一部の実施形態において、細胞はヒト細胞である。
本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は約15ヌクレオチド~約50ヌクレオチドを含む。本明細書に記載される方法のいずれかの一部の実施形態において、スペーサー配列は20~44ヌクレオチドを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載されるシステムのいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはドナー鋳型核酸を更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はDNA分子である。本明細書に記載されるシステムのいずれかの一部の実施形態において、ドナー鋳型核酸はRNA分子である。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載されるシステムのいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載されるシステムのいずれかの一部の実施形態において、システムはモジュレーターRNAを更に含む。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する。
本明細書に記載されるシステムのいずれかの一部の実施形態において、システムは細胞内にある。一部の実施形態において、細胞は真核細胞である。一部の実施形態において、細胞は哺乳動物細胞である。一部の実施形態において、細胞はヒト細胞である。一部の実施形態において、細胞は原核細胞である。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、少なくとも1つ(例えば、1つ、2つ、又は3つ)のRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はtracrRNAを含まない。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は任意選択でtracrRNAを含む。本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は自己プロセシングである。
本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はtracrRNAを更に含む。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はモジュレーターRNAを更に含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は真核細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は哺乳動物細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞はヒト細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は原核細胞である。本明細書に記載される細胞のいずれかの一部の実施形態において、細胞は遺伝子エンジニアリングされた細胞である。
本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される細胞のいずれかの一部の実施形態において、CRISPR関連タンパク質及びRNAガイドによる標的核酸の認識により、標的核酸の修飾が生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される細胞のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
別の態様において、本開示は、(a)システムを提供すること;及び(b)システムを細胞に送達することを含む、本明細書に記載されるシステムを細胞内の標的核酸に結合する方法を提供し、ここで、細胞は標的核酸を含み、CRISPR関連タンパク質はRNAガイドに結合し、スペーサー配列は標的核酸に結合する。一部の実施形態において、細胞は真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、標的核酸を切断する。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、細胞(例えば、真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞)での発現にコドン最適化される。本明細書に記載される方法のいずれかの一部の実施形態において、細胞は遺伝子エンジニアリングされた細胞である。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、プロモーターに作動可能に連結されている。本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質をコードする核酸は、ベクター内にある。一部の実施形態において、ベクターは、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む。
本明細書に記載される方法のいずれかの一部の実施形態において、システムはtracrRNAを含まない。本明細書に記載される方法のいずれかの一部の実施形態において、細胞は任意選択でtracrRNAを含む。
本明細書に記載される方法のいずれかの一部の実施形態において、RNAガイドは、任意選択で、tracrRNA及び/又はモジュレーターRNAを含む。本明細書に記載される方法のいずれかの一部の実施形態において、システムはtracrRNAを更に含む。本明細書に記載される方法のいずれかの一部の実施形態において、システムはモジュレーターRNAを更に含む。
本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸はDNA分子である。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸はPAM配列を含む。
本明細書に記載される方法のいずれかの一部の実施形態において、CRISPR関連タンパク質は、非特異的ヌクレアーゼ活性を有する。
本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾は、二本鎖切断イベントである。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾は、一本鎖切断イベントである。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、挿入イベントが生じる。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、欠失イベントが生じる。本明細書に記載される方法のいずれかの一部の実施形態において、標的核酸の修飾により、細胞毒性又は細胞死が生じる。
別の態様において、本開示は、標的核酸の編集方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。別の態様において、本開示は、標的核酸の発現を改変する方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。別の態様において、本開示は、標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。別の態様において、本開示は、標的核酸の部位からのペイロード核酸の切出しを標的化する方法であって、本明細書に記載されるシステムを標的核酸に接触させることを含む、方法を提供する。別の態様において、本開示は、DNA標的核酸の認識時に一本鎖DNAを非特異的に分解する方法を提供し、この方法は、本明細書に記載されるシステムを標的核酸に接触させることを含む。
別の態様において、本開示は、試料中の標的核酸の検出方法であって、(a)本明細書に記載されるシステム及び標識されたレポーター核酸を前記試料に接触させることであって、スペーサー配列が標的核酸にハイブリダイズすると、標識されたレポーター核酸の切断が起こること;及び(b)前記標識されたレポーター核酸の切断によって生成される検出可能シグナルを測定することであって、それにより前記試料中における前記標的核酸の存在を検出することを含む方法を提供する。
本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、接触は、直接接触又は間接接触を含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、間接的に接触することは、RNAガイド及び/又はCRISPR関連タンパク質の産生を可能にする条件下で、本明細書に記載されるRNAガイド又はCRISPR関連タンパク質をコードする1つ以上の核酸を投与することを含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、接触は、インビボでの接触又はインビトロでの接触を含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、標的核酸をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが標的核酸に到達することを可能にする条件下で、核酸を含む細胞をシステムと接触させることを含む。本明細書に提供されるシステム又は方法のいずれかの一部の実施形態において、インビボで細胞をシステムと接触させることは、CRISPR関連タンパク質及びガイドRNAが細胞に到達するか又は細胞内で産生されることを可能にする条件下で、細胞を含む対象にシステムを投与することを含む。
別の態様において、本開示は、(a)標的核酸のターゲティング及び編集方法;(b)核酸の認識に応じた一本鎖核酸の非特異的分解方法;(c)二本鎖標的のスペーサー相補鎖の認識に応じた二本鎖標的の非スペーサー相補鎖のターゲティング及びニッキング方法;(d)二本鎖標的核酸のターゲティング及び切断方法;(e)試料中の標的核酸の検出方法;(f)二本鎖核酸の特異的編集方法;(g)二本鎖核酸の塩基編集方法;(h)細胞における遺伝子型特異的又は転写状態特異的細胞死又は休眠の誘導方法;(i)二本鎖核酸標的におけるインデルの作成方法;(j)二本鎖核酸標的への配列の挿入方法;又は(k)二本鎖核酸標的における配列の欠失又は逆位形成方法である、インビトロ又はエキソビボでの方法における使用のための、本明細書に提供されるシステムを提供する。
一部の態様において、本開示は、試料中の標的核酸の検出方法を提供し、ここで、方法は、本明細書に記載されるシステム及び標識されたレポーター核酸を試料に接触させることであって、crRNAが標的核酸にハイブリダイズすると、標識されたレポーター核酸の切断が起こること;及び標識されたレポーター核酸の切断によって生成される検出可能シグナルを測定することであって、それにより試料中における標的核酸の存在を検出することを含む。
本明細書に記載されるエフェクターは、限定はされないが、1)新規核酸編集特性及び制御機構、2)送達戦略におけるより高い汎用性に比したより小さいサイズ、3)遺伝子型によって惹起される細胞死などの細胞過程、及び4)プログラム可能なRNA誘導型DNA挿入、切出し、及び動員、及び5)非ヒト共生源を介した既存の免疫の差別化されたプロファイルを含めた更なる特徴を提供する。例えば、実施例1~15及び図3~44を参照のこと。本明細書に記載される新規DNAターゲティングシステムがゲノム及びエピゲノム操作技法のツールボックスに加わることにより、特異的でプログラムされた摂動への幅広い適用が実現する。
本発明の他の特徴及び利点は、以下の詳細な説明から、及び特許請求の範囲から明らかであろう。
図面は、CLUST.133120と呼ばれるタンパク質クラスターの分析結果を表す一連の概略表現である。
実施例2、5、10、12、及び14に記載されているインビボネガティブ選択スクリーニングアッセイの構成要素の概略表現である。2個のDRが隣接する且つJ23119によって発現されるpACYC184又は大腸菌(E.coli)必須遺伝子の両鎖から均一にサンプリングした非代表的スペーサーを含むCRISPRアレイライブラリを設計した。 実施例2に記載されているインビボネガティブ選択スクリーニングワークフローの概略表現である。CRISPRアレイライブラリは、エフェクタープラスミドにクローニングした。エフェクタープラスミド及び非コードプラスミドを大腸菌(E.coli)に形質転換し、続いてpACYC184又は大腸菌(E.coli)必須遺伝子からの転写物に対して干渉を付与するCRISPRアレイのネガティブ選択用に成長させた。エフェクタープラスミドの標的化シーケンシングを使用して、枯渇したCRISPRアレイを同定した。スモールRNAseqを更に実施して、成熟crRNA及び潜在的tracrRNAの要件を特定する。 CLUST.133120エフェクターのRuvC及びZnフィンガードメインを示す概略図であり、これは、表3に示される配列のコンセンサス配列に基づく。 pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.133120 3300027740(配列番号1に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-CCAA…CGAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTCG…TTGG-[スペーサー]-3’)の枯渇の程度が示される。 図4Aは、pACYC184プラスミド上の位置による、CLUST.133120 3300027740の枯渇及び非枯渇標的の密度を示すグラフ表現である。図4Bは、大腸菌(E.coli)株、E.Cloni上の位置による、CLUST.133120 3300027740の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。2つのグラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.133120 3300027740のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 は、非コード配列を有しない、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.133120 3300017971(配列番号2に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-GTCG…TACC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GGTA…CGAC-[スペーサー]-3’)の枯渇の程度が示される。 図7Aは、pACYC184プラスミド上の位置による、CLUST.133120 3300017971の枯渇及び非枯渇標的の密度を示すグラフ表現である。図7Bは、大腸菌(E.coli)株、E.Cloni上の位置による、CLUST.133120 3300017971の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.133120 3300017971のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 非コード配列を有しない、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.133120 3300027740(配列番号1に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-CCAA…CGAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTCG…TTGG-[スペーサー]-3’)の枯渇の程度が示される。 図10Aは、pACYC184プラスミド上の位置による、非コード配列を有しない、CLUST.133120 3300027740の枯渇及び非枯渇標的の密度を示すグラフ表現である。図10Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有しない、CLUST.133120 3300027740の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.133120 3300027740(非コード配列を含まない)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 非コード配列を有しない、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.133120 3300017971(配列番号2に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-GTCG…TACC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GGTA…CGAC-[スペーサー]-3’)の枯渇の程度が示される。 図13Aは、pACYC184プラスミド上の位置による、非コード配列を有しない、CLUST.133120 3300017971の枯渇及び非枯渇標的の密度を示すグラフ表現である。図13Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有しない、CLUST.133120 3300017971の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.133120 3300017971(非コード配列を含まない)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 図15Aは、CLUST.133120エフェクター活性を測定するための実施例3に記載されている蛍光枯渇アッセイの概略表現である。図15Bは、標的1(配列番号82)、標的2(配列番号83)、及び標的3(配列番号84)についての配列番号1のエフェクターのGFP枯渇率(非標的/標的)のプロットを示す。 同上。 CLUST.099129エフェクターのRuvCドメインを示す概略図であり、これは、表10に示される配列のコンセンサス配列に基づく。 非コード配列を有する、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.099129 SRR6837557(配列番号101に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-GTTT…GACC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-AGTC…AAAC-[スペーサー]-3’)の枯渇の程度が示される。 図18Aは、pACYC184プラスミド上の位置による、非コード配列を有する、CLUST.099129 SRR6837557の枯渇及び非枯渇標的の密度を示すグラフ表現である。図18Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有する、CLUST.099129 SRR6837557の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.099129 SRR6837557(非コード配列を含む)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 非コード配列を有しない、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.099129 SRR6837557(配列番号101に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-GTTT…GACC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-AGTC…AAAC-[スペーサー]-3’)の枯渇の程度が示される。 図21Aは、pACYC184プラスミド上の位置による、非コード配列を有しない、CLUST.099129 SRR6837557の枯渇及び非枯渇標的の密度を示すグラフ表現である。図21Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有しない、CLUST.099129 SRR6837557の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.099129 SRR6837557(非コード配列を含まない)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 非コード配列を有する、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.099129 3300012971(配列番号102に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-GTGC…TCAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTGA…GCAC-[スペーサー]-3’)の枯渇の程度が示される。 図24Aは、pACYC184プラスミド上の位置による、非コード配列を有する、CLUST.099129 3300012971の枯渇及び非枯渇標的の密度を示すグラフ表現である。図24Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有する、CLUST.099129 3300012971の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.099129 3300012971(非コード配列を含む)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 非コード配列を有する、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.099129 3300005764(配列番号103に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-GTGC…TACT-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-AGTA…GCAC-[スペーサー]-3’)の枯渇の程度が示される。 図27Aは、pACYC184プラスミド上の位置による、非コード配列を有する、CLUST.099129 3300005764の枯渇及び非枯渇標的の密度を示すグラフ表現である。図27Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有する、CLUST.099129 3300005764の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.099129 3300005764(非コード配列を含む)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 図29Aは、CLUST.099129エフェクター活性を測定するための実施例6に記載されている蛍光枯渇アッセイ(FDA)の概略表現である。図29Bは、標的1(配列番号175)、標的2(配列番号176)、標的3(配列番号177)、標的4(配列番号178)、標的5(配列番号179)についての配列番号101のエフェクターのGFP枯渇率(非標的/標的)のプロットを示す。 同上。 図30A、図30B、及び図30Cは、CLUST.342201エフェクターのRuvC及びZnフィンガードメインを示す概略図であり、これは、表17に示される配列のコンセンサス配列に基づく。 同上。 非コード配列を有する、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.342201 3300006417(配列番号301に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-CCAT…GAAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTTC…ATGG-[スペーサー]-3’)の枯渇の程度が示される。 図32Aは、pACYC184プラスミド上の位置による、非コード配列を有する、CLUST.342201 3300006417の枯渇及び非枯渇標的の密度を示すグラフ表現である。図32Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有する、CLUST.342201 3300006417の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.342201 3300006417(非コード配列を含む)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 CLUST.195009エフェクターのRuvC及びZnフィンガードメインを示す概略図であり、これは、表23に示される配列のコンセンサス配列に基づく。 非コード配列を有する、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.195009 SRR6201554(配列番号501に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-CCAG…CGAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTCG…CTGG-[スペーサー]-3’)の枯渇の程度が示される。 図36Aは、pACYC184プラスミド上の位置による、非コード配列を有する、CLUST.195009 SRR6201554の枯渇及び非枯渇標的の密度を示すグラフ表現である。図36Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有する、CLUST.195009 SRR6201554の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 図37は、CLUST.195009 SRR6201554(非コード配列を含む)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 非コード配列を有しない、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.195009 SRR6201554(配列番号501に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-CCAG…CGAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTCG…CTGG-[スペーサー]-3’)の枯渇の程度が示される。 図39Aは、pACYC184プラスミド上の位置による、非コード配列を有しない、CLUST.195009 SRR6201554の枯渇及び非枯渇標的の密度を示すグラフ表現である。図39Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有しない、CLUST.195009 SRR6201554の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.195009 SRR6201554(非コード配列を含まない)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。 CLUST.057059エフェクターのRuvC及びZnフィンガードメインを示す概略表現であり、これは、表29に示される配列のコンセンサス配列に基づく。 非コード配列を有する、pACYC184及びダイレクトリピート転写方向を標的とするスペーサーについてのエンジニアリングされた組成物の枯渇活性の程度を示す、CLUST.057059 3300023179(配列番号601に記載のエフェクター)のグラフである。「順」方向のダイレクトリピート(5’-CTTG…AAAC-[スペーサー]-3’)及び「逆」方向のダイレクトリピート(5’-GTTT…CAAG-[スペーサー]-3’)の枯渇の程度が示される。 図43Aは、pACYC184プラスミド上の位置による、非コード配列を有する、CLUST.057059 3300023179の枯渇及び非枯渇標的の密度を示すグラフ表現である。図43Bは、大腸菌(E.coli)株、E.Cloni上の位置による、非コード配列を有する、CLUST.057059 3300023179の枯渇及び非枯渇標的の密度を示すグラフ表現である。トップ鎖上及びボトム鎖上の標的を別々に、アノテートされた遺伝子の向きに関して示す。バンドの大きさは枯渇の程度を示し、明るいバンドはヒット閾値の3に近い。グラジエントは、相対的な転写物の存在度を示すRNAシーケンシングのヒートマップである。 同上。 CLUST.057059 3300023179(非コード配列を含む)のPAM配列の予測としての、E.Cloniの枯渇した標的に隣接する配列のWebLogoである。
CRISPR-Casシステムは、天然に多様であり、プログラム可能なバイオテクノロジーに生かすことのできる様々な活性機構及び機能要素が含まれている。天然では、これらのシステムが外来DNA及びウイルスに対する効率的な防御を実現する一方で、自己と非自己の判別を提供して自己標的化を回避している。エンジニアリングされた設定では、これらのシステムは、分子技術の多様なツールボックスを提供し、ターゲティング空間の境界を画定する。本明細書に記載される方法を用いて、シングルサブユニットのクラス2エフェクターシステム内に、RNAによるプログラムが可能な核酸操作の能力を拡張する、更なる機構及びパラメータが発見された。
特に定義しない限り、本明細書で使用される全ての科学技術用語は、本発明が属する技術分野の当業者が一般的に理解するのと同じ意味を有する。本発明の実施又は試験においては、本明細書に記載されるものと同様の又は等価な方法及び材料を使用し得るが、好適な方法及び材料を以下に記載する。本明細書において言及される刊行物、特許出願、特許、及び他の参考文献は全て、全体として参照により援用される。矛盾が生じる場合、定義を含め、本明細書が優先するものとする。加えて、材料、方法、及び例は例示に過ぎず、限定することを意図するものではない。出願人は、特許法の標準的な慣行に従って、「を含む」、「から本質的になる」、又は「からなる」という移行句を使用して、任意の開示された発明を代替的に請求する権利を留保する。
本明細書で使用される場合、単数形「a」、「an」、及び「the」は、文脈が明らかに他のものを示さない限り、複数の指示対象を含む。例えば、「核酸」への言及は、1つ以上の核酸を意味する。
本明細書において、「好ましくは」、「適切に」、「一般的に」、及び「典型的に」などの用語は、請求される発明の範囲を制限するため、又は特定の特徴が請求される発明の構造又は機能にとって重大、必須、又は更に重要であることを示唆するために使用されるものではないことに留意されたい。むしろ、これらの用語は、本発明の特定の実施形態において利用できる、又は利用できない、代替又は追加の特徴を強調することを単に意図するものである。
本発明を説明及び定義する目的で、用語「実質的に」は、任意の定量的比較、値、測定、又は他の表現に帰することができる固有の不確実性の程度を表すために本明細書で使用されることに留意されたい。用語「実質的に」はまた、問題となっている主題の基本的な機能に変化をもたらすことなく、記載される参照物から定量的表現が変化し得る程度を表すために本明細書で使用される。
用語「CRISPR-Casシステム」は、本明細書で使用されるとき、CRISPRエフェクターをコードする配列、RNAガイド、並びに他の配列及びCRISPR遺伝子座からの転写物を含む、CRISPRエフェクターの発現に関与する、又はその活性を導く核酸及び/又はタンパク質を指す。
用語「CRISPR関連タンパク質」、「CRISPR-Casエフェクター」、「CRISPRエフェクター」、「エフェクター」、「エフェクタータンパク質」、「CRISPR酵素」などは、本明細書で同義的に使用されるとき、酵素活性を実行するタンパク質又はRNAガイドによって指定される核酸上の標的部位に結合するタンパク質を指す。一部の実施形態において、CRISPRエフェクターは、エンドヌクレアーゼ活性、ニッカーゼ活性、及び/又はエキソヌクレアーゼ活性を有する。
用語「RNAガイド」、「ガイドRNA」、「gRNA」、及び「ガイド配列」は、本明細書で使用されるとき、DNA及び/又はRNAなどの標的核酸への本明細書に記載されるエフェクターのターゲティングを促進する任意のRNA分子を指す。例示的な「RNAガイド」としては、限定はされないが、crRNA、並びにtracrRNA及び/又はモジュレーターRNAのいずれかとハイブリダイズ又は融合したcrRNAが挙げられる。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA及びtracrRNAの両方を含む。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA及びモジュレーターRNAを含む。一部の実施形態において、RNAガイドは、単一のRNA分子に融合された、又は別個のRNA分子としての、crRNA、tracrRNA、及びモジュレーターRNAを含む。
用語「CRISPRエフェクター複合体」、「エフェクター複合体」、又は「監視複合体」は、本明細書で使用されるとき、CRISPRエフェクタータンパク質及びRNAガイドを含む複合体を指す。CRISPRエフェクター複合体は、1つ以上のアクセサリータンパク質を更に含み得る。1つ以上のアクセサリータンパク質は、非触媒的及び/又は非標的結合であり得る。
用語「CRISPR RNA」又は「crRNA」は、本明細書で使用されるとき、CRISPRエフェクターによって核酸配列を特異的に認識するために使用されるガイド配列を含むRNA分子を指す。典型的には、crRNAは、標的認識を媒介する配列と、tracrRNAと二重鎖を形成する配列とを含む。crRNAは、tracrRNAにハイブリダイズする配列を含み得る。次にはcrRNA:tracrRNA二重鎖は、CRISPRエフェクターに結合し得る。本明細書で使用されるとき、用語「プレcrRNA」は、DR-スペーサー-DR配列を含むプロセシングされていないRNA分子を指す。本明細書で使用される場合、「成熟crRNA」という用語は、プレcrRNAの処理された形態を指す。成熟crRNAは、DRスペーサー配列を含んでもよく、ここで、DRはプレcrRNAのDRの短縮型であり、且つ/又はスペーサーはプレcrRNAのスペーサーの短縮型である。crRNA「スペーサー」配列は、核酸標的配列に相補的であり、核酸標的配列に対し部分的又は完全な結合能を有する。
用語「トランス活性化crRNA」又は「tracrRNA」は、本明細書で使用されるとき、CRISPRエフェクターが特定の標的核酸に結合するために必要な構造及び/又は配列モチーフを形成する配列を含むRNA分子を指す。
用語「CRISPRアレイ」は、本明細書で使用されるとき、最初のCRISPRリピートの最初のヌクレオチドから始まって最後の(末端)CRISPRリピートの最後のヌクレオチドで終わる、CRISPRリピートとスペーサーとを含む核酸(例えば、DNA)セグメントを指す。典型的には、CRISPRアレイ中の各スペーサーは2つのリピート間に位置する。用語「CRISPRリピート」、「CRISPRダイレクトリピート」、及び「ダイレクトリピート」は、本明細書で使用されるとき、複数の短い定方向に反復する配列を指し、これはCRISPRアレイ内で配列変異をごく僅かしか又は全く示さない。
用語「モジュレーターRNA」は、本明細書に記載されるとき、CRISPRエフェクター又はCRISPRエフェクターを含む核タンパク質複合体の活性を調節する(例えば、増加又は減少させる)任意のRNA分子を指す。一部の実施形態において、モジュレーターRNAは、CRISPRエフェクター又はCRISPRエフェクターを含む核タンパク質複合体のヌクレアーゼ活性を調節する。
本明細書で使用されるとき、用語「標的核酸」は、RNAガイド中のスペーサーの全体又は一部に相補的なヌクレオチド配列を含む核酸を指す。一部の実施形態において、標的核酸は遺伝子を含む。一部の実施形態において、標的核酸は非コード領域(例えば、プロモーター)を含む。一部の実施形態において、標的核酸は一本鎖である。一部の実施形態において、標的核酸は二本鎖である。「転写活性部位」は、本明細書で使用されるとき、活発に転写されている核酸配列中の部位を指す。
用語「活性化したCRISPRエフェクター複合体」、「活性化したCRISPR複合体」、及び「活性化した複合体」は、本明細書で使用されるとき、標的核酸を修飾することができるCRISPRエフェクター複合体を指す。一部の実施形態において、活性化したCRISPR複合体は、活性化したCRISPR複合体が標的核酸に結合した後、標的核酸を修飾することができる。一部の実施形態において、活性化したCRISPR複合体の標的核酸への結合により、コラテラル切断などの追加の切断イベントが生じる。
用語「切断イベント」は、本明細書で使用されるとき、DNA及び/又はRNAなどの核酸の切断を指す。一部の実施形態において、切断イベントは、本明細書で使用されるとき、本明細書に記載されるCRISPRシステムのヌクレアーゼによって作り出される標的核酸における切断を指す。一部の実施形態において、切断イベントは二本鎖DNA切断である。一部の実施形態において、切断イベントは一本鎖DNA切断である。一部の実施形態において、切断イベントは、コラテラル核酸の切断を指す。
用語「コラテラル核酸」は、本明細書で使用されるとき、活性化したCRISPR複合体によって非特異的に切断される核酸基質を指す。用語「コラテラルDNアーゼ活性」は、本明細書でCRISPRエフェクターに言及して使用されるとき、活性化したCRISPR複合体の非特異的DNアーゼ活性を指す。用語「コラテラルRNアーゼ活性」は、本明細書でCRISPRエフェクターに言及して使用されるとき、活性化したCRISPR複合体の非特異的RNアーゼ活性を指す。
用語「ドナー鋳型核酸」は、本明細書で使用されるとき、本明細書に記載されるCRISPRエフェクターが標的核酸を修飾した後、標的配列又は標的近位配列に、鋳型化された変更を行うために使用できる核酸分子を指す。一部の実施形態において、ドナー鋳型核酸は二本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は一本鎖核酸である。一部の実施形態において、ドナー鋳型核酸は線状である。一部の実施形態において、ドナー鋳型核酸は環状(例えば、プラスミド)である。一部の実施形態において、ドナー鋳型核酸は外因性核酸分子である。一部の実施形態において、ドナー鋳型核酸は内因性核酸分子(例えば、染色体)である。
本明細書で使用される場合、「ポリヌクレオチド」、「ヌクレオチド」、「オリゴヌクレオチド」、及び「核酸」という用語は、DNA、RNA、それらの誘導体、又はそれらの組み合わせを含む核酸を指すために同義的に使用され得る。当業者に周知の方法を使用して、本発明による遺伝子発現構築物及び組換え細胞を構築することができる。これらの方法としては、インビトロ組換えDNA技術、合成技術、インビボ組換え技術、及びポリメラーゼ連鎖反応(PCR)技術が挙げられる。例えば、Maniatis et al.,1989,MOLECULAR CLONING:A LABORATORY MANUAL,Cold Spring Harbor Laboratory,New York;Ausubel et al.,1989,CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Greene Publishing Associates and Wiley Interscience,New York、及びPCR Protocols:A Guide to Methods and Applications (Innis et al.,1990,Academic Press,San Diego,Calif.)に記載される技術を参照されたい。
用語「遺伝子修飾」又は「遺伝子エンジニアリング」は、広義には、細胞のゲノム又は核酸の操作を指す。同様に、用語「遺伝子エンジニアリングされた」及び「エンジニアリングされた」は、操作されたゲノム又は核酸を含む細胞を指す。遺伝子修飾の方法としては、例えば、異種遺伝子発現、遺伝子又はプロモーターの挿入又は欠失、核酸変異、遺伝子発現又は不活性化の変化、酵素エンジニアリング、定向進化、知識ベースの設計、ランダム突然変異誘発法、遺伝子シャッフリング、及びコドン最適化が挙げられる。
用語「組換え」は、核酸、タンパク質、又は細胞が遺伝子修飾、エンジニアリング、又は組換えの産物であることを示す。一般に、用語「組換え」は、複数の供給源に由来する遺伝物質を含むか、又はそれらによってコードされる、核酸、タンパク質、又は細胞を指す。本明細書で使用されるとき、用語「組換え」という用語はまた、内因性核酸又はタンパク質の変異型を含む、変異核酸又はタンパク質を含む細胞を説明するために使用され得る。用語「組換え細胞」及び「組換え宿主」は、同義的に使用することができる。一部の実施形態において、組換え細胞は、本明細書に開示されるCRISPRエフェクターを含む。一部の実施形態において、本明細書に開示されるCRISPRエフェクターは、自己プロセシングである。CRISPRエフェクターは組換え細胞における発現のためにコドン最適化することができる。一部の実施形態において、本明細書に開示される組換え細胞は、RNAガイドを更に含む。一部の実施形態において、本明細書に開示される組換え細胞のRNAガイドは、tracrRNAを含む。一部の実施形態において、本明細書に開示される組換え細胞のRNAガイドは、tracrRNAを含まない。一部の実施形態において、組換え細胞は、大腸菌(E.coli)細胞などの原核細胞である。一部の実施形態において、組換え細胞は、ヒト細胞を含む哺乳動物細胞などの真核細胞である。
本明細書で使用されるとき、用語「プロトスペーサー隣接モチーフ」又は「PAM」は、エフェクター及びRNAガイドを含む複合体が結合する標的配列に隣接するDNA配列を指す。一部の実施形態において、酵素活性のためにPAMが必要である。本明細書で使用されるとき、用語「隣接」は、複合体のRNAガイドが、PAMに直接隣接する標的配列に特異的に結合、相互作用、又は会合する場合を含む。このような場合、標的配列とPAMの間にヌクレオチドは存在しない。用語「隣接」はまた、標的化部分が結合する標的配列とPAMとの間に少数(例えば、1つ、2つ、3つ、4つ、又は5つ)のヌクレオチドが存在する場合を含む。
CLUST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059の同定
この出願は、本明細書において「CLUST.133120」、「CLUST.099129」、「CLUST.342201」、「CLUST.195009」、及び「CLUST.057059」と呼ばれる新規タンパク質ファミリーの同定、エンジニアリング、及び使用に関する。
図2に示すように、CLUST.133120のタンパク質は、3つのRuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)及びZnフィンガードメインを含む。表2に示すように、CLUST.133120のエフェクターのサイズは、約400アミノ酸~約800アミノ酸の範囲である。
図16に示すように、CLUST.099129のタンパク質は、3つのRuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)を含む。表9に示すように、CLUST.099129のエフェクターのサイズは、約500アミノ酸~約700アミノ酸の範囲である。
図30A、図30B、及び図30Cに示すように、CLUST.342201のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)及びZnフィンガードメインを含む。表16に示すように、CLUST.342201のエフェクターのサイズは、約300~約650アミノ酸の範囲である。一部の実施形態において、約600アミノ酸のCLUST.342201エフェクター(例えば、配列番号334~336、338、又は339に記載されるアミノ酸配列を有するエフェクター)は、図30Aに示される構成を有する。一部の実施形態において、約400アミノ酸又は約400アミノ酸未満のCLUST.342201エフェクターは、図30B又は図30にC示される構成を有する。例えば、配列番号302、303、308、309、310、311、316、324、325、330、331、及び337に記載される配列を有するエフェクターは、図30Bに示される構成を有し得、配列番号301、304、306、307、312~315、317~319、326~329、332、333、340、又は341に記載される配列を有するエフェクターは、図30Cに示される構成を有し得る。したがって、約400アミノ酸又は約400アミノ酸未満のCLUST.342201エフェクターは、エフェクターのC末端にRuvC IIIドメインを有する。
図34に示すように、CLUST.195009のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)及びZnフィンガードメインを含む。表22に示すように、CLUST.195009のエフェクターのサイズは、約450アミノ酸~約600アミノ酸の範囲である。
図41に示すように、CLUST.057059のタンパク質は、RuvCドメイン(RuvC I、RuvC II、及びRuvC IIIと表示される)及びZnフィンガードメインを含む。表28に示すように、CLUST.057059のエフェクターのサイズは、約350~約700アミノ酸の範囲である。
したがって、以下に示すように、CLUST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059のエフェクターは、当技術分野で知られているエフェクターよりも有意に小さい。例えば、表1を参照されたい。
Figure 2022546701000001
CLUST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059のエフェクターは、他の特定の機能との強力な共出現パターンを呈するタンパク質を検索及び同定するために、計算方法及びアルゴリズムを使用して同定された。特定の実施形態において、これらの計算的方法は、CRISPRアレイにごく近接して共出現するタンパク質を同定することに関するものであった。本明細書に開示される方法は、非コード及びタンパク質コードの両方の(例えば、細菌遺伝子座の非コード範囲にあるファージ配列の断片;又はCRISPR Cas1タンパク質)、他の特徴にごく近接した範囲内に天然に出現するタンパク質の同定においても有用である。本明細書に記載される方法及び計算は1つ以上の計算装置で実施されてもよいことが理解される。
ゲノム又はメタゲノムデータベースから一組のゲノム配列が入手された。データベースは、ショートリード、又はコンティグレベルデータ、又はアセンブルされたスキャフォールド、又は生物の完全ゲノム配列を含んだ。同様に、データベースは、原核生物、若しくは真核生物からのゲノム配列データを含んでもよく、又はメタゲノム環境試料からのデータを含んでもよい。データベースリポジトリの例としては、国立バイオテクノロジー情報センター(National Center for Biotechnology Information:NCBI)のRefSeq、NCBIのGenBank、NCBIの全ゲノムショットガン(Whole Genome Shotgun:WGS)、及びジョイントゲノム研究所(Joint Genome Institute:JGI)の統合微生物ゲノム(Integrated Microbial Genomes:IMG)が挙げられる。
一部の実施形態において、指定される最小長さのゲノム配列データの選択には、最小サイズ要件が課される。特定の例示的実施形態において、最小コンティグ長さは、100ヌクレオチド、500nt、1kb、1.5kb、2kb、3kb、4kb、5kb、10kb、20kb、40kb、又は50kbであってもよい。
一部の実施形態において、公知の又は予測されるタンパク質は、完全な又は選択された一組のゲノム配列データから抽出される。一部の実施形態において、公知の又は予測されるタンパク質は、ソースデータベースによって提供されるコード配列(CDS)アノテーションを抽出することから取られる。一部の実施形態において、予測タンパク質は、計算的方法を適用してヌクレオチド配列からタンパク質を同定することにより決定される。一部の実施形態では、GeneMarkスイートを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、Prodigalを使用してゲノム配列からタンパク質が予測される。一部の実施形態では、同じ一組の配列データに対して複数のタンパク質予測アルゴリズムが用いられ、得られる一組のタンパク質から重複が排除されてもよい。
一部の実施形態において、CRISPRアレイはゲノム配列データから同定される。一部の実施形態では、PILER-CRを使用してCRISPRアレイが同定される。一部の実施形態では、CRISPR認識ツール(CRISPR Recognition Tool:CRT)を使用してCRISPRアレイが同定される。一部の実施形態において、CRISPRアレイは、最小限の回数(例えば2、3、又は4回)繰り返されるヌクレオチドモチーフを同定する発見的手法によって同定され、ここで繰り返されるモチーフの連続する出現間の間隔は、指定される長さ(例えば、50、100、又は150ヌクレオチド)を超えない。一部の実施形態では、同じ一組の配列データに対して複数のCRISPRアレイ同定ツールが用いられ、得られる一組のCRISPRアレイから重複が排除されてもよい。
一部の実施形態において、CRISPRアレイ(本明細書では「CRISPR近位タンパク質クラスター」と呼ばれる)にごく近接しているタンパク質が同定される。一部の実施形態において、近接性はヌクレオチド距離として定義され、20kb、15kb、又は5kb以内であってもよい。一部の実施形態において、近接性は、タンパク質とCRISPRアレイとの間にあるオープンリーディングフレーム(ORF)の数として定義され、特定の例示的距離は、10、5、4、3、2、1、又は0個のORFであり得る。CRISPRアレイとごく近接した範囲内にあると同定されたタンパク質は、次に相同タンパク質クラスターにまとめられる。一部の実施形態において、blastclustを使用してCRISPR近位タンパク質クラスターが形成される。特定の他の実施形態において、mmseqs2を使用してCRISPR近位タンパク質クラスターが形成される。
CRISPR近接タンパク質クラスターのメンバー間に強力な共出現パターンを確立するため、予め編成された完全な一組の公知の及び予測されるタンパク質に対してタンパク質クラスターの各メンバーのBLAST検索が実施されてもよい。一部の実施形態では、UBLAST又はmmseqs2を使用して類似のタンパク質が検索されてもよい。一部の実施形態では、ファミリー内のタンパク質の代表的なサブセットについてのみ検索が実施されてもよい。
一部の実施形態では、CRISPR近接タンパク質クラスターがメトリックによって順位付けされるか又はフィルタリングされることにより共出現が決定される。1つの例示的メトリックは、特定のE値閾値に至るまでのBLASTマッチの数に対するタンパク質クラスター内の要素の数の比である。一部の実施形態では、一定のE値閾値が使用されてもよい。他の実施形態では、E値閾値は、タンパク質クラスターの最も離れたメンバーによって決定されてもよい。一部の実施形態において、大域的な一組のタンパク質がクラスター化され、共出現メトリックは、含まれる1つ又は複数の大域的クラスターの要素の数に対するCRISPR近接タンパク質の要素の数の比である。
一部の実施形態において、手動でのレビュープロセスを用いることにより、クラスター中のタンパク質の天然に存在する遺伝子座構造に基づいてエンジニアリングされるシステムの潜在的機能性及び最小限の一組の成分が評価される。一部の実施形態において、手動でのレビューにはタンパク質クラスターの図解表現が役立ち得るとともに、これは、ペアワイズでの配列類似性、系統樹、供給源生物/環境、予測される機能性ドメイン、及び遺伝子座構造の図解描写を含む情報を含み得る。一部の実施形態において、遺伝子座構造の図解描写は、高い代表性を有する近隣タンパク質ファミリーをフィルタリングし得る。一部の実施形態において、代表性は、含んでいる1つ又は複数の大域的クラスターの1つ又は複数のサイズに対する関連する近隣タンパク質の数の比によって計算されてもよい。特定の例示的実施形態において、タンパク質クラスターの図解表現は、天然に存在する遺伝子座のCRISPRアレイ構造の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、推定CRISPRアレイの長さに対する保存されたダイレクトリピートの数、又は推定CRISPRアレイの長さに対するユニークなスペーサー配列の数の描写を含み得る。一部の実施形態において、タンパク質クラスターの図解表現は、CRISPRアレイとの推定エフェクターの様々な共出現メトリックの描写を含み、新規CRISPR-Casシステムを予測し、及びその成分を同定し得る。
CLUST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059のプール型スクリーニング
本明細書で同定された、エンジニアリングされたCLUST.133120 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例2で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。
本明細書で同定された、エンジニアリングされたCLUST.099129 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例5で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。
本明細書で同定された、エンジニアリングされたCLUST.342201 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例10で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。
本明細書で同定された、エンジニアリングされたCLUST.195009 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例12で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。
本明細書で同定された、エンジニアリングされたCLUST.057059 CRISPR-Casシステムの活性、メカニズム、及び機能パラメータを効率的に検証するために、実施例14で説明されるように、大腸菌(E.coli)におけるプール型スクリーニングアプローチを使用した。
第一に、CRIST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059CRISPR-Casシステムの保存タンパク質及び非コードエレメントの計算的同定から、DNA合成及び分子クローニングを用いて個別の成分を単一の人工発現ベクター(一実施形態ではpET-28a+骨格をベースとする)にアセンブルする。第2の実施形態では、エフェクター及び非コードエレメントをmRNA転写物に転写し、異なるリボソーム結合部位を用いて個々のエフェクターを翻訳する。
第二に、天然のcrRNA及びターゲティングスペーサーを、第2のプラスミドpACYC184を標的化する非天然スペーサーを含むプロセシングされていないcrRNAのライブラリに置き換える。このcrRNAライブラリをエフェクター及び非コードエレメントを含むベクター骨格(例えばpET-28a+)にクローニングし、その後、続いてこのライブラリをpACYC184プラスミド標的と共に大腸菌(E.coli)に形質転換する。結果的に、得られる各大腸菌(E.coli)細胞は、ただ1つのターゲティングアレイを含む。代替的実施形態では、非天然スペーサーを含むプロセシングされていないcrRNAのライブラリが、Baba et al.(2006)Mol.Syst.Biol.2:2006.0008;及びGerdes et al.(2003)J.Bacteriol.185(19):5673-84(これらの各々の内容全体は参照により本明細書に援用される)に記載されるものなどの資料から引用される大腸菌(E.coli)必須遺伝子を更に標的化する。この実施形態において、必須遺伝子機能を破壊する新規CRISPR-Casシステムの正の標的化された活性は、細胞死又は成長停止を生じさせる。一部の実施形態において、必須遺伝子ターゲティングスペーサーをpACYC184標的と組み合わせることができる。
第三に、抗生物質選択下で大腸菌(E.coli)を成長させる。一実施形態において、三重抗生物質選択:エンジニアリングされたCRISPRエフェクターシステムを含むpET-28a+ベクターの形質転換の成功を確認するためのカナマイシン、並びにpACYC184標的ベクターの同時形質転換の成功を確認するためのクロラムフェニコール及びテトラサイクリンが用いられる。pACYC184は通常、クロラムフェニコール及びテトラサイクリンに対する耐性を付与するため、抗生物質選択下では、このプラスミドを標的化する新規CRISPR-Casシステムの正の活性により、エフェクター、非コードエレメント、及びcrRNAライブラリの特異的活性エレメントを活性に発現する細胞が排除されることになる。典型的には、生存細胞の集団は、形質転換の12~14時間後に分析される。一部の実施形態において、生存細胞の分析は、形質転換後6~8時間、形質転換後8~12時間、形質転換後最大24時間、又は形質転換後24時間を超えて、行われる。早い時点と比較した後の時点における生存細胞集団を調べると、不活性crRNAと比較してシグナルの枯渇が生じる。
一部の実施形態において、二重抗生物質選択が用いられる。クロラムフェニコール又はテトラサイクリンのいずれかを抜き取って選択圧を除去すると、ターゲティング基質、配列特異性、及び効力に関する新規情報を得ることができる。例えば、選択された遺伝子又は選択されていない遺伝子におけるdsDNAの切断により、選択された遺伝子及び選択されていない遺伝子の両方の枯渇が観察される大腸菌(E.coli)におけるネガティブ選択が生じ得る。CRISPR-Casシステムが転写又は翻訳に干渉する場合(例えば、結合又は転写物の切断によって)、選択は、選択されていない耐性遺伝子というよりむしろ、選択された耐性遺伝子の標的に対してのみ観察される。
一部の実施形態では、カナマイシンのみを使用して、エンジニアリングされたCRISPR-Casシステムを含むpET-28a+ベクターの形質転換の成功が確認される。この実施形態は、成長の変化を観察するためにカナマイシン以外の更なる選択が必要ないため、大腸菌(E.coli)必須遺伝子を標的化するスペーサーを含むライブラリに好適である。この実施形態では、クロラムフェニコール及びテトラサイクリン依存性が取り除かれ、ライブラリ中のそれらの標的(存在する場合)が、ターゲティング基質、配列特異性、及び効力に関するネガティブ又はポジティブの更なる情報源を提供する。
pACYC184プラスミドは、CRISPR-Casシステムの活性に影響を及ぼし得る多様な一組の特徴及び配列を含むため、プール型スクリーンからの活性crRNAをpACYC184にマッピングすることにより、種々の活性機構及び機能パラメータを示唆するものであり得る活性パターンが提供される。このようにして、異種原核生物種における新規CRISPR-Casシステムの再構成に必要な特徴をより包括的に試験し、研究することができる。
本明細書に記載されるインビボプール型スクリーンの重要な利点としては、以下が挙げられる:
(1)汎用性-プラスミド設計により、複数のエフェクター及び/又は非コードエレメントを発現させることが可能になる;ライブラリクローニング戦略により、計算的に予測されたcrRNAの両方の転写方向の発現が実現する;
(2)活性機構及び機能パラメータの包括的試験により、核酸切断を含めた多様な干渉機構を評価し;転写、プラスミドDNA複製などの特徴の共出現;及びcrRNAライブラリについてのフランキング配列を調べて、4Nの複雑さ等価のPAMを確実に決定することができる;
(3)感度-pACYC184は低コピープラスミドであり、僅かな干渉率であっても、プラスミドによってコードされる抗生物質耐性を除去することができるため、CRISPR-Cas活性について高感度を実現する;及び
(4)効率-RNAシーケンシングについてより高い速度及びスループットを実現する最適化された分子生物学ステップは、タンパク質発現試料をスクリーンにおける生存細胞から直接採取することができる。
このインビボプール型スクリーンを用いてその作動可能なエレメント、機構及びパラメータ、並びにその内因性細胞環境の外部でエンジニアリングされたシステムにおいて活性であり再プログラム化されるその能力を評価することにより、本明細書に記載される新規CRIST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059CRISPR-Casファミリーを評価した。
CRISPRエフェクターの活性及び修飾
一部の実施形態において、CRIST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059のCRISPRエフェクター及びRNAガイドは、他の成分を含み得る二元複合体を形成する。二元複合体は、RNAガイド中のスペーサー配列に相補的な核酸基質(即ち、配列特異的基質又は標的核酸)への結合時に活性化される。一部の実施形態において、配列特異的基質は二本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖DNAである。一部の実施形態において、配列特異的基質は一本鎖RNAである。一部の実施形態において、配列特異的基質は二本鎖RNAである。一部の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の完全な一致を必要とする。他の実施形態において、配列特異性は、RNAガイド(例えば、crRNA)中のスペーサー配列と標的基質の部分的な(連続的又は非連続的な)一致を必要とする。
一部の実施形態において、二元複合体は標的基質への結合時に活性化した状態になる。一部の実施形態において、活性化した複合体は、「複数回の代謝回転」活性を呈し、したがって標的基質への作用時(例えば、それの切断時)、活性化した複合体は活性化した状態のままである。一部の実施形態において、活性化した二元複合体は「単回の代謝回転」活性を呈し、したがって標的基質への作用時、二元複合体は不活性状態に戻る。一部の実施形態において、活性化した二元複合体は非特異的な(即ち、「コラテラル」)切断活性を呈し、したがって複合体は非標的核酸を切断する。一部の実施形態において、非標的核酸は、DNA分子(例えば、一本鎖又は二本鎖DNA)である。一部の実施形態において、非標的核酸は、RNA分子(例えば、一本鎖又は二本鎖RNA)である。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、Hisタグ、GSTタグ、FLAGタグ、又はmycタグを含めた1つ以上のペプチドタグに融合することができる。一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、蛍光タンパク質(例えば、緑色蛍光タンパク質又は黄色蛍光タンパク質)など、検出可能部分に融合することができる。一部の実施形態において、本開示のCRISPRエフェクター及び/又はアクセサリータンパク質は、タンパク質を組織、細胞、又は細胞の領域に侵入又は局在化させるペプチド又は非ペプチド部分に融合される。例えば、本開示のCRISPRエフェクターは、SV40(シミアンウイルス40)NLS、c-Myc NLS、又は他の好適な単節型NLSなどの核局在化配列(NLS)を含んでもよい。NLSは、CRISPRエフェクターのN末端及び/又はC末端に融合されてもよく、且つ単独で融合されても(即ち、単一のNLS)、又はコンカテマー化されてもよい(例えば、2、3、4個等のNLSの鎖)。
一部の実施形態において、少なくとも1つの核外輸送シグナル(NES)が、CRISPRエフェクターをコードする核酸配列に取り付けられている。一部の実施形態において、C末端及び/又はN末端NLS又はNESは、真核細胞、例えばヒト細胞における最適な発現及び核ターゲティングのために取り付けられる。
CRISPRエフェクターにタグが融合される実施形態において、かかるタグは、例えば、液体クロマトグラフィー又は固定化したアフィニティー若しくはイオン交換試薬を利用するビーズ分離による、CRISPRエフェクターの親和性ベース又は電荷ベースの精製を促進し得る。非限定的な例として、本開示の組換えCRISPRエフェクターはポリヒスチジン(His)タグを含み、精製のため、固定化された金属イオンを含むクロマトグラフィーカラムにロードされる(例えば、樹脂上に固定化されたキレートリガンドによってキレートされたZn2+、Ni2+、Cu2+イオン、この樹脂は、個々に調製された樹脂又は市販の樹脂若しくはGE Healthcare Life Sciences、Marlborough,Massachusettsによって商品化されているHisTrap FFカラムなどの既製のカラムであってもよい。ローディングステップの後、カラムは任意選択で、例えば1つ以上の好適な緩衝溶液を使用してリンスされ、次にHisタグが付加されたタンパク質が好適な溶出緩衝液を使用して溶出される。それに代えて又は加えて、本開示の組換えCRISPRエフェクターがFLAGタグを利用する場合、かかるタンパク質は、本業界で公知の免疫沈降法を用いて精製されてもよい。タグが付加された本開示のCRISPRエフェクター又はアクセサリータンパク質について他の好適な精製方法が当業者には明らかであろう。
本明細書に記載されるタンパク質(例えば、CRISPRエフェクター又はアクセサリータンパク質)は、核酸分子又はポリペプチドのいずれとしても送達又は使用することができる。核酸分子を使用する場合、CRISPRエフェクターをコードする核酸分子をコドン最適化することができる。核酸は、任意の目的の生物、詳細にはヒト細胞又は細菌での使用にコドン最適化することができる。例えば、核酸は、マウス、ラット、ウサギ、イヌ、家畜、又は非ヒト霊長類を含めた任意の非ヒト真核生物向けにコドン最適化することができる。コドン使用表が、例えば、www.kazusa.orjp/codon/で利用可能な「コドン使用データベース(Codon Usage Database)」において容易に利用可能であり、これらの表を幾つもの方法で適合させることができる。Nakamura et al.Nucl.Acids Res.28:292(2000)(全体として参照により本明細書に援用される)を参照のこと。特定の配列を特定の宿主細胞での発現にコドン最適化するためのコンピュータアルゴリズムもまた、Gene Forge(Aptagen;Jacobus,PA)など、利用可能である。
一部の例では、真核生物(例えば、ヒト、又は他の哺乳類細胞)細胞で発現させるためのCRISPRエフェクターをコードする本開示の核酸は、1つ以上のイントロン、即ち、第1の端部(例えば、5’末端)にスプライスドナー配列を含み、且つ第2の端部(例えば、3’末端)にスプライスアクセプター配列を含む1つ以上の非コード配列を含む。本開示の様々な実施形態において、限定なしに、シミアンウイルス40(SV40)イントロン、β-グロビンイントロン、及び合成イントロンを含め、任意の好適なスプライスドナー/スプライスアクセプターを使用することができる。それに代えて又は加えて、CRISPRエフェクター又はアクセサリータンパク質をコードする本開示の核酸は、DNAコード配列の3’末端に、ポリアデニル化(ポリA)シグナルなどの転写終結シグナルを含み得る。一部の例では、ポリAシグナルは、SV40イントロンなどのイントロンにごく近接して、又はそれに隣接して位置する。
非活性化/不活性化CRISPRエフェクター
本明細書に記載されるCRISPRエフェクターが、減少したヌクレアーゼ活性、例えば、野生型CRISPRエフェクターと比較したとき少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも97%、又は100%のヌクレアーゼ不活性化となるようにCRISPR酵素を修飾することができる。ヌクレアーゼ活性は、当技術分野で周知の幾つかの方法、例えば、タンパク質のヌクレアーゼドメインへの突然変異の導入によって減少させることができる。一部の実施形態において、ヌクレアーゼ活性の触媒残基が同定され、それらのアミノ酸残基を異なるアミノ酸残基(例えば、グリシン又はアラニン)に置換することによりヌクレアーゼ活性を減少させてもよい。
不活性化されたCRISPRエフェクターは、1つ以上の機能的ドメインを含むか、又はそれと関連づけられ得る(例えば、融合タンパク質、リンカーペプチド、「GS」リンカーなどを介して)。こうした機能性ドメインは様々な活性、例えば、メチラーゼ活性、デメチラーゼ活性、転写活性化活性、転写抑制活性、転写放出因子活性、ヒストン修飾活性、RNA切断活性、DNA切断活性、核酸結合活性、及びスイッチ活性(例えば、光誘導性)を有することができる。一部の実施形態において、機能性ドメインは、クルッペル関連ボックス(KRAB)、VP64、VP16、Fok1、P65、HSF1、MyoD1、及びビオチン-APEXである。
不活性化されたCRISPRエフェクター上に1つ以上の機能性ドメインを位置させることは、その機能性ドメインが帰属する機能的効果による影響を標的に及ぼすのに正しい空間上の向きとなることを可能にする。例えば、機能性ドメインが転写活性化因子(例えば、VP16、VP64、又はp65)である場合、その転写活性化因子は、それが標的の転写に影響を及ぼすことが可能になる空間上の向きに置かれる。同様に、転写リプレッサーが標的の転写に影響を及ぼすように位置し、及びヌクレアーゼ(例えば、Fok1)が標的を切断又は部分的に切断するように位置する。一部の実施形態において、機能性ドメインはCRISPRエフェクターのN末端に位置する。一部の実施形態において、機能性ドメインはCRISPRエフェクターのC末端に位置する。一部の実施形態において、不活性化されたCRISPRエフェクターは、N末端に第1の機能性ドメイン及びC末端に第2の機能性ドメインを含むように修飾される。
スプリット酵素
本開示はまた、本明細書に記載されるCRISPRエフェクターのスプリットバージョンも提供する。スプリットバージョンのCRISPRエフェクターは送達に有利であり得る。一部の実施形態において、CRISPRエフェクターは酵素の2つの部分に分割され、それらが一緒になって実質的に機能性のCRISPRエフェクターを含む。
分割は、1つ又は複数の触媒ドメインが影響を受けないような方法で行われ得る。CRISPRエフェクターはヌクレアーゼとして機能してもよく、又は本質的に(例えば、その触媒ドメインにある1つ又は複数の突然変異に起因して)触媒活性がごく僅かしかない又は全くないRNA結合タンパク質である不活性化された酵素であってもよい。
一部の実施形態では、ヌクレアーゼローブ及びα-ヘリックスローブが別個のポリペプチドとして発現する。これらのローブはそれ自体には相互作用を及ぼさないが、RNAガイドがそれらを複合体へと動員し、その複合体が完全長CRISPRエフェクターの活性を再現し、部位特異的DNA切断を触媒する。修飾されたRNAガイドを使用すると、二量化が妨げられることによりスプリット酵素活性が無効になり、誘導性の二量化システムの開発が可能となる。スプリット酵素については、例えば、Wright et al.“Rational design of a split-Cas9 enzyme complex,”Proc.Nat’l.Acad.Sci.,112.10(2015):2984-2989(全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、スプリット酵素は、例えばラパマイシン感受性二量化ドメインを利用することにより、二量化パートナーに融合されてもよい。これにより、CRISPRエフェクター活性を時間的に制御するための化学誘導性CRISPRエフェクターの作成が可能になる。このようにして2つの断片に分割されていることによりCRISPRエフェクターを化学誘導性にすることができ、CRISPRエフェクターの制御された再アセンブルにはラパマイシン感受性二量化ドメインを使用することができる。
分割点は、典型的にはインシリコで設計され、コンストラクトにクローニングされる。この過程でスプリット酵素に突然変異が導入されてもよく、非機能性ドメインが除去されてもよい。一部の実施形態において、スプリットCRISPRエフェクターの2つの部分又は断片(即ち、N末端及びC末端断片)は、例えば野生型CRISPRエフェクターの配列の少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は少なくとも99%を含む完全なCRISPRエフェクターを形成することができる。
自己活性化型又は不活性化型酵素
本明細書に記載されるCRISPRエフェクターは、自己活性化型又は自己不活性化型であるように設計されてもよい。一部の実施形態において、CRISPRエフェクターは自己不活性化型である。例えば、CRISPRエフェクターをコードするコンストラクトに標的配列を導入することができる。したがってCRISPRエフェクターが標的配列を切断するとともに、それによって酵素をコードするコンストラクトがその発現を自己不活性化し得る。自己不活性化CRISPRシステムの構築方法については、例えば、Epstein et al.,“Engineering a Self-Inactivating CRISPR System for AAV Vectors,”Mol.Ther.,24(2016):S50(全体として参照により本明細書に援用される)に記載されている。
一部の他の実施形態では、弱いプロモーター(例えば、7SKプロモーター)の制御下で発現する更なるRNAガイドが、CRISPRエフェクターをコードする核酸配列を標的化して、その発現を(例えば、核酸の転写及び/又は翻訳を妨げることにより)妨げ及び/又は阻止することができる。CRISPRエフェクターと、RNAガイドと、CRISPRエフェクターをコードする核酸を標的化するRNAガイドとを発現するベクターを細胞にトランスフェクトすると、CRISPRエフェクターをコードする核酸の効率的な破壊につながり、CRISPRエフェクターレベルを低下させることができ、したがってゲノム編集活性を制限することができる。
一部の実施形態において、CRISPRエフェクターのゲノム編集活性は、哺乳類細胞における内因性RNAシグネチャ(例えば、miRNA)を通じて調節することができる。CRISPRエフェクターをコードするmRNAの5’-UTRにmiRNA相補配列を用いることにより、CRISPRエフェクタースイッチを作ることができる。このスイッチは、標的細胞中のmiRNAに選択的且つ効率的に応答する。したがって、このスイッチは、異種細胞集団内で内因性miRNA活性を感知することによりゲノム編集を差次的に制御し得る。したがって、このスイッチシステムは、細胞内miRNA情報に基づく細胞型選択的なゲノム編集及び細胞エンジニアリングのフレームワークを提供し得る(Hirosawa et al.“Cell-type-specific genome editing with a microRNA-responsive CRISPR-Cas9 switch,”Nucl.Acids Res.,2017 Jul 27;45(13):e118)。
誘導性CRISPRエフェクター
CRISPRエフェクターは、誘導性、例えば、光誘導性又は化学誘導性であってもよい。この機構により、CRISPR酵素中の機能性ドメインを活性化させることが可能になる。光誘導能は、当該技術分野において公知の様々な方法により、例えば、スプリットCRISPRエフェクターにおいてCRY2PHR/CIBN対が用いられる融合複合体を設計することにより実現し得る(例えば、Konermann et al.“Optical control of mammalian endogenous transcription and epigenetic states,”Nature,500.7463(2013):472を参照のこと)。化学誘導能は、例えば、スプリットCRISPRエフェクターにおいてFKBP/FRB(FK506結合タンパク質/FKBPラパマイシン結合ドメイン)対が用いられる融合複合体を設計することにより実現し得る。ラパマイシンは融合複合体の形成に必要であり、したがってCRISPRエフェクターを活性化する(例えば、Zetsche et al.“A split-Cas9 architecture for inducible genome editing and transcription modulation,”Nature Biotech.,33.2(2015):139-142を参照のこと)。
更に、CRISPRエフェクターの発現は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。RNAとして送達される場合、RNAターゲティングエフェクタータンパク質の発現は、小分子様テトラサイクリンを感知することのできるリボスイッチによって調節されてもよい(例えば、Goldfless et al.“Direct and specific chemical control of eukaryotic translation with a synthetic RNA-protein interaction,”Nucl.Acids Res.,40.9(2012):e64-e64を参照のこと)。
誘導性CRISPRエフェクター及び誘導性CRISPRシステムの様々な実施形態が、例えば、米国特許第8871445号明細書、米国特許出願公開第20160208243号明細書、及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
機能性突然変異
本明細書に記載されるとおりのCRISPRエフェクターに様々な突然変異又は修飾を導入して特異性及び/又はロバスト性を改善することができる。一部の実施形態において、プロトスペーサー隣接モチーフ(PAM)を認識するアミノ酸残基が同定される。本明細書に記載されるCRISPRエフェクターは、例えば、PAMを認識するアミノ酸残基を他のアミノ酸残基に置換することにより、異なるPAMを認識するように更に修飾されてもよい。
一部の実施形態において、CRISPRエフェクターは、例えば、5’-TTN-3’、又は5’-TN-3’ PAMを認識することができ、ここで、「N」は任意のヌクレオチドである。
一部の実施形態において、CRISPRエフェクターは、例えば、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’を認識することができ、ここで、「N」は任意のヌクレオチドであり、「R」はA又はGである。
一部の実施形態において、CRISPRエフェクターは、例えば、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)を認識することができ、ここで、「D」はA、G、又はTであり、「R」はA又はGである。
一部の実施形態において、CRISPRエフェクターは、例えば、5’-TTN-3’を認識することができ、ここで、「N」は任意のヌクレオチドである。
一部の実施形態において、CRISPRエフェクターは、例えば、5’-GTN-3’を認識することができ、ここで、「N」は任意のヌクレオチドである。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、1つ以上の機能活性が改変され得る。例えば、一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、そのヘリカーゼ活性が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、そのヌクレアーゼ活性(例えば、エンドヌクレアーゼ活性又はエキソヌクレアーゼ活性)が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、RNAガイドと機能的に関連するその能力が改変される。一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、標的核酸と機能的に関連するその能力が改変される。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは標的核酸分子の切断能を有する。一部の実施形態において、CRISPRエフェクターは標的核酸分子の両方の鎖を切断する。しかしながら、一部の実施形態において、CRISPRエフェクターは、1つ以上のアミノ酸残基を突然変異させることにより、その切断活性が改変される。例えば、一部の実施形態において、CRISPRエフェクターは、CRISPRエフェクターが標的核酸を切断する能力を増加させる1つ以上の突然変異を含んでもよい。別の例において、一部の実施形態において、CRISPRエフェクターは、酵素が標的核酸の切断能を有しないものとなる1つ以上の突然変異を含んでもよい。他の実施形態において、CRISPRエフェクターは、この酵素が標的核酸の鎖の切断能(即ち、ニッカーゼ活性)を有するものとなる1つ以上の突然変異を含んでもよい。一部の実施形態において、CRISPRエフェクターは、RNAガイドがハイブリダイズする鎖に相補的な標的核酸の鎖を切断する能力を有する。一部の実施形態において、CRISPRエフェクターは、RNAガイドがハイブリダイズする標的核酸の鎖を切断する能力を有する。
一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、アルギニン部分に変異している。一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、グリシン部分に変異している。一部の実施形態において、本明細書に開示されるCRISPRエフェクターの1つ以上の残基は、本明細書に開示されるCRISPRエフェクターの系統的アラインメントのコンセンサス残基に基づいて変異する。
一部の実施形態において、本明細書に記載されるCRISPRエフェクターは、1つ以上の所望の機能活性(例えば、ヌクレアーゼ活性及び機能的にRNAガイドと相互作用する能力)を保持しつつ酵素のサイズを縮小させるため、1つ以上のアミノ酸残基に欠失を含むようにエンジニアリングされてもよい。このトランケート型CRISPRエフェクターは有利には、負荷に制限のある送達システムとの組み合わせで用いられてもよい。
一態様において、本開示は、図2に示されるドメイン構成を維持しつつ、本明細書(例えば、配列番号1~50のいずれか)に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図2に示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一態様において、本開示は、図16に示されるドメイン構成を維持しつつ、本明細書(例えば、配列番号101~145のいずれか)に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図16に示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一態様において、本開示は、図30A、図30B、又は図30Cに示されるドメイン構成を維持しつつ、本明細書(例えば、配列番号301~341のいずれか)に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図30A、30B、又は30Cに示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一態様において、本開示は、図34に示されるドメイン構成を維持しつつ、本明細書(例えば、配列番号501~521のいずれか)に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図34に示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。
一態様において、本開示は、図41に示されるドメイン構成を維持しつつ、本明細書(例えば、配列番号601~682のいずれか)に記載される核酸配列(nucleic sequences)と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一の核酸配列を提供する。別の態様において、本開示はまた、図41に示されるドメイン構成を維持しつつ、本明細書に記載されるアミノ酸配列と少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、又は99%同一のアミノ酸配列も提供する。一部の実施形態において、核酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。一部の実施形態において、核酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100ヌクレオチド、例えば、連続又は非連続ヌクレオチド)を少なくとも有する。

一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と同じである一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。一部の実施形態において、アミノ酸配列は、本明細書に記載される配列と異なる一部分(例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40、50、60、70、80、90、又は100アミノ酸残基、例えば、連続又は非連続アミノ酸残基)を少なくとも有する。
2つのアミノ酸配列、又は2つの核酸配列のパーセント同一性を決定するには、それらの配列が最適な比較を目的としてアラインメントされる(例えば、最適なアラインメントとなるように第1及び第2のアミノ酸又は核酸配列の一方又は両方にギャップが導入されてもよく、及び比較を目的として非相同配列が無視されてもよい)。一般に、比較を目的としてアラインメントされる参照配列の長さは、参照配列の長さの少なくとも80%でなければならず、及び一部の実施形態では、参照配列の長さの少なくとも90%、95%、又は100%である。次に、対応するアミノ酸位置又はヌクレオチド位置にあるアミノ酸残基又はヌクレオチドが比較される。第1の配列におけるある位置が第2の配列における対応する位置と同じアミノ酸残基又はヌクレオチドによって占有されているとき、次にはそれらの分子は当該の位置において同一である。2つの配列間のパーセント同一性は、2つの配列を最適にアラインメントするために導入する必要があるギャップの数、及び各ギャップの長さを考慮に入れた、それらの配列によって共有される同一の位置の数の関数である。本開示の目的上、配列の比較及び2つの配列間におけるパーセント同一性の決定は、ギャップペナルティーを12、ギャップ伸長ペナルティーを4、及びフレームシフトギャップペナルティーを5としたBlossum 62スコアリング行列を用いて達成することができる。
RNAガイド及びRNAガイド修飾
一部の実施形態において、本明細書に記載されるRNAガイドは、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドは、チミン(T)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、ウラシル(U)を含む。一部の実施形態において、本明細書に記載されるRNAガイドのダイレクトリピート配列は、チミン(T)を含む。一部の実施形態において、表4、7、11、14、18、24、32、35、又は30によるダイレクトリピート配列は、表4、7、11、14、18、24、32、35、又は30の対応する配列においてチミンとして示される1つ以上(例えば、全て)の場所に、ウラシルを含む配列を含む。
一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイにおいて繰り返される配列の1つのコピーのみを含む。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列である。一部の実施形態において、ダイレクトリピートは、内因性CRISPRアレイに見られる1つ以上のスペーサー配列に隣接する(例えば、フランキング)完全長配列の一部(例えば、プロセシングされた部分)である。
スペーサー及びダイレクトリピート
CLUST.133120
RNAガイドのスペーサー長さは約15~55ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは19ヌクレオチドである。
例示的な完全長のダイレクトリピート配列(例えば、プレcrRNA又はプロセシングされていないcrRNAのダイレクトリピート配列)及び成熟crRNAのダイレクトリピート配列(例えば、プロセシングされたcrRNAのダイレクトリピート配列)を表32に示す。表4も参照されたい。
Figure 2022546701000002
一部の実施形態において、本出願のエフェクターに対応するPAMは、5’-TTN-3’及び5’-TN-3’に示される。本明細書で使用されるとき、Nはそれぞれ、任意のヌクレオチド(例えば、A、G、T、又はC)又はそのサブセット(例えば、R(A又はG)、Y(C又はT)、K(G又はT)、B(G、T、又はC)、H(A、C、又はT)であり得る。
一部の実施形態において、RNAガイドは、tracrRNAを更に含む。一部の実施形態において、tracrRNAは必要でない(例えば、tracrRNAは任意選択である)。一部の実施形態において、tracrRNAは、表5に示される非コード配列の一部である。例えば、一部の実施形態において、任意選択のtracrRNAは、表33の配列である。
Figure 2022546701000003
CLUST.099129
RNAガイドのスペーサー長さは約15~55ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、50~55ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは最大40ヌクレオチドである。表11を参照されたい。
例示的な完全長のダイレクトリピート配列(例えば、プレcrRNA又はプロセシングされていないcrRNAのダイレクトリピート配列)及び成熟crRNAのダイレクトリピート配列(例えば、プロセシングされたcrRNAのダイレクトリピート配列)を表7に示す。表11も参照されたい。
Figure 2022546701000004
一部の実施形態において、本出願のエフェクターに対応するPAMは、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’として記載される。本明細書で使用されるとき、Nはそれぞれ、任意のヌクレオチド(例えば、A、G、T、又はC)又はそのサブセット(例えば、R(A又はG)、Y(C又はT)、K(G又はT)、B(G、T、又はC)、H(A、C、又はT)であり得る。
一部の実施形態において、RNAガイドは、tracrRNAを更に含む。一部の実施形態において、tracrRNAは必要でない(例えば、tracrRNAは任意選択である)。一部の実施形態において、tracrRNAは、表12に示される非コード配列の一部である。例えば、一部の実施形態において、任意選択のtracrRNAは、表8の配列である。
Figure 2022546701000005
CLUST.342201
RNAガイドのスペーサー長さは約12~62ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは約19~40ヌクレオチドの範囲であってもよい。一部の実施形態において、ガイドRNAのスペーサー長さは、少なくとも12ヌクレオチド、少なくとも13ヌクレオチド、少なくとも14ヌクレオチド、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、50~62ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは19ヌクレオチドである。一部の実施形態において、RNAガイドのダイレクトリピート長さは20ヌクレオチド超である。表18を参照されたい。
例示的な完全長のダイレクトリピート配列(例えば、プレcrRNA又はプロセシングされていないcrRNAのダイレクトリピート配列)を表14に示す。表18も参照されたい。
Figure 2022546701000006
一部の実施形態において、本出願のエフェクターに対応するPAMは、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)として記載される。本明細書で使用される場合、RはA又はGに対応し、DはA又はG又はTに対応する。
一部の実施形態において、RNAガイドは、tracrRNAを更に含む。一部の実施形態において、tracrRNAは、表19に示される非コード配列の一部である。例えば、一部の実施形態において、任意選択のtracrRNAは、表15の配列である。
Figure 2022546701000007
Figure 2022546701000008
Figure 2022546701000009
Figure 2022546701000010
CLUST.195009
RNAガイドのスペーサー長さは約15~55ヌクレオチドの範囲であってもよい。RNAガイドのスペーサー長さは約20~39ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、50~55ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは約39ヌクレオチドである。表24を参照されたい。
例示的な完全長のダイレクトリピート配列(例えば、プレcrRNA又はプロセシングされていないcrRNAのダイレクトリピート配列)を表20に示す。表24も参照されたい。
Figure 2022546701000011
一部の実施形態において、配列番号501のエフェクターに対応する成熟crRNA(例えば、プロセシングされたcrRNAのダイレクトリピート配列)は、CAACAGCCGCGTGGGGCTACTAGTACTGCG(配列番号535)である。
一部の実施形態において、本出願のエフェクターに対応するPAMは、5’-TTN-3’として記載される。本明細書で使用されるとき、Nはそれぞれ、任意のヌクレオチド(例えば、A、G、T、又はC)又はそのサブセット(例えば、R(A又はG)、Y(C又はT)、K(G又はT)、B(G、T、又はC)、H(A、C、又はT)であり得る。
一部の実施形態において、RNAガイドは、tracrRNAを更に含む。一部の実施形態において、tracrRNAは必要でない(例えば、tracrRNAは任意選択である)。一部の実施形態において、tracrRNAは、表25に示される非コード配列の一部である。例えば、一部の実施形態において、任意選択のtracrRNAは、表21の配列である。
Figure 2022546701000012
CLUST.057059
RNAガイドのスペーサー長さは約15~50ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは約20~44ヌクレオチドの範囲であってもよい。一部の実施形態において、RNAガイドのスペーサー長さは、少なくとも15ヌクレオチド、少なくとも16ヌクレオチド、少なくとも17ヌクレオチド、少なくとも18ヌクレオチド、少なくとも19ヌクレオチド、少なくとも20ヌクレオチド、少なくとも21ヌクレオチド、又は少なくとも22ヌクレオチドである。一部の実施形態において、スペーサー長さは、15~17ヌクレオチド、15~23ヌクレオチド、16~22ヌクレオチド、17~20ヌクレオチド、20~24ヌクレオチド(例えば、20、21、22、23、又は24ヌクレオチド)、23~25ヌクレオチド(例えば、23、24、又は25ヌクレオチド)、24~27ヌクレオチド、27~30ヌクレオチド、30~45ヌクレオチド(例えば、30、31、32、33、34、35、40、又は45ヌクレオチド)、30又は35~40ヌクレオチド、41~45ヌクレオチド、45~50ヌクレオチド、又はそれ以上である。
一部の実施形態において、RNAガイドのダイレクトリピート長さは少なくとも16ヌクレオチドであり、又は16~20ヌクレオチド(例えば、16、17、18、19、又は20ヌクレオチド)である。一部の実施形態において、RNAガイドのダイレクトリピート長さは19ヌクレオチドである。一部の実施形態において、RNAガイドのダイレクトリピート長さは20ヌクレオチド超である。表30を参照されたい。
例示的な完全長のダイレクトリピート配列(例えば、プレcrRNA又はプロセシングされていないcrRNAのダイレクトリピート配列)を表26に示す。表30も参照されたい。
Figure 2022546701000013
一部の実施形態において、本出願のエフェクターに対応するPAMは、5’-GTN-3’として記載される。本明細書で使用されるとき、Nはそれぞれ、任意のヌクレオチド(例えば、A、G、T、又はC)又はそのサブセット(例えば、R(A又はG)、Y(C又はT)、K(G又はT)、B(G、T、又はC)、H(A、C、又はT)であり得る。
一部の実施形態において、RNAガイドは、tracrRNAを更に含む。一部の実施形態において、tracrRNAは必要でない(例えば、tracrRNAは任意選択である)。一部の実施形態において、tracrRNAは、表31に示される非コード配列の一部である。例えば、一部の実施形態において、任意選択のtracrRNAは、表27の配列である。
Figure 2022546701000014
RNAガイド配列は、CRISPR複合体の形成及び標的への結合の成功は許容するが、同時にヌクレアーゼ活性の成功は許容しない(即ち、ヌクレアーゼ活性のない/インデルを生じさせない)ような方法で修飾されてもよい。こうした修飾ガイド配列は、「デッドガイド」又は「デッドガイド配列」と称される。こうしたデッドガイド又はデッドガイド配列はヌクレアーゼ活性の点で触媒的に不活性又はコンホメーション的に不活性であってもよい。デッドガイド配列は、典型的には、活性な切断を生じるそれぞれのガイド配列よりも短い。一部の実施形態において、デッドガイドは、ヌクレアーゼ活性を有するそれぞれのガイドRNAと比べて5%、10%、20%、30%、40%、又は50%短い。RNAガイドのデッドガイド配列は、13~15ヌクレオチド長(例えば、13、14、又は15ヌクレオチド長)、15~19ヌクレオチド長、又は17~18ヌクレオチド長(例えば、17ヌクレオチド長)であってもよい。
従って、一態様において、本開示は、本明細書に記載されるとおりの機能性CLUST.133120、CLUST.099129、CLUST.342201、CLUST.195009、及びCLUST.057059CRISPRエフェクターと、RNAガイドとを含む天然に存在しない又はエンジニアリングされたCRISPRシステムを提供し、ここでRNAガイドはデッドガイド配列を含み、したがってRNAガイドは、検出可能な切断活性なしにCRISPRシステムが細胞の目的のゲノム遺伝子座に向けられるような標的配列へのハイブリダイズ能を有する。デッドガイドの詳細な説明は、例えば、国際公開第2016094872号パンフレット(全体として参照により本明細書に援用される)に記載される。
誘導性RNAガイド
RNAガイドは、誘導性システムの成分として作成することができる。このシステムの誘導可能な性質により、遺伝子編集又は遺伝子発現の時空間的制御が可能となる。一部の実施形態において、誘導性システムの刺激としては、例えば、電磁放射線、音響エネルギー、化学エネルギー、及び/又は熱エネルギーが挙げられる。
一部の実施形態において、RNAガイドの転写は、誘導性プロモーター、例えば、テトラサイクリン又はドキシサイクリン制御下での転写活性化(Tet-On及びTet-Off発現システム)、ホルモン誘導性遺伝子発現システム(例えば、エクジソン誘導性遺伝子発現システム)、及びアラビノース誘導性遺伝子発現システムによって調節することができる。誘導性システムの他の例としては、例えば、小分子2ハイブリッド転写活性化システム(FKBP、ABA等)、光誘導性システム(フィトクロム、LOVドメイン、又はクリプトクロム)、又は光誘導性転写エフェクター(LITE)が挙げられる。これらの誘導性システムは、例えば、国際公開第2016205764号パンフレット及び米国特許第8795965号明細書(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
化学修飾
ガイドRNAのリン酸骨格、糖、及び/又は塩基に化学修飾を適用することができる。ホスホロチオエートなどの骨格修飾はリン酸骨格上の電荷を修飾し、オリゴヌクレオチドの送達及びヌクレアーゼ耐性に役立つ(例えば、Eckstein,“Phosphorothioates,essential components of therapeutic oligonucleotides,”Nucl.Acid Ther.,24(2014),pp.374-387を参照のこと);2’-O-メチル(2’-OMe)、2’-F、及びロックド核酸(LNA)などの糖修飾は、塩基対合及びヌクレアーゼ耐性の両方を亢進させる(例えば、Allerson et al.“Fully 2‘-modified oligonucleotide duplexes with improved in vitro potency and stability compared to unmodified small interfering RNA,”J.Med.Chem.,48.4(2005):901-904を参照のこと)。化学修飾塩基、とりわけ2-チオウリジン又はN6-メチルアデノシンなどは、より強い塩基対合又はより弱い塩基対合のいずれも可能にすることができる(例えば、Bramsen et al.,“Development of therapeutic-grade small interfering RNAs by chemical engineering”Front.Genet.,2012 Aug 20;3:154を参照のこと)。加えて、RNAは、蛍光色素、ポリエチレングリコール、又はタンパク質を含めた種々の機能性部分との5’末端及び3’末端の両方のコンジュゲーションに適している。
化学的に合成されるRNAガイド分子には、幅広い種類の修飾を適用することができる。例えば、オリゴヌクレオチドを2’-OMeで修飾してヌクレアーゼ耐性を改善すると、ワトソン・クリック塩基対合の結合エネルギーを変化させることができる。更には、2’-OMe修飾は、オリゴヌクレオチドがトランスフェクション試薬、タンパク質又は細胞中の任意の他の分子とどのように相互作用するかに影響を及ぼし得る。これらの修飾の効果は経験的試験によって決定することができる。
一部の実施形態において、RNAガイドは1つ以上のホスホロチオエート修飾を含む。一部の実施形態において、RNAガイドは、塩基対合を亢進させること及び/又はヌクレアーゼ耐性を増加させることを目的として1つ以上のロックド核酸を含む。
これらの化学修飾の概要については、例えば、Kelley et al.,“Versatility of chemically synthesized guide RNAs for CRISPR-Cas9 genome editing,”J.Biotechnol.2016 Sep 10;233:74-83;国際公開第2016205764号パンフレット;及び米国特許第8795965号明細書(この各々が全体として参照により援用される)を参照することができる。
配列修飾
本明細書に記載されるRNAガイド、tracrRNA及びcrRNAの配列及び長さは最適化することができる。一部の実施形態において、RNAガイドの最適化された長さは、プロセシングされた形態のtracrRNA及び/若しくはcrRNAを同定することによるか、又はcrRNAのRNAガイドについての経験的な長さ研究によって決定されてもよい。
RNAガイドはまた、1つ以上のアプタマー配列も含むことができる。アプタマーは、特異的な標的分子に結合することのできるオリゴヌクレオチド又はペプチド分子である。アプタマーは、遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であってもよい。一部の実施形態において、アプタマーはタンパク質に特異的であり、次にはそのタンパク質が特異的遺伝子エフェクター、遺伝子アクチベーター、又は遺伝子リプレッサーに特異的であって、それを動員し/それに結合するものであってもよい。エフェクター、アクチベーター、又はリプレッサーは融合タンパク質の形態で存在することができる。一部の実施形態において、RNAガイドは、同じアダプタータンパク質に特異的な2つ以上のアプタマー配列を有する。一部の実施形態において、2つ以上のアプタマー配列は異なるアダプタータンパク質に特異的である。アダプタータンパク質としては、例えば、MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、及びPRR1を挙げることができる。したがって、一部の実施形態において、アプタマーは、本明細書に記載されるとおりのアダプタータンパク質のうちのいずれか1つに特異的に結合する結合タンパク質から選択される。一部の実施形態において、アプタマー配列はMS2ループである。アプタマーの詳細な説明については、例えば、Nowak et al.,“Guide RNA engineering for versatile Cas9 functionality,”Nucl.Acid.Res.,2016 Nov 16;44(20):9555-9564;及び国際公開第2016205764号パンフレット(これらはそれぞれ全体として参照により本明細書に援用される)を参照することができる。
ガイド:標的配列一致要件
CRISPRシステムでは、ガイド配列とその対応する標的配列との間の相補性の程度は、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、又は100%であってもよい。オフターゲット相互作用を減少させるため、例えば、相補性が低い標的配列と相互作用するガイドを減少させるため、CRISPRシステムに突然変異を導入して、CRISPRシステムが標的配列と、80%、85%、90%、又は95%より高い相補性を有するオフターゲット配列との間を区別できるようにしてもよい。一部の実施形態において、相補性の程度は、80%~95%、例えば、約83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、又は95%である(例えば、18ヌクレオチドを有する標的と、1、2、又は3個のミスマッチを有する18ヌクレオチドのオフターゲットとの間を区別する)。したがって、一部の実施形態において、ガイド配列とその対応する標的配列との間の相補性の程度は、94.5%、95%、95.5%、96%、96.5%、97%、97.5%、98%、98.5%、99%、99.5%、又は99.9%より高い。一部の実施形態において、相補性の程度は100%である。
当該分野では、機能性となるのに十分な相補性があるならば、完全な相補性は要件とならないことが公知である。スペーサー/標的に沿ったミスマッチの位置を含め、スペーサー配列と標的配列との間へのミスマッチ、例えば1個以上のミスマッチ、例えば1又は2個のミスマッチの導入により、切断効率の調節を生かすことができる。ミスマッチ、例えば二重ミスマッチが中心寄りに位置するほど(即ち、3’末端又は5’末端にあるのでない);切断効率がより大きい影響を受ける。したがって、スペーサー配列に沿ったミスマッチ位置の選択により、切断効率を調節することができる。例えば、標的の100%未満の切断が(例えば、細胞集団中で)所望される場合、スペーサー配列にスペーサーと標的配列との間の1又は2個のミスマッチを導入してもよい。
CRISPRシステムの使用方法
本明細書に記載されるCRISPRシステムには、非常に多数の細胞型における標的ポリヌクレオチドの修飾(例えば、欠失、挿入、転位、不活性化、又は活性化)を含め、多種多様な有用性がある。このCRISPRシステムは、例えば、DNA/RNA検出(例えば、特異的高感度酵素レポーターアンロッキング(specific high sensitivity enzymatic reporter unlocking:SHERLOCK))、核酸の追跡及び標識、エンリッチメントアッセイ(バックグラウンドからの所望の配列の抽出)、循環腫瘍DNAの検出、次世代ライブラリの調製、薬物スクリーニング、疾患診断及び予後判定、及び様々な遺伝的障害の治療において、幅広い範囲にわたる適用を有する。
DNA/RNA検出
一態様において、本明細書に記載されるCRISPRシステムは、DNA/RNA検出において使用することができる。シングルエフェクターRNA誘導型DNアーゼをCRISPR RNA(crRNA)で再プログラム化することにより、特異的一本鎖DNA(ssDNA)センシング用のプラットフォームがもたらされ得る。そのDNA標的の認識時、活性化したV型単一エフェクターDNAガイドDNaseは、近隣非標的ssDNAの「コラテラル」切断に関与する。このcrRNAによってプログラム化されるコラテラル切断活性により、CRISPRシステムが特異的DNAの存在を標識ssDNAの非特異的分解によって検出することが可能となる。
DNA検出適用においては、コラテラルssDNA活性をレポーターと組み合わせることができ、例えば、DNAエンドヌクレアーゼ標的化CRISPRトランスレポーター(DNA Endonuclease-Targeted CRISPR trans reporter:DETECTR)法と呼ばれる方法などであり、これは、アトモル濃度のDNA検出感度を実現する(例えば、Chen et al.,Science,360(6387):436-439,2018を参照のこと)(これは全体として参照により本明細書に援用される)。本明細書に記載される酵素を使用する一つの適用は、インビトロ環境における非特異的ssDNAの分解である。フルオロフォア及び消光剤に連結した「レポーター」ssDNA分子もまた、未知のDNA試料(一本鎖又は二本鎖のいずれか)と共にこのインビトロシステムに加えることができる。未知のDNA片中に標的配列を認識すると、このエフェクター複合体がレポーターssDNAを切断し、蛍光リードアウトが生じる。
他の実施形態において、SHERLOCK法(特異的高感度酵素レポーターアンロッキング(Specific High Sensitivity Enzymatic Reporter UnLOCKing))もまた、核酸増幅及びレポーターssDNAのコラテラル切断に基づいたアトモル濃度(又は単一分子)感度のインビトロ核酸検出プラットフォームを提供し、標的のリアルタイム検出を可能にする。SHERLOCKにおけるCRISPRの使用方法については、例えば、Gootenberg,et al.“Nucleic acid detection with CRISPR-Cas13a/C2c2,”Science,356(6336):438-442(2017)(これは全体として参照により本明細書に援用される)に詳細に記載される。
一部の実施形態において、本明細書に記載されるCRISPRシステムは、マルチプレックス化したエラーロバストな蛍光インサイチュハイブリダイゼーション(multiplexed error-robust fluorescence in situ hybridization:MERFISH)において使用することができる。こうした方法については、例えば、Chen et al.,“Spatially resolved,highly multiplexed RNA profiling in single cells,”Science,2015 Apr 24;348(6233):aaa6090(これは全体として参照により本明細書に援用される)に記載されている。
核酸の追跡及び標識
細胞過程は、タンパク質、RNA、及びDNAの間での分子相互作用網に依存する。タンパク質-DNA及びタンパク質-RNA相互作用の正確な検出は、かかる過程を理解する鍵である。インビトロ近接性標識技法は、レポーター基、例えば光活性化可能な基と組み合わせたアフィニティータグを用いることにより、インビトロで目的のタンパク質又はRNAの近くにあるポリペプチド及びRNAを標識する。紫外線照射後、光活性化可能な基がタグ付加分子にごく近接したタンパク質及び他の分子と反応し、それによってそれらを標識する。標識された相互作用分子は、続いて回収し、同定することができる。このRNAターゲティングエフェクタータンパク質を使用して、例えば、プローブを選択のRNA配列に標的化することができる。こうした適用はまた、動物モデルにおいても疾患又は培養が困難な細胞型のインビボイメージングに適用することができる。核酸の追跡及び標識方法については、例えば、米国特許第8795965号明細書;国際公開第2016205764号パンフレット;及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
ハイスループットスクリーニング
本明細書に記載されるCRISPRシステムは、次世代シーケンシング(NGS)ライブラリの調製に使用することができる。例えば、費用対効果の高いNGSライブラリを作成するため、CRISPRシステムを使用して標的遺伝子のコード配列を破壊することができ、同時に次世代シーケンシングによって(例えば、Ion Torrent PGMシステムで)、CRISPRエフェクターがトランスフェクトされたクローンをスクリーニングすることができる。NGSライブラリの調製方法に関する詳細な説明については、例えば、Bell et al.,“A high-throughput screening strategy for detecting CRISPR-Cas9 induced mutations using next-generation sequencing,”BMC Genomics,15.1(2014):1002(これは全体として参照により本明細書に援用される)を参照することができる。
エンジニアリングされた細胞
微生物(例えば、大腸菌(E.coli)、酵母、及び微細藻類)は、合成生物学に広く用いられている。合成生物学の発展には、様々な臨床応用を含め、幅広い有用性がある。例えば、プログラム可能なCRISPRシステムを使用して、例えば癌関連RNAを標的転写物として用いる標的化した細胞死のため、毒性ドメインのタンパク質を分割することができる。更に、例えばキナーゼ又は酵素などの適切なエフェクターとの融合複合体により、合成生物系においてタンパク質間相互作用が関わる経路に影響を及ぼすことができる。
一部の実施形態において、ファージ配列を標的化するRNAガイド配列を微生物に導入することができる。したがって、本開示はまた、微生物(例えば産生菌株)にファージ感染に対する「ワクチンを接種する」方法も提供する。
一部の実施形態において、本明細書に提供されるCRISPRシステムを使用して微生物をエンジニアリングすることにより、例えば、収率を改善し又は発酵効率を改善することができる。例えば、本明細書に記載されるCRISPRシステムを使用して酵母などの微生物をエンジニアリングすることにより、発酵性糖からバイオ燃料若しくはバイオポリマーを生成し、又は発酵性糖源としての農業廃棄物に由来する植物由来のリグノセルロースを分解することができる。より詳細には、本明細書に記載される方法を使用して、バイオ燃料生産に必要な内因性遺伝子の発現を修飾し、及び/又はバイオ燃料合成を妨げ得る内因性遺伝子を修飾することができる。これらの微生物エンジニアリング方法については、例えば、Verwaal et al.,“CRISPR/Cpf1 enables fast and simple genome editing of Saccharomyces cerevisiae,”Yeast,2017 Sep 8.doi:10.1002/yea.3278;及びHlavova et al.,“Improving microalgae for biotechnology-from genetics to synthetic biology,”Biotechnol.Adv.,2015 Nov 1;33:1194-203(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、本明細書で提供されるCRISPRシステムは、真核細胞又は真核生物をエンジニアリングするために使用することができる。例えば、本明細書に記載のCRISPRシステムは、植物細胞、真菌細胞、哺乳動物細胞、爬虫類細胞、昆虫細胞、鳥類細胞、魚類細胞、寄生虫細胞、節足動物細胞、無脊椎動物細胞、脊椎動物細胞、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、非ヒト霊長類細胞、又はヒト細胞に限定されない真核細胞をエンジニアリングするために使用することができる。一部の実施形態において、真核細胞はインビトロ培養物中にある。一部の実施形態において、真核細胞はインビボである。一部の実施形態において、真核細胞はエキソビボである。
遺伝子ドライブ
遺伝子ドライブは、特定の遺伝子又は遺伝子群の遺伝形質に有利な偏りが出る現象である。本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築することができる。例えば、遺伝子の特定のアレルを標的化して破壊することにより、細胞に第2のアレルをコピーさせて配列を固定するようにCRISPRシステムを設計することができる。このコピーのため、第1のアレルが第2のアレルに変換されることになり、子孫に第2のアレルが遺伝する可能性が高くなる。どのように本明細書に記載されるCRISPRシステムを使用して遺伝子ドライブを構築するかに関する詳細な方法については、例えば、Hammond et al.,“A CRISPR-Cas9 gene drive system targeting female reproduction in the malaria mosquito vector Anopheles gambiae,”Nat.Biotechnol.,2016 Jan;34(1):78-83(これは全体として参照により本明細書に援用される)に記載されている。
プール型スクリーニング
本明細書に記載されるとおり、プール型CRISPRスクリーニングは、細胞増殖、薬剤耐性、及びウイルス感染などの生物学的機構に関与する遺伝子を同定するための強力なツールである。細胞がバルクで本明細書に記載されるRNAガイドコードベクターのライブラリによって形質導入され、選択的チャレンジの適用前及び適用後にgRNAの分布が測定される。プール型CRISPRスクリーンは、細胞生存及び増殖に影響を及ぼす機構に対して良好に機能し、個々の遺伝子の活性の測定にまで(例えば、エンジニアリングされたレポーター細胞株を使用することにより)拡張することができる。一度に1つの遺伝子のみが標的化されるアレイ化されたCRISPRスクリーンでは、RNA-seqをリードアウトとして使用することが可能になる。一部の実施形態において、本明細書に記載されるとおりのCRISPRシステムは単一細胞CRISPRスクリーンに使用することができる。プール型CRISPRスクリーニングに関する詳細な説明については、例えば、Datlinger et al.,“Pooled CRISPR screening with single-cell transcriptome read-out,”Nat.Methods.,2017 Mar;14(3):297-301(これは全体として参照により本明細書に援用される)を参照することができる。
飽和突然変異誘発(「バッシング(bashing)」)
本明細書に記載されるCRISPRシステムはインサイチュー飽和突然変異誘発に使用することができる。一部の実施形態では、プール型RNAガイドライブラリを使用して、特定の遺伝子又は調節エレメントに関するインサイチュー飽和突然変異誘発を実施することができる。かかる方法では、決定的な最小の特徴及びそれらの遺伝子又は調節エレメント(例えば、エンハンサー)の個別的な脆弱性を明らかにすることができる。これらの方法については、例えば、Canver et al.,“BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis,”Nature,2015 Nov 12;527(7577):192-7(これは全体として参照により本明細書に援用される)に記載されている。
治療上の適用
一部の実施形態において、本明細書に記載されるCRISPRシステムを使用して、標的核酸を編集して、標的核酸を修飾することができる(例えば、1つ以上のアミノ酸残基を挿入、欠失、又は変異させることによって)。例えば、一部の実施形態において、本明細書に記載されるCRISPRシステムは、望ましい核酸配列を含む外因性ドナー鋳型核酸(例えば、DNA分子又はRNA分子)を含む。本明細書に記載されるCRISPRシステムで誘導される切断イベントの分解時に、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、外因性ドナー鋳型核酸を利用することができる。或いは、細胞の分子機構は、切断イベントを修復及び/又は分解する際に、内因性鋳型を利用することができる。一部の実施形態において、本明細書に記載されるCRISPRシステムは、挿入、欠失、及び/又は点突然変異を生じる標的核酸を修飾するために使用され得る。一部の実施形態において、挿入は、傷のない挿入である(すなわち、標的核酸への意図された核酸配列の挿入は、切断イベントの分解時に追加の意図されない核酸配列を生じない)。ドナー鋳型核酸は、二本鎖又は一本鎖核酸分子(例えば、DNA又はRNA)であってもよい。外因性ドナー鋳型核酸の設計方法については、例えば、国際公開第2016094874号パンフレット(この内容全体が参照により本明細書に明示的に援用される)に記載されている。
別の態様において、本開示は、RNA配列特異的干渉;RNA配列特異的遺伝子調節;RNA、RNA産物、lncRNA、非コードRNA、核RNA、又はmRNAのスクリーニング;突然変異誘発;RNAスプライシングの阻害;蛍光インサイチュハイブリダイゼーション;育種;細胞休眠の誘導;細胞周期停止の誘導;細胞成長及び/又は細胞増殖の減少;細胞アネルギーの誘導;細胞アポトーシスの誘導;細胞壊死の誘導;細胞死の誘導;又はプログラムされた細胞死の誘導からなる群から選択される方法における本明細書に記載されるシステムの使用を提供する。
本明細書に記載されるCRISPRシステムは、様々な治療上の適用を有し得る。一部の実施形態において、新規CRISPRシステムは、様々な疾患及び障害、例えば、遺伝性障害(例えば、単一遺伝子疾患)又はヌクレアーゼ活性によって治療することができる疾患(例えば、Pcsk9ターゲティング又はBCL11aターゲティング)を治療するために使用することができる。一部の実施形態において、本明細書に記載される方法は、対象、例えば、ヒト患者などの哺乳類の治療に用いられる。哺乳類対象はまた、イヌ、ネコ、ウマ、サル、ウサギ、ラット、マウス、雌ウシ、ヤギ、又はヒツジなど、家畜化された哺乳類であってもよい。
この方法は、病態又は疾患が感染性であることを含んでもよく、ここで感染性病原体は、ヒト免疫不全ウイルス(HIV)、単純ヘルペスウイルス1型(HSV1)、及び単純ヘルペスウイルス2型(HSV2)からなる群から選択される。
一態様において、本明細書に記載されるCRISPRシステムは、RNA、毒性RNA、及び/又は変異RNA(例えば、スプライシング欠陥又はトランケーション)の過剰発現によって引き起こされる疾患を治療するために使用することができる。例えば、有毒なRNAの発現は、核封入体の形成及び脳、心臓、又は骨格筋の遅発性変性変化に関連し得る。一部の実施形態において、障害は筋強直性ジストロフィーである。筋緊張性ジストロフィーにおいて、有毒なRNAの主な病原性効果は、結合タンパク質を隔離し、選択的スプライシングの調節を損なうことである(例えば、Osborne et al.,“RNA-dominant diseases,” Hum.Mol.Genet.,2009 Apr 15;18(8):1471-81を参照)。筋強直性ジストロフィー(dystrophia myotonica(DM))は、極めて広範囲の臨床的特徴を生じるため、遺伝学者にとって特に興味深いものである。現在DM1型(DM1)と呼ばれている古典的な形態のDMは、細胞質ゾルプロテインキナーゼをコードする遺伝子であるDMPKの3’非翻訳領域(UTR)におけるCTGリピートの拡大によって引き起こされる。本明細書に記載されるCRISPRシステムは、過剰発現されたRNA又は毒性RNA、例えば、DMPK遺伝子、又はDM1骨格筋、心臓、又は脳において誤調節された選択的スプライシングのいずれかを標的とすることができる。
本明細書に記載されるCRISPRシステムは、プラダー・ウィリ症候群、脊髄性筋萎縮症(SMA)、先天性角化異常症などの様々な疾患を引き起こすRNA依存性機能に影響を与えるトランス作用性変異を標的とすることもできる。本明細書に記載されるCRISPRシステムを使用して治療できる疾患のリストは、Cooper et al.,“RNA and disease,” Cell,136.4(2009):777-793及び国際公開第2016205764号パンフレットに要約される(これらはそれぞれ全体として参照により本明細書に援用される)。
本明細書に記載されるCRISPRシステムは、例えば、原発性加齢性タウオパチー(PART)/神経原線維変化(NFT)優勢老人性認知症(アルツハイマー病(AD)で見られるものと同様のNFTを伴うが、プラークを伴わない)、ボクシング認知症(慢性外傷性脳症)、及び進行性核上性麻痺などの原発性及び続発性タウオパチーを含む、様々なタウオパチーの治療にも使用できる。タウオパチー及びこれらの疾患を治療する方法の有用なリストは、例えば、国際公開第2016205764号パンフレット(本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムは、スプライシングの欠陥及び疾患を引き起こし得るシス作用性スプライシングコードを破壊する変異を標的化するためにも使用できる。これらの疾患としては、例えば、SMN1遺伝子の欠失に起因する運動ニューロン変性疾患(例えば、脊髄性筋萎縮症)、デュシェンヌ型筋ジストロフィー(DMD)、前頭側頭型認知症、及び第17染色体に関連するパーキンソニズム(FTDP-17)、及び嚢胞性線維症が挙げられる。
本明細書に記載されるCRISPRシステムは、特にRNAウイルスに対する抗ウイルス活性のために更に使用することができる。エフェクタータンパク質は、ウイルスRNA配列を標的化するために選択された適切なRNAガイドを使用してウイルスRNAを標的化することができる。
更に、インビトロRNAセンシングアッセイを使用して特定のRNA基質を検出することができる。RNAターゲティングエフェクタータンパク質は、生細胞でのRNAベースのセンシングに使用できる。適用例は、例えば、疾患特異的RNAのセンシングによる診断である。
本明細書に記載されるCRISPRシステムの治療用途の詳細な説明は、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に見出すことができる。
植物における適用
本明細書に記載されるCRISPRシステムは、植物において幅広い種類の有用性がある。一部の実施形態において、CRISPRシステムを使用して植物のゲノムをエンジニアリングすることができる(例えば、生産を向上させる、所望の翻訳後修飾を有する生産品にする、又は工業製品を生産するための遺伝子を導入する)。一部の実施形態において、CRISPRシステムを使用して、植物に所望の形質を(例えば、ゲノムに対する遺伝性修飾を伴い又は伴わず)導入し、又は植物細胞若しくは全植物における内因性遺伝子の発現を調節することができる。
一部の実施形態において、本CRISPRシステムを使用して、特異的タンパク質、例えば、アレルゲンタンパク質(例えば、ピーナッツ、ダイズ、レンズマメ、エンドウマメ、サヤマメ、及びヤエナリ中のアレルゲンタンパク質)をコードする遺伝子を同定、編集、及び/又はサイレンシングすることができる。タンパク質をコードする遺伝子を同定、編集、及び/又はサイレンシングする方法に関する詳細な説明については、例えば、Nicolaou et al.,“Molecular diagnosis of peanut and legume allergy,”Curr.Opin.Allergy Clin.Immunol.,11(3):222-8(2011)、及び国際公開第2016205764号パンフレット(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
CRISPRシステムの送達
本開示及び当技術分野の知識を通じて、本明細書に記載されるCRISPRシステム、又はその成分、その核酸分子、又はその成分をコードする若しくは提供する核酸分子は、ベクター、例えば、プラスミド、又はウイルス送達ベクターなどの様々な送達システムによって送達することができる。本明細書に開示されるCRISPRエフェクター及び/又はいずれかのRNA(例えば、RNAガイド)は、適切なベクター、例えば、プラスミド、又はアデノ随伴ウイルス(AAV)、レンチウイルス、アデノウイルス、及び他のウイルスベクターなどのウイルスベクター、又はそれらの組み合わせを使用して送達することができる。エフェクター及び1つ以上のRNAガイドは、1つ以上のベクター、例えばプラスミド又はウイルスベクターにパッケージングすることができる。
一部の実施形態において、ベクター、例えばプラスミド又はウイルスベクターは、例えば、筋肉内注射、静脈内投与、経皮投与、鼻腔内投与、経口投与、又は粘膜投与によって目的の組織に送達される。かかる送達は、1回用量又は複数回用量のいずれによるものであってもよい。当業者は、本明細書において実際に送達される投薬量が、ベクターの選択、標的細胞、生物、組織、治療対象の全般的な状態、求められる形質転換/修飾の程度、投与経路、投与様式、及び求められる形質転換/修飾の種類を含むがこれらに限定されず、種々の要因に応じて大きく異なり得ることを理解する。
特定の実施形態において、送達は、アデノウイルスによるものであり、これは少なくとも1×10粒子(粒子単位、puとも称される)のアデノウイルスを含有する1回用量におけるものであることができる。一部の実施形態において、好ましくは用量は少なくとも約1×10粒子、少なくとも約1×10粒子、少なくとも約1×10粒子、及び少なくとも約1×10粒子のアデノウイルスである。送達方法及び用量については、例えば、国際公開第2016205764号パンフレット及び米国特許第8454972号明細書(これらはそれぞれ全体として参照により本明細書に援用される)に記載されている。
一部の実施形態において、送達はプラスミドによるものである。投薬量は、応答を引き出すのに十分な数のプラスミドであり得る。ある場合には、プラスミド組成物中のプラスミドDNAの好適な分量は、約0.1~約2mgであってもよい。プラスミドは概して、(i)プロモーター;(ii)プロモーターに作動可能に連結された、核酸ターゲティングCRISPRエフェクターをコードする配列;(iii)選択可能マーカー;(iv)複製起点;及び(v)(ii)の下流にある且つそれに作動可能に連結された転写ターミネーターを含むことになる。プラスミドはまた、CRISPR複合体のRNA成分もコードすることができるが、代わりに、これらのうちの1つ以上が異なるベクターにコードされてもよい。投与頻度は、医学又は獣医学の実践者(例えば、医師、獣医師)、又は当業者の範囲内にある。
別の実施形態において、送達はリポソーム又はリポフェクチン製剤などによるものであり、当業者に公知の方法によって調製することができる。かかる方法については、例えば、国際公開第2016205764号パンフレット及び米国特許第5593972号明細書;同第5589466号明細書;及び同第5580859号明細書(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
一部の実施形態において、送達はナノ粒子又はエキソソームによるものである。例えば、エキソソームはRNA送達に特に有用であることが示されている。
本明細書に記載されるCRISPRシステムの1つ以上の成分を細胞に導入する更なる手段は、細胞透過性ペプチド(CPP)の使用によるものである。一部の実施形態では、細胞透過性ペプチドがCRISPRエフェクターに連結される。一部の実施形態では、CRISPRエフェクター及び/又はRNAガイドが1つ以上のCPPとカップリングされ、細胞内部へと輸送する(例えば、植物プロトプラスト)。一部の実施形態では、CRISPRエフェクター及び/又は1つ又は複数のRNAガイドが、細胞送達のため1つ以上のCPPにカップリングされている1つ以上の環状又は非環状DNA分子によってコードされる。
CPPは、生体分子を受容体非依存的に細胞膜を越えて輸送する能力を有するタンパク質又はキメラ配列のいずれかに由来する35アミノ酸未満の短鎖ペプチドである。CPPは、カチオン性ペプチド、疎水性配列を有するペプチド、両親媒性ペプチド、プロリンリッチな抗微生物配列を有するペプチド、及びキメラ又は双節型ペプチドであってもよい。CPPの例としては、例えば、Tat(これはHIV 1型によるウイルス複製に必要な核転写活性化因子タンパク質である)、ペネトラチン、カポジ線維芽細胞成長因子(FGF)シグナルペプチド配列、インテグリンβ3シグナルペプチド配列、ポリアルギニンペプチドArg配列、グアニンリッチ分子輸送体、及びスイートアローペプチドが挙げられる。CPP及びその使用方法については、例えば、Haellbrink et al.,“Prediction of cell-penetrating peptides,”Methods Mol.Biol.,2015;1324:39-58;Ramakrishna et al.,“Gene disruption by cell-penetrating peptide-mediated delivery of Cas9 protein and guide RNA,”Genome Res.,2014 Jun;24(6):1020-7;及び国際公開第2016205764号パンフレット(これらの各々は、本明細書において全体として参照により援用される)に記載されている。
本明細書に記載されるCRISPRシステムのための様々な送達方法はまた、例えば、米国特許第8795965号明細書、欧州特許第3009511号明細書、国際公開第2016205764号パンフレット、及び国際公開第2017070605号パンフレット(これらの各々は、本明細書において全体として参照により援用される)にも記載されている。
以下の例に本発明を更に記載するが、これらの例は、特許請求の範囲に記載される本発明の範囲を限定するものではない。
実施例1-CLUST.133120 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.133120システムは、淡水、廃水、土壌、及び根圏環境に限定されない環境から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む(表2)。例示的なCLUST.133120エフェクターには、以下の表2及び3に示されるものが含まれる。これらのシステムのダイレクトリピート配列の例を表4に示す。任意選択で、システムは、表5に掲載される非コード配列に含まれるtracrRNAを含む。
Figure 2022546701000015
Figure 2022546701000016
Figure 2022546701000017
Figure 2022546701000018
Figure 2022546701000019
Figure 2022546701000020
Figure 2022546701000021
Figure 2022546701000022
Figure 2022546701000023
Figure 2022546701000024
Figure 2022546701000025
Figure 2022546701000026
Figure 2022546701000027
Figure 2022546701000028
Figure 2022546701000029
Figure 2022546701000030
Figure 2022546701000031
Figure 2022546701000032
Figure 2022546701000033
Figure 2022546701000034
Figure 2022546701000035
実施例2-2つのエンジニアリングされたCLUST.133120 CRISPR-Casシステムの機能検証
CLUST.133120 CRISPR-Casシステムの成分を同定し、機能検証のために2つの遺伝子座を選択した:1)3300027740と称されるメタゲノムソースからの遺伝子座(配列番号1)、2)3300017971と称されるメタゲノムソースからの遺伝子座(配列番号2)。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.133120 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.133120 3300027740エフェクター(表3に示される配列番号1)をコードする大腸菌(E.coli)コドン最適化核酸配列及びCLUST.133120 3300017971エフェクター(表3に示される配列番号2)をコードする大腸菌(E.coli)コドン最適化核酸配列を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムに個別にクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.133120エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.133120 3300027740エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。CLUST.133120 3300027740エフェクター(配列番号1)に使用される非コード配列は配列番号78に記載され、CLUST.133120 3300017971エフェクター(配列番号2)に使用される非コード配列は、表5に示すように、配列番号75に記載される。CLUST.133120 3300027740エフェクター(配列番号1)及びCLUST.133120 3300017971エフェクター(配列番号2)が非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図1Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。特に、表4に示すように、CLUST.133120 3300027740エフェクター(配列番号1)に使用されるリピート配列は配列番号51に記載され、CLUST.133120 3300017971エフェクター(配列番号2)に使用されるリピート配列は配列番号52に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、本発明者らは初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.CloniエレクトロコンピテントなE.coli(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNAを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図1Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、本発明者らは次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。枯渇率が0.3未満(3倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なし、図3、図6、図9、及び図12に破線で示した。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。この行列中の異なる特徴がCLUST.133120システムについての標的枯渇を説明する程度を調査した。
図3及び図6は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、エンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。各組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーンはCLUST.133120 3300027740エフェクターがDRの順(5’-CCAA…CGAC-[スペーサー]-3’)方向で活性であったこと(図3)、及びCLUST.133120 3300017971エフェクターがDRの逆(5’-GGTA…CGAC-[スペーサー]-3’)方向で活性であったこと(図6)を示した。
図4A及び図4Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.133120 3300027740エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。同様に、図7A及び図7Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.133120 3300017971エフェクターについての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.133120 3300027740及びCLUST.133120 3300017971のPAMを決定した。CLUST.133120 3300027740及びCLUST.133120 3300017971のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)は、それぞれ図5及び図8に示される。位置「20」は、標的の5’の位置に隣接するヌクレオチドに対応する。
更に、図9は、CLUST.133120 3300027740エフェクターが非コード配列の非存在下で活性を保持することを示す。図3と一致して、CLUST.133120 3300027740エフェクターはDRの順(5’-CCAA…CGAC-[スペーサー]-3’)方向で活性であった。図10A及び図10Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.133120 3300027740エフェクター(非コード配列を除く)についての強力に枯渇した標的の位置を示す。CLUST.133120 3300027740(非コード配列を除く)のPAM配列のWebLogoを図11に示す。同様に、図12は、CLUST.133120 3300017971エフェクターが非コード配列の非存在下で活性を保持することを示す。図6と一致して、CLUST.133120 3300017971エフェクターは、DRの逆(5’-GGTA…CGAC-[スペーサー]-3’)方向で活性であった。図13A及び図13Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.133120 3300017971エフェクター(非コード配列を除く)についての強力に枯渇した標的の位置を示す。CLUST.133120 3300017971(非コード配列を除く)のPAM配列のWebLogoを図14に示す。位置「20」は、標的の5’の位置に隣接するヌクレオチドに対応する。
このように、CLUST.133120 CRISPR-Casの複数のエフェクターは、非コード配列の存在下又は非存在下の両方で、インビボで活性を示す。これらの結果は、CLUST.133120のエフェクターがtracrRNAを要しないことを示唆している。したがって、CLUST.133120エフェクターは自己プロセシングであり得、マルチプレックス化が容易になる。
実施例3-CLUST.133120エフェクターによるGFPのターゲティング
この実施例は、CLUST.133120エフェクターの活性を測定するための蛍光枯渇アッセイ(FDA)の使用を説明する。
このアッセイでは、GFPを標的とするように設計された活性CRISPRシステムが、GFPをコードする二本鎖DNA領域に結合して切断することにより、GFP蛍光の枯渇が生じる。FDAアッセイには、インビトロでの転写及び翻訳が含まれ、これにより、CLUST.133120エフェクターをコードするDNA鋳型、及びダイレクトリピート(DR)-スペーサー-ダイレクトリピート(DR)を有するT7プロモーター下のプレcrRNA配列を含むDNA鋳型からのRNPの産生が可能になる。スペーサーはGFPを標的とした。同じワンポット反応において、GFP及びRFPも標的及び蛍光レポーターの両方として産生された(図15A)。標的GFPプラスミド配列は配列番号192に示され、RFPプラスミド配列は配列番号193に示される。TECAN Infinite F Plexプレートリーダーを使用して、GFP及びRFPの蛍光値を37℃で20分ごとに、12時間にわたって測定した。RFPは標的化されなかったため、その蛍光は影響を受けず、そのため、内部シグナル対照として使用された。
配列番号192
Figure 2022546701000036
配列番号193
Figure 2022546701000037
配列番号1のエフェクターについて、3つのGFP標的(及び1つの非標的)を設計した。FDAアッセイに使用されるRNAガイド配列、標的配列、及び非標的対照配列を表6に示す。表6に示されるプレcrRNA配列は、インビトロでの転写及び翻訳混合物中に存在するヌクレアーゼによってRNAが分解されないように、5’末端にT7プロモーターを含み、RNAの3’末端をキャップするヘアピンモチーフを含む。5’-TTN-3’PAMを標的配列に使用した。
Figure 2022546701000038
GFPシグナルをRFPシグナルに規格化し、3つの技術的複製の平均蛍光を各時点で取得した。次に、非GFPターゲティングRNAガイド(代わりにカナマイシン耐性遺伝子を標的とし、GFPシグナルを枯渇させない)とインキュベートしたエフェクターのGFPシグナルを、GFPターゲティングRNAガイドとインキュベートしたエフェクターのGFPシグナルで割ることにより、GFP蛍光枯渇を計算した。得られた値は、図15Bにおいて「枯渇」と呼ばれる。
1又は約1の枯渇は、非GFPターゲティングプレcrRNA及びGFPターゲティングプレcrRNAに関してGFP枯渇にほとんど又は全く差異がないことを示した(例えば、10RFU/10RFU=1)。1を超える枯渇は、非GFPターゲティングプレcrRNA及びGFPターゲティングプレcrRNAに関してGFP枯渇に差異があることを示した(例えば、10RFU/5RFU=2)。GFPシグナルの枯渇は、エフェクターが機能的RNPを形成し、GFPコード領域内に二本鎖DNA切断を導入することによってGFPの産生に干渉したことを示した。GFP枯渇の程度は、CLUST.133120エフェクターの特異的活性と主に相関していた。
図15Bは、配列番号1のエフェクターによって形成され、各GFP標的(標的1~3)につき20分ごとに測定された、RNPの枯渇曲線を示す。各標的において、配列番号1のエフェクターで形成されたRNPの枯渇値は1より大きかった。
これは、CLUST.133120エフェクターがGFPの産生への干渉能を有する機能的RNPを形成したことを示唆している。
実施例4-CLUST.099129 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.099129システムは、淡水、廃水、土壌、及び根圏環境から、並びにアナエロリネア(Anaerolineae)細菌から(表9)採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む。例示的なCLUST.099129エフェクターには、以下の表9及び10に示されるものが含まれる。これらのシステムのダイレクトリピート配列の例を表11に示す。任意選択で、システムは、表12に掲載される非コード配列に含まれるtracrRNAを含む。
Figure 2022546701000039
Figure 2022546701000040
Figure 2022546701000041
Figure 2022546701000042
Figure 2022546701000043
Figure 2022546701000044
Figure 2022546701000045
Figure 2022546701000046
Figure 2022546701000047
Figure 2022546701000048
Figure 2022546701000049
Figure 2022546701000050
Figure 2022546701000051
Figure 2022546701000052
Figure 2022546701000053
Figure 2022546701000054
Figure 2022546701000055
Figure 2022546701000056
Figure 2022546701000057
実施例5-3つのエンジニアリングされたCLUST.099129 CRISPR-Casシステムの機能検証
CLUST.099129 CRISPR-Casシステムの成分を同定し、機能検証のために3つの遺伝子座を選択した:1)SRR6837557と称されるメタゲノムソースからの遺伝子座(配列番号101)、2)3300012971と称されるメタゲノムソースからの遺伝子座(配列番号102)、及び3)メタゲノムソース3300005764からの遺伝子座(配列番号103)。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.099129 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.099129 SRR6837557エフェクター(表10に示される配列番号101)をコードする大腸菌(E.coli)コドン最適化核酸配列、CLUST.099129 3300012971エフェクター(表10に示される配列番号102)をコードする大腸菌(E.coli)コドン最適化核酸配列、及びCLUST.099129 3300005764エフェクター(表10に示される配列番号103)をコードする大腸菌(E.coli)コドン最適化核酸配列を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムに個別にクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.099129エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.099129エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。表12に示すように、CLUST.099129 SRR6837557エフェクター(配列番号101)に使用される非コード配列は配列番号163に記載され、CLUST.099129 3300012971エフェクター(配列番号102)に使用される非コード配列は配列番号174に記載され、CLUST.099129 3300005764エフェクター(配列番号103)に使用される非コード配列は配列番号170に記載される。CLUST.099129 SRR6837557エフェクター(配列番号101)が非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図1Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。表11に示すように、特に、CLUST.099129 SRR6837557エフェクター(配列番号101)に使用されるリピート配列は配列番号146に記載され、CLUST.099129 3300012971エフェクター(配列番号102)に使用されるリピート配列は配列番号147に記載され、CLUST.099129 3300005764エフェクター(配列番号103)に使用されるリピート配列は配列番号148に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した。両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNA WASを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図1Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。図17、図20、図23、及び図26で青色の破線で示される、枯渇率が0.3未満(3倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。このマトリックスの異なる特徴がCLUST.099129システムの標的枯渇を説明する程度を調査した。
図17、図23、及び図26は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、非コード配列を含まないエンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。各組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(E.coli)(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーンはCLUST.099129 SRR6837557エフェクターがDRの「逆」方向(5’-AGTC…AAAC-[スペーサー]-3’)で活性であったこと(図17)、CLUST.099129 3300012971エフェクターがDRの逆方向(5’-GTGA…GCAC-[スペーサー]-3’)で活性であったこと(図23)、及びCLUST.099129 3300005764エフェクターがDRの順方向(5’-GTGC…TACT-[スペーサー]-3’)で活性であったこと(図26)を示した。
図18A及び図18Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.099129 SRR6837557エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。図24A及び図24Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.099129 3300012971エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。図27A及び図27Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.099129 3300005764エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.099129エフェクターのPAMを決定した。CLUST.099129 SRR6837557、CLUST.099129 3300012971、及びCLUST.099129 3300005764のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)は、それぞれ図19、図25、及び図14に示される。位置「20」は、標的の5’末端に隣接するヌクレオチドに対応する。このように、CLUST.099129の複数のエフェクターは、インビボでの活性を明らかにした。
更に、図20は、CLUST.099129 SRR6837557エフェクターが非コード配列の非存在下で活性を保持することを示す。図17と一致して、CLUST.099129 SRR6837557エフェクター(非コード配列を有しない)は、DRの逆方向(5’-AGTC…AAAC-[スペーサー]-3’)で活性であった。図21A及び図21Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.099129 SRR6837557エフェクター(非コード配列を含まない)についての強力に枯渇した標的の位置を示す。CLUST.099129 SRR6837557(非コード配列を含まない)のPAM配列のWebLogoを図22に示し、ここで、位置「20」は、標的の5’末端に隣接するヌクレオチドに対応する。この結果は、CLUST.099129のエフェクターがtracrRNAを要しないことを示唆している。したがって、CLUST.099129エフェクターは自己プロセシングであり得、マルチプレックス化が容易になる。
実施例6-CLUST.099129エフェクターによるGFPのターゲティング
この実施例は、CLUST.099129エフェクターの活性を測定するための蛍光枯渇アッセイ(FDA)の使用を説明する。
このアッセイでは、GFPを標的とするように設計された活性CRISPRシステムが、GFPをコードする二本鎖DNA領域に結合して切断することにより、GFP蛍光の枯渇が生じる。FDAアッセイには、インビトロでの転写及び翻訳が含まれ、これにより、CLUST.099129エフェクターをコードするDNA鋳型、及びダイレクトリピート(DR)-スペーサー-ダイレクトリピート(DR)を有するT7プロモーター下のプレcrRNA配列を含むDNA鋳型からのRNPの産生が可能になる。スペーサーはGFPを標的とした。同じワンポット反応において、GFP及びRFPも標的及び蛍光レポーターの両方として産生された(図29A)。標的GFPプラスミド配列は配列番号192に示され、RFPプラスミド配列は配列番号193に示される。TECAN Infinite F Plexプレートリーダーを使用して、GFP及びRFPの蛍光値を37℃で20分ごとに、12時間にわたって測定した。RFPは標的化されなかったため、その蛍光は影響を受けず、そのため、内部シグナル対照として使用された。
配列番号192
Figure 2022546701000058
配列番号193
Figure 2022546701000059
配列番号101のエフェクターについて、5つのGFP標的(及び1つの非標的)を設計した。FDAアッセイに使用されるRNAガイド配列、標的配列、及び非標的対照配列を表13に示す。5’-GTN-3’PAMを標的配列に使用した。
Figure 2022546701000060
GFPシグナルをRFPシグナルに規格化し、3つの技術的複製の平均蛍光を各時点で取得した。次に、非GFPターゲティングRNAガイド(代わりにカナマイシン耐性遺伝子を標的とし、GFPシグナルを枯渇させない)とインキュベートしたエフェクターのGFPシグナルを、GFPターゲティングRNAガイドとインキュベートしたエフェクターのGFPシグナルで割ることにより、GFP蛍光枯渇を計算した。得られた値は、図29Bにおいて「枯渇」と呼ばれる。
1又は約1の枯渇は、非GFPターゲティングプレcrRNA及びGFPターゲティングプレcrRNAに関してGFP枯渇にほとんど又は全く差異がないことを示した(例えば、10RFU/10RFU=1)。1を超える枯渇は、非GFPターゲティングプレcrRNA及びGFPターゲティングプレcrRNAに関してGFP枯渇に差異があることを示した(例えば、10RFU/5RFU=2)。GFPシグナルの枯渇は、エフェクターが機能的RNPを形成し、GFPコード領域内に二本鎖DNA切断を導入することによってGFPの産生に干渉したことを示した。GFP枯渇の程度は、CLUST.099129エフェクターの特異的活性と主に相関していた。
図29Bは、配列番号101のエフェクターによって形成され、各GFP標的(標的1~5)につき20分ごとに測定された、RNPの枯渇曲線を示す。各標的において、配列番号101のエフェクターで形成されたRNPの枯渇値は1より大きかった。
これは、CLUST.099129エフェクターがGFPの産生への干渉能を有する機能的RNPを形成したことを示唆している。
実施例7-CLUST.342201 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.342201システムは、廃水、淡水、海、湖沼堆積物、腸、微生物マット、及び土壌環境(表16)から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む。例示的なCLUST.342201エフェクターには、以下の表16及び17に示されるものが含まれる。これらのシステムのダイレクトリピート配列及びスペーサー長さの例を表18に示す。任意選択で、システムは、表19に掲載される非コード配列内に含まれるtracrRNAを含む。
Figure 2022546701000061
Figure 2022546701000062
Figure 2022546701000063
Figure 2022546701000064
Figure 2022546701000065
Figure 2022546701000066
Figure 2022546701000067
Figure 2022546701000068
Figure 2022546701000069
Figure 2022546701000070
Figure 2022546701000071
Figure 2022546701000072
Figure 2022546701000073
Figure 2022546701000074
Figure 2022546701000075
Figure 2022546701000076
Figure 2022546701000077
Figure 2022546701000078
Figure 2022546701000079
実施例8-トランス活性化RNAエレメントの同定
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載されるいくつかのCRISPRシステムはまた、トランス活性化RNA(tracrRNA)と呼ばれるロバストな酵素活性を活性化する更なるスモールRNAを含んでもよい。このようなtracrRNAには、典型的には、crRNAにハイブリダイズする相補的な領域が含まれる。crRNA-tracrRNAハイブリッドは、エフェクターと複合体を形成し、プログラム可能な酵素活性の活性化を生じる。
tracrRNA配列は、CRISPRアレイに隣接するゲノム配列で、crRNAのダイレクトリピート部分に相同な短い配列モチーフを検索するにより同定できる。検索方法は、完全なダイレクトリピート(DR)又はDR部分配列の正確な又は縮重した配列一致を含む。例えば、長さnヌクレオチドのDRは、オーバーラップする6~10ntのkmerのセットに分解できる。これらのkmerは、CRISPR遺伝子座に隣接する配列にアラインメントでき、1つ以上のkmerアラインメントを有する相同領域は、tracrRNAとしての実験的検証のためのDR相同領域として同定できる。或いは、RNAコフォールドの自由エネルギーは、CRISPRシステムのエレメントに隣接するゲノム配列からの完全なDR又はDR部分配列及び短いkmer配列について計算することができる。低い最小自由エネルギー構造を有する隣接配列エレメントは、tracrRNAとしての実験的検証のためのDR相同性領域として同定できる。
tracrRNAエレメントは、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内で頻繁に発生する。DR相同性領域を検索してtracrRNAエレメントを同定することの代替として、CRISPRエフェクター又はCRISPRアレイに隣接する非コード配列を、tracrRNAの直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
tracrRNAエレメントの実験的検証は、CRISPRシステムの宿主生物のスモールRNA配列、又は非天然種で異種発現された合成配列を使用して実施できる。元のゲノム遺伝子座からのスモールRNA配列をアラインメントすることで、完全なtracrRNAエレメントに典型的なDR相同領域及びステロタイプ(sterotyped)プロセシングを含む発現RNA産物を同定できる。
RNAシーケンシングによって同定される完全なtracrRNA候補は、tracrRNA候補を伴い又は伴わずcrRNA及びエフェクターを発現し、エフェクター酵素活性の活性化をモニタリングすることにより、インビトロ又はインビボで検証できる。
エンジニアリングされた構築物において、tracrRNAの発現は、哺乳動物細胞での発現のためのU6、U1、及びH1プロモーター又は細菌での発現のためのJ23119プロモーターを含むがこれらに限定されないプロモーターによってドライブされる。
一部の例では、tracrRNAをcrRNAと融合させ、単一のRNAガイドとして発現させることができる。
実施例9-酵素活性の新規RNAモジュレーターの同定
エフェクタータンパク質及びcrRNAに加えて、本明細書に記載されるいくつかのCRISPRシステムはまた、本明細書においてRNAモジュレーターと呼ばれる、エフェクター活性を活性化又は調節するための更なるスモールRNAを含んでもよい。
RNAモジュレーターは、CRISPR関連遺伝子又はCRISPRアレイにごく近接した範囲内で発生すると予想される。RNAモジュレーターを同定及び検証するために、CRISPRエフェクター又はCRISPRアレイに隣接する非コード配列を、直接実験的検証のためのクローニング又は遺伝子合成によって単離することができる。
RNAモジュレーターの実験的検証は、CRISPRシステムの宿主生物のスモールRNA配列、又は非天然種で異種発現された合成配列を使用して実施できる。スモールRNA配列を元のゲノム遺伝子座にアラインメントすることで、DR相同領域及びステロタイプ(sterotyped)プロセシングを含む発現RNA産物を同定できる。
RNAシーケンシングによって同定されるRNAモジュレーター候補は、RNAモジュレーター候補を伴い又は伴わずcrRNA及びエフェクターを発現し、エフェクター酵素活性の変化をモニタリングすることにより、インビトロ又はインビボで検証できる。
エンジニアリングされた構築物において、RNAモジュレーターは、哺乳動物細胞での発現のためのU6、U1、及びH1プロモーター又は細菌での発現のためのJ23119プロモーターを含むプロモーターによってドライブされる。
一部の例では、RNAモジュレーターをcrRNA、tracrRNA、又はその両方と人工的に融合させ、単一のRNAエレメントとして発現させることができる。
実施例10-エンジニアリングされたCLUST.342201 CRISPR-Casシステムの機能検証
CLUST.342201 CRISPR-Casシステムの成分を同定し、3300006417と称されるメタゲノムソースからの遺伝子座(配列番号301)が機能検証のために選択された。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.342201 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.342201 3300006417エフェクターをコードする大腸菌(E.coli)コドン最適化核酸配列(表17に示される配列番号301)を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.342201エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.342201エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。CLUST.342201 3300006417エフェクター(配列番号301)に使用される非コード配列は、表19に示すように、配列番号373に記載される。CLUST.342201 3300006417エフェクター(配列番号301)が非コード配列なしでpET28a(+)に個別にクローニングされた、別個の条件が試験された。図1Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。特に、CLUST.342201 3300006417エフェクター(配列番号301)に使用されるリピート配列は、表18に示すように、配列番号342に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した。両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNA WASを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図1Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。図31で青色の破線で示される、枯渇率が0.3未満(3倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。このマトリックスの異なる特徴がCLUST.342201システムの標的枯渇を説明する程度を調査した。
図31は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、非コード配列を含まないエンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。各組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(E.coli)(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーンはCLUST.342201 3300006417エフェクターがDRの「逆」方向(5’-GTTC…ATGG-[スペーサー]-3’)で活性であったこと(図31)を示した。CLUST.342201 3300006417エフェクターは、非コード配列の非存在下で活性を保持せず、これは、CLUST.342201エフェクターがtracrRNAを要することを示している。同様に、陰性対照(エフェクターを有しないプラスミド)は活性を示さなかった。
図32A及び図32Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.342201 3300006417エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.342201 3300006417のPAM配列を決定した。CLUST.342201 3300006417のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)は、図33に示される。
実施例11-CLUST.195009 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.195009システムは、超塩湖、水生、埋立地、土壌、及び廃水環境に限定されない環境、並びにアシドバクテリア(Acidobacteria)(表22)から採取された無培養のメタゲノム配列に見られるCRISPRシステムに関連するシングルエフェクターを含む。例示的なCLUST.195009エフェクターには、以下の表22及び23に示されるものが含まれる。これらのシステムのダイレクトリピート配列及びスペーサー長さの例を表24に示す。任意選択で、システムは、表25に掲載される非コード配列に含まれるtracrRNAを含む。
Figure 2022546701000080
Figure 2022546701000081
Figure 2022546701000082
Figure 2022546701000083
Figure 2022546701000084
Figure 2022546701000085
Figure 2022546701000086
Figure 2022546701000087
Figure 2022546701000088
実施例12-エンジニアリングされたCLUST.195009 CRISPR-Casシステムの機能検証
CLUST.195009 CRISPR-Casシステムの成分を同定し、SRR6201554と称されるメタゲノムソースからの遺伝子座(配列番号501)が機能検証のために選択された。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.195009 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.195009 SRR6201554エフェクターをコードする大腸菌(E.coli)コドン最適化核酸配列(表23に示される配列番号501)を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.195009エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.195009エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。CLUST.195009 SRR6201554エフェクター(配列番号501)に使用される非コード配列は、表25に示すように、配列番号533に記載される。CLUST.195009 SRR6201554エフェクター(配列番号501)が非コード配列なしでpET28a(+)に個別にクローニングされた、追加の条件が試験された。図1Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。特に、CLUST.195009 SRR6201554エフェクター(配列番号501)に使用されるリピート配列は、表24に示すように、配列番号522に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した。両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNA WASを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図1Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。図35及び図38で青色の破線で示される、枯渇率が0.3未満(3倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。このマトリックスの異なる特徴がCLUST.195009システムの標的枯渇を説明する程度を調査した。
図35は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、非コード配列を含まないエンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(E.coli)(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーンはCLUST.195009 SRR6201554エフェクターがDRの「順」方向(5’-CCAG…CGAC-[スペーサー]-3’)で活性であったこと(図35)を示した。
図36A及び図36Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.195009 SRR6201554エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.195009エフェクターのPAMを決定した。CLUST.195009 SRR6201554のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)を図37に示し、ここで、位置「20」は、標的の5’末端に隣接するヌクレオチドに対応する。
更に、図38は、CLUST.195009 SRR6201554エフェクターが非コード配列の非存在下で活性を保持することを示す。図35と一致して、CLUST.195009 SRR6201554エフェクター(非コード配列を有しない)は、DRの「順」方向(5’-CCAG…CGAC-[スペーサー]-3’)で活性であった。図39A及び図39Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.195009 SRR6201554エフェクター(非コード配列を含まない)についての強力に枯渇した標的の位置を示す。CLUST.195009 SRR6201554(非コード配列を含まない)のPAM配列のWebLogoを図40に示し、ここで、位置「20」は、標的の5’末端に隣接するヌクレオチドに対応する。
これらの結果は、CLUST.195009のエフェクターがtracrRNAを要しないことを示唆している。したがって、CLUST.195009エフェクターは自己プロセシングであり得、マルチプレックス化が容易になる。
実施例13-CLUST.057059 CRISPR-Casシステムの成分の同定
このタンパク質ファミリーは、上記の計算方法を使用して同定された。CLUST.057059システムは、淡水、水生、バイオフィルム、甲殻類、微生物マット、堆積物及び土壌クラスト環境を含む、特定の環境、並びにアファニゾメノン(Aphanizomenon)ファージ、シアノセイス属(Cyanothece sp.)、プロピオニミクロビウム・リンフォフィラム(Propionimicrobium lymphophilum)、スファエロスペルモプシス・レニフォルミス(Sphaerospermopsis reniformis)(表28)に見られるCRISPRシステムに関連するシングルエフェクターを含む。例示的なCLUST.057059エフェクターには、以下の表28及び29に示されるものが含まれる。これらのシステムのダイレクトリピート配列及びスペーサー長さの例を表30に示す。任意選択で、システムは、表31に掲載される非コード配列内に含まれるtracrRNAを含む。
Figure 2022546701000089
Figure 2022546701000090
Figure 2022546701000091
Figure 2022546701000092
Figure 2022546701000093
Figure 2022546701000094
Figure 2022546701000095
Figure 2022546701000096
Figure 2022546701000097
Figure 2022546701000098
Figure 2022546701000099
Figure 2022546701000100
Figure 2022546701000101
Figure 2022546701000102
Figure 2022546701000103
Figure 2022546701000104
Figure 2022546701000105
Figure 2022546701000106
Figure 2022546701000107
Figure 2022546701000108
Figure 2022546701000109
Figure 2022546701000110
Figure 2022546701000111
Figure 2022546701000112
Figure 2022546701000113
Figure 2022546701000114
実施例14-エンジニアリングされたCLUST.057059 CRISPR-Casシステムの機能検証
CLUST.057059 CRISPR-Casシステムの成分を同定し、3300023179と称されるメタゲノムソースからの遺伝子座(配列番号601)が機能検証のために選択された。
DNA合成及びエフェクターライブラリクローニング
例示的なCLUST.057059 CRISPR-Casシステムの活性を試験するために、pET28a(+)ベクターを使用してシステムを設計及び合成した。簡潔に言えば、CLUST.057059 3300023179エフェクターをコードする大腸菌(E.coli)コドン最適化核酸配列(表29に示される配列番号601)を合成し(Genscript)、pET-28a(+)(EMD-Millipore)に由来するカスタム発現システムにクローニングした。ベクターは、lacプロモーター及び大腸菌(E.coli)リボソーム結合配列の制御下にあるCLUST.057059エフェクターをコードする核酸を含んでいた。ベクターはまた、CLUST.057059エフェクターのオープンリーディングフレームに続くJ23119プロモーターによってドライブされるCRISPRアレイライブラリのアクセプター部位も含んでいた。CLUST.057059 3300023179エフェクター(配列番号601)に使用される非コード配列は、表31に示すように、配列番号619に記載される。CLUST.057059 3300023179エフェクター(配列番号601)が非コード配列なしでpET28a(+)に個別にクローニングされた、別個の条件が試験された。図1Aを参照されたい。
「リピート-スペーサー-リピート」配列を含むオリゴヌクレオチドライブラリ合成(OLS)プールが計算的に設計され、ここで、「リピート」は、エフェクターに関連するCRISPRアレイに見られるコンセンサスダイレクトリピート配列に相当し、「スペーサー」は、pACYC184プラスミド又は大腸菌(E.coli)必須遺伝子をタイリング(tiling)する配列に相当する。特に、CLUST.057059 3300023179エフェクター(配列番号601)に使用されるリピート配列は、表30に示すように、配列番号611に記載される。スペーサー長さは、内因性CRISPRアレイに見られるスペーサー長さの最頻値によって決定した。リピート-スペーサー-リピート配列には、前述のCRISPRアレイライブラリアクセプター部位、及びより大規模なプールからの特異的リピート-スペーサー-リピートライブラリの特定の増幅を実現するユニークなPCRプライミング部位への断片の双方向クローニングを実現する、制限部位が付加された。
次に、Golden Gateアセンブリ法を使用して、リピート-スペーサー-リピートライブラリをプラスミドにクローニングした。簡潔に言えば、初めに、ユニークなPCRプライマーを使用してOLSプール(Agilent Genomics)から各リピート-スペーサー-リピートを増幅し、BsaIを使用してプラスミド骨格を事前に線形化して、潜在的バックグラウンドを低減した。両方のDNA断片は、Golden Gateアセンブリマスターミックス(New England Biolabs)に添加する前に、Ampure XP(Beckman Coulter)で精製し、製造者の指示に従ってインキュベートした。Golden Gate反応物を更に精製及び濃縮して、細菌スクリーニングの後続のステップで最大の形質転換効率を実現した。
異なるリピート-スペーサー-リピートエレメントとCRISPRエフェクターとを含むプラスミドライブラリを、Lucigenが推奨するプロトコルに従ってGene Pulser Xcell(登録商標)(Bio-rad)を使用してE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に電気穿孔した。ライブラリを、精製pACYC184プラスミドで共形質転換するか、又はpACYC184を含むE.Cloniエレクトロコンピテントな大腸菌(E.coli)(Lucigen)に直接形質転換し、BioAssay(登録商標)ディッシュ(Thermo Fisher)のクロラムフェニコール(Fisher)、テトラサイクリン(Alfa Aesar)、カナマイシン(Alfa Aesar)を含む寒天培地に播種し、37℃で10~12時間インキュベートした。近似コロニー数を推定して細菌プレート上に十分なライブラリ提示を確保した後、細菌を回収し、QIAprep Spin Miniprep(登録商標)キット(Qiagen)を使用してプラスミドDNA WASを抽出し、「出力ライブラリ」を作成した。Illuminaシーケンシングケミストリーに適合性のあるバーコード及び部位を含むカスタムプライマーを使用してPCRを実行することにより、形質変換前の「入力ライブラリ」及び回収後の「出力ライブラリ」の両方からバーコード付きの次世代シーケンシングライブラリを生成し、これをプールし、Nextseq550(Illumina)にロードして、エフェクターを評価した。一貫性を確保するために、各スクリーンに対して少なくとも2つの独立したバイオロジカルレプリケートが実施された。図1Bを参照されたい。
細菌スクリーンシーケンシング解析
Illumina bcl2fastqを使用してスクリーン入力及び出力ライブラリの次世代シーケンシングデータをデマルチプレックス化した。各試料について得られたfastqファイル中のリードが、スクリーニングプラスミドライブラリ用のCRISPRアレイエレメントを含んだ。CRISPRアレイのダイレクトリピート配列を用いてアレイの向きを決定し、スペーサー配列をソース(pACYC184又はE.Cloni)又は陰性対照配列(GFP)にマッピングすることにより対応する標的を決定した。各試料について、所与のプラスミドライブラリ中の各ユニークなアレイエレメントのリード総数(r)をカウントし、以下のとおり規格化した:(r+1)/全てのライブラリアレイエレメントの総リード数。所与のアレイエレメントに関する規格化出力リード数を規格化入力リード数で除すことにより、枯渇スコアを計算した。
酵素活性及び細菌細胞死を生じさせる特異的パラメータを同定するため、次世代シーケンシング(NGS)を用いて入力及び出力プラスミドライブラリのPCR産物中における個々のCRISPRアレイ(即ち、リピート-スペーサー-リピート)の表現を定量化し、比較した。アレイの枯渇率は、規格化された出力リード数を規格化された入力リード数で割ったものとして定義された。図42で青色の破線で示される、枯渇率が0.3未満(3倍を超える枯渇)の場合、アレイは「強力に枯渇した」と見なした。バイオロジカルレプリケートにわたるアレイ枯渇率を計算する際には、全実験にわたる所与のCRISPRアレイについての最大枯渇率の値をとった(即ち、強力に枯渇したアレイは、全てのバイオロジカルレプリケートで強力に枯渇していなければならない)。各スペーサー標的について、アレイ枯渇率及び以下の特徴:標的鎖、転写物ターゲティング、ORIターゲティング、標的配列モチーフ、フランキング配列モチーフ、及び標的二次構造を含む行列を作成した。このマトリックスの異なる特徴がCLUST.057059システムの標的枯渇を説明する程度を調査した。
図42は、所与の標的について、スクリーン出力対スクリーン入力におけるシーケンシングリードの規格化された比率をプロットすることによる、非コード配列を含まないエンジニアリングされた組成物の干渉活性の程度を示す。結果は各DR転写方向につきプロットされる。各組成物の機能的スクリーニングにおいて、活性RNAガイドと複合体を形成した活性エフェクターは、クロラムフェニコール及びテトラサイクリンに対する大腸菌(E.coli)耐性を付与するpACYC184の能力に干渉し、細胞死及びプール内のスペーサーエレメントの枯渇をもたらす。初期DNAライブラリ(画面入力)と生存形質転換大腸菌(E.coli)(画面出力)のディープシーケンスの結果を比較すると、活性でプログラム可能なCRISPRシステムを可能にする特定の標的配列及びDR転写方向が示唆される。スクリーンはまた、エフェクター複合体がDRの1つの方向でのみ活性であることも示す。このように、スクリーンはCLUST.057059 3300023179エフェクターがDRの「順」方向(5’-CTTG…AAAC-[スペーサー]-3’)で活性であったこと(図42)を示した。CLUST.057059 3300023179エフェクターは、非コード配列の非存在下で活性を保持せず、これは、CLUST.057059エフェクターがtracrRNAを要することを示している。
図43A及び図43Bは、それぞれ、pACYC184及び大腸菌(E.coli)E.Cloni必須遺伝子を標的化するCLUST.057059 3300023179エフェクター(+非コード配列)についての強力に枯渇した標的の位置を示す。枯渇した標的の隣接配列を分析して、CLUST.057059 3300023179のPAM配列を決定した。CLUST.057059 3300023179のPAM配列のWebLogo表現(Crooks et al.,Genome Research 14:1188-90,2004)を図44に示し、ここで、位置「20」は、標的の5’末端に隣接するヌクレオチドに対応する。
実施例15-哺乳動物遺伝子のターゲティング
この実施例は、一過性トランスフェクションによって哺乳動物細胞に導入された本明細書に開示されるエフェクターによる哺乳動物標的に対するインデル評価を説明する。
本明細書に開示されるエフェクターをpcda3.1骨格(Invitrogen)にクローニングする。次に、プラスミドをマキシプレップし、1μg/μLに希釈する。RNAガイドの調製では、RNAガイドをコードするdsDNA断片は、標的配列の足場及びU6プロモーターを含むウルトラマー(ultramer)によって誘導される。ウルトラマーを10mMのTris・HClにpH7.5で再懸濁し、最終ストック濃度を100μMにした。続いてワーキングストックを10μMに希釈し、再度10mM Tris・HClを使用して、PCR反応の鋳型として使用する。RNAガイドの増幅は、次の成分を用いた50μLの反応物で行われた:前述の鋳型0.02μl、フォワードプライマー2.5μl、リバースプライマー2.5μl、NEB HiFiポリメラーゼ25μL、及び水20μl。サイクリング条件は、1×(98℃で30秒)、30×(98℃で10秒、67℃で15秒)、1×(72℃で2分)であった。PCR産物は1.8X SPRI処理でクリーンアップされ、25ng/μLに規格化された。
標的遺伝子座の配列は、本明細書に記載されるように選択される。例えば、表34のPAM配列に隣接する標的遺伝子座が選択される。
Figure 2022546701000115
crRNA配列は、本明細書に記載されるように選択される。例えば、crRNAは、本明細書に記載される長さ及び配列のダイレクトリピート配列を含む。ダイレクトリピートの非限定的な例を表35に示す。
Figure 2022546701000116
トランスフェクションの約16時間前に、DMEM/10%FBS+Pen/Strep中の25,000個のHEK293T細胞100μlを96ウェルプレートの各ウェルにプレーティングする。トランスフェクションの日、細胞は70~90%コンフルエントである。トランスフェクトするウェルごとに、0.5μlのLipofectamine2000と9.5μlのOpti-MEMの混合物を調製し、次に室温で5~20分間インキュベートした(溶液1)。インキュベーション後、lipofectamine:OptiMEM混合物を、182ngのエフェクタープラスミド及び14ngのcrRNA及び最大10μLの水を含む別の混合物に添加した(溶液2)。陰性対照において、crRNAは溶液2に含まれていない。溶液1と溶液2の混合物をピペッティングにより上下に混合し、次に室温で25分間インキュベートする。インキュベーション後、20μLの溶液1と溶液2の混合物を、細胞を含む96ウェルプレートの各ウェルに滴下する。トランスフェクションの72時間後、各ウェルの中央に10μLのTrypLEを添加して細胞をトリプシン処理し、約5分間インキュベートする。次に、100μLのD10培地を各ウェルに加え、混合して細胞を再懸濁する。次に細胞を500gで10分間スピンダウンし、上清を廃棄する。QuickExtract緩衝液を、元の細胞懸濁液量の1/5に加える。細胞を65℃で15分間、68℃で15分間、98℃で10分間インキュベートする。
次世代シーケンシング用の試料は、2ラウンドのPCRによって調製される。第1のラウンド(PCR1)は、標的に応じて特定のゲノム領域を増幅するために使用される。PCR1産物はカラム精製により精製する。PCRラウンド2(PCR2)は、Illuminaのアダプター及びインデックスを付加するために行われる。次に、反応物をプールし、カラム精製によって精製する。シーケンシングの実行は、150サイクルのNextSeq v2.5の中出力又は高出力キットで行われる。
トランスフェクション後のHEK293T細胞における標的遺伝子座のインデルのパーセンテージが計算される。バックグラウンドに対するインデルのパーセンテージは、哺乳動物細胞のヌクレアーゼ活性を示す。
他の実施形態
本発明はその詳細な説明を伴い説明されているが、前述の説明は例示であり、添付の特許請求の範囲によって定義される本発明の範囲を限定する意図はないことが理解されるべきである。他の態様、利点、及び変形例が、以下の特許請求の範囲内にある。

Claims (138)

  1. CLUST.133120、CLUST.099129、CLUST.342201、CLUST.195009、又はCLUST.057059のエンジニアリングされた天然に存在しないクラスター化して規則的な配置の短い回文配列リピート(CRISPR)-Casシステムであって、
    (a)CRISPR関連タンパク質が配列番号1~50、101-145、301-341、501-521、又は601-682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
    を含み、
    前記CRISPR関連タンパク質が、前記RNAガイドに結合し、前記スペーサー配列に相補的な前記標的核酸配列を修飾することができる、CRISPR-Casシステム。
  2. 前記ダイレクトリピート配列が、配列番号51~72、85~87、95~100、又は900~915のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1に記載のシステム。
  3. 前記CRISPR関連タンパク質が、配列番号1又は配列番号2に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項1又は2に記載のシステム。
  4. 前記CRISPR関連タンパク質がプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-TTN-3’又は5’-TN-3’として記載される核酸配列を含む、請求項3に記載のシステム。
  5. 前記RNAガイドの前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項1~4のいずれか一項に記載のシステム。
  6. 前記RNAガイドの前記スペーサー配列が、20~35ヌクレオチドを含む、請求項1~5のいずれか一項に記載のシステム。
  7. 前記ダイレクトリピート配列が、配列番号146~162のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1又は2に記載のシステム。
  8. 前記CRISPR関連タンパク質が、配列番号101、配列番号102、又は配列番号103に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項1、2、又は7のいずれか一項に記載のシステム。
  9. 前記CRISPR関連タンパク質がプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’として記載される核酸配列を含む、請求項1、2、7、又は8のいずれか一項に記載のシステム。
  10. 前記RNAガイドの前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項1、2、又は7~9のいずれか一項に記載のシステム。
  11. 前記RNAガイドの前記スペーサー配列が、26~51ヌクレオチドを含む、請求項1、2、又は7~10のいずれか一項に記載のシステム。
  12. 前記ダイレクトリピート配列が、配列番号342~362のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1又は2に記載のシステム。
  13. 前記CRISPR関連タンパク質が、配列番号301に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項1、2、又は12のいずれか一項に記載のシステム。
  14. 前記CRISPR関連タンパク質がプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)として記載される核酸配列を含む、請求項1、2、12、又は13のいずれか一項に記載のシステム。
  15. 前記RNAガイドの前記スペーサー配列が、約12ヌクレオチド~約62ヌクレオチドを含む、請求項1、2、又は12~14のいずれか一項に記載のシステム。
  16. 前記RNAガイドの前記スペーサー配列が、19~40ヌクレオチドを含む、請求項15に記載のシステム。
  17. 前記ダイレクトリピート配列が、配列番号522~532のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1又は2に記載のシステム。
  18. 前記CRISPR関連タンパク質が、配列番号501に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項1又は2に記載のシステム。
  19. 前記CRISPR関連タンパク質がプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-TTN-3’として記載される核酸配列を含む、請求項1、2、又は18のいずれか一項に記載のシステム。
  20. 前記RNAガイドの前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項1、2、18又は19のいずれか一項に記載のシステム。
  21. 前記RNAガイドの前記スペーサー配列が、20~39ヌクレオチドを含む、請求項20に記載のシステム。
  22. 前記ダイレクトリピート配列が、配列番号683~734のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項1又は2に記載のシステム。
  23. 前記CRISPR関連タンパク質が、配列番号601に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項1、2、又は22のいずれか一項に記載のシステム。
  24. 前記CRISPR関連タンパク質がプロトスペーサー隣接モチーフ(PAM)配列の認識能を有し、前記PAM配列が、5’-GTN-3’として記載される核酸配列を含む、請求項1、2、22、又は23のいずれか一項に記載のシステム。
  25. 前記RNAガイドの前記スペーサー配列が、約15ヌクレオチド~約50ヌクレオチドを含む、請求項1、2、又は22~24のいずれか一項に記載のシステム。
  26. 前記RNAガイドの前記スペーサー配列が、20~44ヌクレオチドを含む、請求項25に記載のシステム。
  27. 前記CRISPR関連タンパク質が、少なくとも1つのRuvCドメイン又は少なくとも1つの分割されたRuvCドメインを含む、請求項1~26のいずれか一項に記載のシステム。
  28. 前記CRISPR関連タンパク質が、触媒残基(例えば、アスパラギン酸又はグルタミン酸)を含む、請求項1~27のいずれか一項に記載のシステム。
  29. 前記CRISPR関連タンパク質が、前記標的核酸を切断する、請求項1~28のいずれか一項に記載のシステム。
  30. 前記CRISPR関連タンパク質が、ペプチドタグ、蛍光タンパク質、塩基編集ドメイン、DNAメチル化ドメイン、ヒストン残基修飾ドメイン、局在化因子、転写修飾因子、光ゲート制御因子、化学誘導性因子、又はクロマチン可視化因子を更に含む、請求項1~29のいずれか一項に記載のシステム。
  31. 前記CRISPR関連タンパク質をコードする前記核酸が、細胞での発現にコドン最適化される、請求項1~30のいずれか一項に記載のシステム。
  32. 前記CRISPR関連タンパク質をコードする前記核酸が、プロモーターに作動可能に連結されている、請求項1~31のいずれか一項に記載のシステム。
  33. 前記CRISPR関連タンパク質をコードする前記核酸が、ベクター内にある、請求項1~32のいずれか一項に記載のシステム。
  34. 前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、ファージベクター、アデノウイルスベクター、アデノ随伴ベクター、又は単純ヘルペスベクターを含む、請求項33に記載のシステム。
  35. 前記標的核酸がDNA分子である、請求項1~34のいずれか一項に記載のシステム。
  36. 前記標的核酸が、PAM配列を含む、請求項1~35のいずれか一項に記載のシステム。
  37. 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を含む、請求項1~36のいずれか一項に記載のシステム。
  38. 前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸のターゲティングにより、前記標的核酸の修飾が生じる、請求項1~37のいずれか一項に記載のシステム。
  39. 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項38に記載のシステム。
  40. 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項38に記載のシステム。
  41. 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項38に記載のシステム。
  42. 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項38に記載のシステム。
  43. 前記修飾により細胞毒性又は細胞死が生じる、請求項38~42のいずれか一項に記載のシステム。
  44. ドナー鋳型核酸を更に含む、請求項1~43のいずれか一項に記載のシステム。
  45. 前記ドナー鋳型核酸がDNAである、請求項44に記載のシステム。
  46. 前記ドナー鋳型核酸がRNAである、請求項44に記載のシステム。
  47. 前記システムがtracrRNAを含まない、請求項1~46のいずれか一項に記載のシステム。
  48. 前記CRISPR関連タンパク質が自己プロセシングである、請求項1~47のいずれか一項に記載のシステム。
  49. 前記システムが、ナノ粒子、リポソーム、エキソソーム、微小胞、又は遺伝子銃を含む送達組成物中に存在する、請求項1~48のいずれか一項に記載のシステム。
  50. 細胞内にある、請求項1~49のいずれか一項に記載のシステム。
  51. 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項50に記載のシステム。
  52. 前記細胞が原核細胞である、請求項50に記載のシステム。
  53. (a)CRISPR関連タンパク質が配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
    を含む、細胞。
  54. 前記CRISPR関連タンパク質が、配列番号1又は配列番号2に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項53に記載の細胞。
  55. 前記CRISPR関連タンパク質が、5’-TTN-3’又は5’-TN-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項53又は54に記載の細胞。
  56. 前記ダイレクトリピート配列が、配列番号51~72、85~87、95~100、又は900~915のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項53~55のいずれか一項に記載の細胞。
  57. 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項53~56のいずれか一項に記載の細胞。
  58. 前記スペーサー配列が、20~35ヌクレオチドを含む、請求項53~57のいずれか一項に記載の細胞。
  59. (a)配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
    を含む、細胞。
  60. 前記CRISPR関連タンパク質が、配列番号101、配列番号102、又は配列番号103に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項59に記載の細胞。
  61. 前記CRISPR関連タンパク質が、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項59又は60に記載の細胞。
  62. 前記ダイレクトリピート配列が、配列番号146~162のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項59~61のいずれか一項に記載の細胞。
  63. 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項59~62のいずれか一項に記載の細胞。
  64. 前記スペーサー配列が、26~51ヌクレオチドを含む、請求項59~63のいずれか一項に記載の細胞。
  65. (a)配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
    を含む、細胞。
  66. 前記CRISPR関連タンパク質が、配列番号301に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項65に記載の細胞。
  67. 前記CRISPR関連タンパク質が、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)として記載される核酸配列を含むPAM配列の認識能を有する、請求項65又は66に記載の細胞。
  68. 前記ダイレクトリピート配列が、配列番号342~362のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項65~67のいずれか一項に記載の細胞。
  69. 前記スペーサー配列が、約12ヌクレオチド~約62ヌクレオチドを含む、請求項65~68のいずれか一項に記載の細胞。
  70. 前記スペーサー配列が、19~40ヌクレオチドを含む、請求項65~69のいずれか一項に記載の細胞。
  71. (a)配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
    を含む、細胞。
  72. 前記CRISPR関連タンパク質が、配列番号501に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項71に記載の細胞。
  73. 前記CRISPR関連タンパク質が、5’-TTN-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項71又は72に記載の細胞。
  74. 前記ダイレクトリピート配列が、配列番号522~532のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項71~73のいずれか一項に記載の細胞。
  75. 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項71~74のいずれか一項に記載の細胞。
  76. 前記スペーサー配列が、20~39ヌクレオチドを含む、請求項71~75のいずれか一項に記載の細胞。
  77. (a)配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド
    を含む、細胞。
  78. 前記CRISPR関連タンパク質が、配列番号601に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項77に記載の細胞。
  79. 前記CRISPR関連タンパク質が、5’-GTN-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項77又は78に記載の細胞。
  80. 前記ダイレクトリピート配列が、配列番号683~734のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項77~79のいずれか一項に記載の細胞。
  81. 前記スペーサー配列が、約15ヌクレオチド~約50ヌクレオチドを含む、請求項77~80のいずれか一項に記載の細胞。
  82. 前記スペーサー配列が、20~44ヌクレオチドを含む、請求項77~81のいずれか一項に記載の細胞。
  83. 前記細胞がtracrRNAを含まない、請求項53~82のいずれか一項に記載の細胞。
  84. 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項53~83のいずれか一項に記載の遺伝子修飾された細胞。
  85. 前記細胞が原核細胞である、請求項53~83のいずれか一項に記載の細胞。
  86. 標的核酸を修飾する方法であって、
    (a)CRISPR関連タンパク質が配列番号1~50のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質又は前記CRISPR関連タンパク質をコードする核酸;及び
    (b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
    を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含み、
    前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
    前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、方法。
  87. 前記CRISPR関連タンパク質が、配列番号1又は配列番号2に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項86に記載の方法。
  88. 前記CRISPR関連タンパク質が、5’-TTN-3’又は5’-TN-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項86又は87に記載の方法。
  89. 前記ダイレクトリピート配列が、配列番号51~72、85~87、95~100、又は900~915のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項86~88のいずれか一項に記載の方法。
  90. 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項86~89のいずれか一項に記載の方法。
  91. 前記スペーサー配列が、20~35ヌクレオチドを含む、請求項86~90のいずれか一項に記載の方法。
  92. 標的核酸を修飾する方法であって、
    (a)配列番号101~145のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
    を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含み、
    前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
    前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、方法。
  93. 前記CRISPR関連タンパク質が、配列番号101、配列番号102、又は配列番号103に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項92に記載の方法。
  94. 前記CRISPR関連タンパク質が、5’-GTN-3’、5’-TG-3’、5’-TR-3’、又は5’-RATG-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項92又は93に記載の方法。
  95. 前記ダイレクトリピート配列が、配列番号146~162のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項92~94のいずれか一項に記載の方法。
  96. 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項92~95のいずれか一項に記載の方法。
  97. 前記スペーサー配列が、26~51ヌクレオチドを含む、請求項92~96のいずれか一項に記載の方法。
  98. 標的核酸を修飾する方法であって、
    (a)配列番号301~341のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
    を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含み、
    前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
    前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、方法。
  99. 前記CRISPR関連タンパク質が、配列番号301に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項98に記載の方法。
  100. 前記CRISPR関連タンパク質が、5’-AAG-3’、5’-AAD-3’、5’-AAR-3’、5’-RAAG-3’(配列番号921)、5’-RAAR-3’(配列番号922)、5’-RAAD-3’(配列番号923)として記載される核酸配列を含むPAM配列の認識能を有する、請求項98又は99に記載の方法。
  101. 前記ダイレクトリピート配列が、配列番号342~362のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項98~100のいずれか一項に記載の方法。
  102. 前記スペーサー配列が、約12ヌクレオチド~約62ヌクレオチドを含む、請求項98~101のいずれか一項に記載の方法。
  103. 前記スペーサー配列が、19~40ヌクレオチドを含む、請求項98~102のいずれか一項に記載の方法。
  104. 標的核酸を修飾する方法であって、
    (a)配列番号501~521のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
    を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含み、
    前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
    前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、方法
  105. 前記CRISPR関連タンパク質が、配列番号501に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項104に記載の方法。
  106. 前記CRISPR関連タンパク質が、5’-TTN-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項104又は105に記載の方法。
  107. 前記ダイレクトリピート配列が、配列番号522~532のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項104~106のいずれか一項に記載の方法。
  108. 前記スペーサー配列が、約15ヌクレオチド~約55ヌクレオチドを含む、請求項104~107のいずれか一項に記載の方法。
  109. 前記スペーサー配列が、20~39ヌクレオチドを含む、請求項104~108のいずれか一項に記載の方法。
  110. 標的核酸を修飾する方法であって、
    (a)配列番号601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、CRISPR関連タンパク質;及び
    (b)ダイレクトリピート配列と前記標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド;
    を含む、エンジニアリングされた天然に存在しないCRISPR-Casシステムを、標的核酸に送達することを含み、
    前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
    前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、方法。
  111. 前記CRISPR関連タンパク質が、配列番号601に記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)の同一性を有するタンパク質である、請求項110に記載の方法。
  112. 前記CRISPR関連タンパク質が、5’-GTN-3’として記載される核酸配列を含むPAM配列の認識能を有する、請求項110又は111に記載の方法。
  113. 前記ダイレクトリピート配列が、配列番号683~734のいずれか1つに記載のヌクレオチド配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のヌクレオチド配列を含む、請求項110~112のいずれか一項に記載の方法。
  114. 前記スペーサー配列が、約15ヌクレオチド~約50ヌクレオチドを含む、請求項110~113のいずれか一項に記載の方法。
  115. 前記スペーサー配列が、20~44ヌクレオチドを含む、請求項110~114のいずれか一項に記載の方法。
  116. 請求項1~49のいずれか一項に記載のシステムを、細胞内の標的核酸に結合させる方法であって、
    (a)前記システムを提供すること;及び
    (b)前記システムを前記細胞に送達すること
    を含み、前記細胞が前記標的核酸を含み、前記CRISPR関連タンパク質が前記RNAガイドに結合し、前記スペーサー配列が前記標的核酸に結合する、方法。
  117. 前記細胞が真核細胞、例えば、哺乳動物細胞、例えば、ヒト細胞である、請求項116に記載の方法。
  118. 前記システムがtracrRNAを含まない、請求項86~117のいずれか一項に記載の方法。
  119. 前記標的核酸がDNA分子である、請求項86~118のいずれか一項に記載の方法。
  120. 前記標的核酸がPAM配列を含む、請求項88~119のいずれか一項に記載の方法。
  121. 前記CRISPR関連タンパク質が、非特異的ヌクレアーゼ活性を含む、請求項88~120のいずれか一項に記載の方法。
  122. 前記標的核酸の前記修飾が、二本鎖切断イベントである、請求項88~121のいずれか一項に記載の方法。
  123. 前記標的核酸の前記修飾が、一本鎖切断イベントである、請求項88~121のいずれか一項に記載の方法。
  124. 前記標的核酸の前記修飾により、挿入イベントが生じる、請求項88~121のいずれか一項に記載の方法。
  125. 前記標的核酸の前記修飾により、欠失イベントが生じる、請求項88~121のいずれか一項に記載の方法。
  126. 前記標的核酸の修飾により、細胞毒性又は細胞死が生じる、請求項122~125のいずれか一項に記載の方法。
  127. 標的核酸の編集方法であって、請求項1~49のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
  128. 標的核酸の発現を改変する方法であって、請求項1~49のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む、方法。
  129. 標的核酸のある部位におけるペイロード核酸の挿入を標的化する方法であって、請求項1~49のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む方法。
  130. 標的核酸のある部位からのペイロード核酸の切出しを標的化する方法であって、請求項1~49のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む方法。
  131. DNA標的核酸の認識に応じた一本鎖DNAの非特異的分解方法であって、請求項1~49のいずれか一項に記載のシステムを前記標的核酸に接触させることを含む方法。
  132. 試料中の標的核酸の検出方法であって、
    (a)請求項1~49のいずれか一項に記載のシステム及び標識されたレポーター核酸を前記試料に接触させることであって、前記スペーサー配列が前記標的核酸にハイブリダイズすると、前記標識されたレポーター核酸の切断が起こること;及び
    (b)前記標識されたレポーター核酸の切断によって生成される検出可能シグナルを測定することであって、それにより前記試料中における前記標的核酸の存在を検出すること
    を含む、方法。
  133. インビトロ又はエキソビボでの
    (a)標的核酸のターゲティング及び編集方法;
    (b)核酸の認識に応じた一本鎖核酸の非特異的分解方法;
    (c)二本鎖標的のスペーサー相補鎖の認識に応じた二本鎖標的の非スペーサー相補鎖のターゲティング及びニッキング方法;
    (d)二本鎖標的核酸のターゲティング及び切断方法;
    (e)試料中の標的核酸の検出方法;
    (f)二本鎖核酸の特異的編集方法;
    (g)二本鎖核酸の塩基編集方法;
    (h)細胞における遺伝子型特異的又は転写状態特異的細胞死又は休眠の誘導方法;
    (i)二本鎖核酸標的におけるインデルの作成方法;
    (j)二本鎖核酸標的への配列の挿入方法;又は
    (k)二本鎖核酸標的における配列の欠失又は逆位形成方法
    における請求項1~49のいずれか一項に記載のシステムの使用。
  134. (a)CRISPR関連タンパク質をコードする核酸配列であって、前記CRISPR関連タンパク質が配列番号1~50、101~145、301~341、501~521、又は601~682のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含むもの;及び
    (b)ダイレクトリピート配列と標的核酸へのハイブリダイゼーション能を有するスペーサー配列とを含むRNAガイド(又は前記RNAガイドをコードする核酸);
    のトランスフェクションを含み、
    前記CRISPR関連タンパク質がRNAガイドへの結合能を有し、
    前記CRISPR関連タンパク質及びRNAガイドによる前記標的核酸の認識により、前記標的核酸の修飾が生じる、
    哺乳動物細胞において標的核酸へ挿入又は欠失を導入する方法。
  135. 前記CRISPR関連タンパク質が、配列番号1、101、301、501、又は601のいずれか1つに記載のアミノ酸配列と少なくとも80%(例えば、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%又は100%)同一のアミノ酸配列を含む、請求項134に記載の方法。
  136. 前記CRISPR関連タンパク質が、配列番号1、101、301、501、又は601のいずれか1つのアミノ酸配列を含む、請求項134に記載の方法。
  137. 前記トランスフェクションが、一過性トランスフェクションである、請求項134~136のいずれか一項に記載の方法。
  138. 前記細胞がヒト細胞である、請求項134~137のいずれか一項に記載の方法。
JP2022513214A 2019-08-27 2020-08-26 新規crispr dnaターゲティング酵素及びシステム Pending JP2022546701A (ja)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US201962892390P 2019-08-27 2019-08-27
US201962892382P 2019-08-27 2019-08-27
US201962892434P 2019-08-27 2019-08-27
US201962892358P 2019-08-27 2019-08-27
US201962892446P 2019-08-27 2019-08-27
US62/892,390 2019-08-27
US62/892,382 2019-08-27
US62/892,446 2019-08-27
US62/892,358 2019-08-27
US62/892,434 2019-08-27
US201962893059P 2019-08-28 2019-08-28
US201962893064P 2019-08-28 2019-08-28
US62/893,059 2019-08-28
US62/893,064 2019-08-28
US201962896277P 2019-09-05 2019-09-05
US62/896,277 2019-09-05
PCT/US2020/048037 WO2021041569A1 (en) 2019-08-27 2020-08-26 Novel crispr dna targeting enzymes and systems

Publications (2)

Publication Number Publication Date
JP2022546701A true JP2022546701A (ja) 2022-11-07
JPWO2021041569A5 JPWO2021041569A5 (ja) 2023-09-04

Family

ID=74683321

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022513214A Pending JP2022546701A (ja) 2019-08-27 2020-08-26 新規crispr dnaターゲティング酵素及びシステム

Country Status (7)

Country Link
US (1) US20230016656A1 (ja)
EP (1) EP4021924A4 (ja)
JP (1) JP2022546701A (ja)
CN (1) CN114729011A (ja)
AU (1) AU2020340353A1 (ja)
CA (1) CA3152788A1 (ja)
WO (1) WO2021041569A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210388333A1 (en) * 2018-11-09 2021-12-16 Inari Agriculture, Inc. Rna-guided nucleases and dna binding proteins
BR112023024985A2 (pt) 2021-06-01 2024-02-20 Arbor Biotechnologies Inc Sistemas de edição de genes compreendendo uma crispr nuclease e usos dos mesmos

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018035250A1 (en) * 2016-08-17 2018-02-22 The Broad Institute, Inc. Methods for identifying class 2 crispr-cas systems
US11168322B2 (en) * 2017-06-30 2021-11-09 Arbor Biotechnologies, Inc. CRISPR RNA targeting enzymes and systems and uses thereof

Also Published As

Publication number Publication date
EP4021924A4 (en) 2024-02-07
CA3152788A1 (en) 2021-03-04
WO2021041569A1 (en) 2021-03-04
EP4021924A1 (en) 2022-07-06
CN114729011A (zh) 2022-07-08
AU2020340353A1 (en) 2022-03-24
US20230016656A1 (en) 2023-01-19

Similar Documents

Publication Publication Date Title
US11667904B2 (en) CRISPR-associated systems and components
EP3765616B1 (en) Novel crispr dna and rna targeting enzymes and systems
US11976308B2 (en) CRISPR DNA targeting enzymes and systems
US20220372456A1 (en) Novel crispr dna targeting enzymes and systems
US20210301288A1 (en) Novel crispr dna targeting enzymes and systems
US20220315913A1 (en) Novel crispr dna targeting enzymes and systems
CA3093580A1 (en) Novel crispr dna and rna targeting enzymes and systems
JP2022546701A (ja) 新規crispr dnaターゲティング酵素及びシステム
US20220282283A1 (en) Novel crispr dna targeting enzymes and systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230825

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230825