JP2023533417A - Ruvcドメインを有する酵素 - Google Patents

Ruvcドメインを有する酵素 Download PDF

Info

Publication number
JP2023533417A
JP2023533417A JP2022567462A JP2022567462A JP2023533417A JP 2023533417 A JP2023533417 A JP 2023533417A JP 2022567462 A JP2022567462 A JP 2022567462A JP 2022567462 A JP2022567462 A JP 2022567462A JP 2023533417 A JP2023533417 A JP 2023533417A
Authority
JP
Japan
Prior art keywords
seq
endonuclease
sequence
identity
nos
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022567462A
Other languages
English (en)
Other versions
JPWO2021226363A5 (ja
Inventor
トーマス,ブライアン
ブラウン,クリストファー
カンター,ローズ
デヴォート,オードラ
バターフィールド,クリスティーナ
アレクサンダー,リサ
エス.エー. ゴルツマン,ダニエラ
リュー,ジェイソン
ラモット,レベッカ
エスピノサ,ディエゴ
ストーリー,メーガン
コスト,グレッグ
Original Assignee
メタゲノミ,インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by メタゲノミ,インコーポレイテッド filed Critical メタゲノミ,インコーポレイテッド
Publication of JP2023533417A publication Critical patent/JP2023533417A/ja
Publication of JPWO2021226363A5 publication Critical patent/JPWO2021226363A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本開示は、際立ったドメインの特徴を有するエンドヌクレアーゼ酵素、並びにそのような酵素又はそのバリアントを用いる方法を提供する。【選択図】図2

Description

関連出願
本出願は、2020年5月8日に出願された「ENZYMES WITH RUVC DOMAINS」と題する米国仮出願第63/022,320号、2020年5月29日に出願された「ENZYMES WITH RUVC DOMAINS」と題する米国仮出願第63/032,464号、及び2020年11月19日に出願された「ENZYMES WITH RUVC DOMAINS」と題する米国仮出願第63/116,155号、及び2021年4月27日に出願された「ENZYMES WITH RUVC DOMAINS」と題する米国仮出願第63/180,570号の優先権を主張し、これらの全ては参照によりその全体が本明細書に組み込まれる。
Cas酵素は、それらの関連するクラスター化して規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeat:CRISPR)ガイドリボ核酸(RNA)と共に、そのような微生物を、CRISPR-RNAガイド核酸切断によって感染性ウイルス及びプラスミドなどの非自己核酸から保護するのに役立つ原核生物免疫システムの広範な(約45%の細菌、約84%の古細菌)構成成分であるようである。CRISPR RNA要素をコードするデオキシリボ核酸(DNA)要素は、構造及び長さにおいて比較的保存され得るが、それらのCRISPR関連(CRISPR-associated:Cas)タンパク質は極めて多様であり、多種多様な核酸相互作用ドメインを含有する。CRISPR DNA要素は1987年という早い時期に観察されてきたが、CRISPR/Cas複合体のプログラム可能なエンドヌクレアーゼ切断能力は比較的最近になって初めて認識され、多様なDNA操作及び遺伝子編集用途における組換えCRISPR/Casシステムの使用につながった。
配列表
本出願は、ASCII形式で電子的に提出されている配列表を含み、その全体は参照により本明細書に組み込まれる。2020年5月29日に作成された当該ASCIIコピーの名称は、55921_712_601_SL.txtであり、サイズは24,659,439バイトである。
いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)RuvC_IIIドメイン及びHNHドメインを含むエンドヌクレアーゼであって、当該エンドヌクレアーゼは未培養微生物に由来し、当該エンドヌクレアーゼはクラス2タイプIICasエンドヌクレアーゼである、エンドヌクレアーゼ、並びに(b)エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、RuvC_IIIドメインは、配列番号1827~3637のいずれか1つに対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも88%、少なくとも90%、少なくとも92%、少なくとも95%、又は少なくとも98%の配列同一性を有する配列を含む。
いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)配列番号1827~3637のいずれか1つに対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも88%、少なくとも90%、少なくとも92%、少なくとも95%、又は少なくとも98%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼ、並びに(b)エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。
いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)配列番号5512~5537を含むプロトスペーサー隣接モチーフ(protospacer adjacent motif:PAM)配列に結合するように構成されたエンドヌクレアーゼであって、当該エンドヌクレアーゼがクラス2タイプIICasエンドヌクレアーゼである、エンドヌクレアーゼ、並びに(b)エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。
いくつかの実施形態では、エンドヌクレアーゼは、未培養微生物に由来する。いくつかの実施形態では、エンドヌクレアーゼは、異なるPAM配列へと結合するようには操作されていない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない。いくつかの実施形態では、エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する。いくつかの実施形態では、エンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、tracrリボ核酸配列は、配列番号5476~5511及び配列番号5538のいずれか1つから選択される約60~90個の連続するヌクレオチドに対して、少なくとも80%の配列同一性を有する配列を含む。
いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び(ii)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列を含み、ここで、tracrリボ核酸配列が、配列番号5476~5511及び配列番号5538のいずれか1つから選択された約60~90個の連続するヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、tracrリボ核酸配列を含む、操作されたガイドリボ核酸構造、並びに(b)操作されたガイドリボ核酸に結合するように構成されたクラス2タイプIICasエンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5512~5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている。
いくつかの実施形態では、操作されたガイドリボ核酸構造は、少なくとも2つのリボ核酸ポリヌクレオチドを含む。いくつかの実施形態では、操作されたガイドリボ核酸構造は、ガイドリボ核酸配列及びtracrリボ核酸配列を含む、1つのリボ核酸ポリヌクレオチドを含む。
いくつかの実施形態では、ガイドリボ核酸配列は、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、又はヒトのゲノム配列に相補的である。いくつかの実施形態では、ガイドリボ核酸配列は、15~24ヌクレオチド長である。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端又はC末端に近接した1つ以上の核局在化配列(nuclear localization sequence:NLS)を含む。いくつかの実施形態では、NLSは、配列番号5597~5612から選択される配列を含む。
いくつかの実施形態では、操作されたヌクレアーゼシステムは、5’から3’の順に、標的デオキシリボ核酸配列に対して5’である少なくとも20ヌクレオチドの配列を含む第1のホモロジーアーム、少なくとも10ヌクレオチドの合成DNA配列、及び標的配列に対して3’である少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を更に含む。いくつかの実施形態では、第1のホモロジーアーム又は第2のホモロジーアームは、少なくとも40、80、120、150、200、300、500、又は1,000ヌクレオチドの配列を含む。
いくつかの実施形態では、システムは、Mg2+の供給源を更に含む。
いくつかの実施形態では、エンドヌクレアーゼ及びtracrリボ核酸配列は、同じ門内の異なる細菌種に由来する。いくつかの実施形態では、エンドヌクレアーゼは、デルマバクター(Dermabacter)属に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、ウェルコミクロビウム(Verrucomicrobia)門、カンディダートゥス・ペレグリニバクテリア(Candidatus Peregrinibacteria)門、又はカンディダートゥス・メライナバクテリア(Candidatus Melainabacteria)門に属する細菌に由来する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5592~5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する。
いくつかの実施形態では、HNHドメインは、配列番号5638~5460のいずれか1つに対して少なくとも70%又は少なくとも80%の同一性を有する配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1~1826、又はそれに対して少なくとも55%の同一性を有するそのバリアントを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1827~1830又は配列番号1827~2140からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号3638~3641又は配列番号3638~3954からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5615~5632からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1~4又は配列番号1~319からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。
いくつかの実施形態では、ガイドRNA構造は、配列番号5461~5464、配列番号5476~5479、又は配列番号5476~5489からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ステム及びループからなるヘアピンを含むと予測されるRNA配列を含み、当該ステムが、少なくとも10、少なくとも12、又は少なくとも14塩基対のリボヌクレオチド、及び当該ループの4塩基対以内の非対称バルジを含む。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号5512~5515又は配列番号5527~5530からなる群から選択される配列を含む、PAMへと結合するように構成されている。
いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号1827に対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(b)ガイドRNA構造は、配列番号5461又は配列番号5476の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(c)エンドヌクレアーゼは、配列番号5512又は配列番号5527を含むPAMに結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号1828に対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(b)ガイドRNA構造は、配列番号5462又は配列番号5477の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(c)エンドヌクレアーゼは、配列番号5513又は配列番号5528を含むPAMに結合するように構成されている、いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号1829に対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(b)ガイドRNA構造は、配列番号5463又は配列番号5478の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(c)エンドヌクレアーゼは、配列番号5514又は配列番号5529を含むPAMに結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号1830に対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(b)ガイドRNA構造は、配列番号5464又は配列番号5479の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、(c)エンドヌクレアーゼは、配列番号5515又は配列番号5530を含むPAMに結合するように構成されている。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2141~2142又は配列番号2141~2241からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号3955~3956又は配列番号3955~4055からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5632~5638からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号320~321又は配列番号320~420からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5465、配列番号5490~5491、又は配列番号5490~5494からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、少なくとも8個、少なくとも10個、又は少なくとも12個の塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5516又は配列番号5531からなる群から選択される配列を含む、PAMへと結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2141に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5490に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5531を含むPAMへと結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2142に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5465又は配列番号5491に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5516を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは配列番号2245~2246からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4059~4060からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5639~5648からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号424~425からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5498~5499及び配列番号5539からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8ヌクレオチド及びtracrリボ核酸配列の少なくとも8ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、ここで、tracrリボ核酸配列は、5’から3’に向かって、第1のヘアピン及び第2のヘアピンを含み、第1のヘアピンは、第2のヘアピンよりも長いステムを有する。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2242~2244又は配列番号2247~2249からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4056~4058又は配列番号4061~4063からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5639~5648からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号421~423又は配列番号426~428からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5466~5467、配列番号5495~5497、配列番号5500~5502、及び配列番号5539からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、ガイドリボ核酸配列の少なくとも8ヌクレオチド及びtracrリボ核酸配列の少なくとも8ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、ここで、tracrリボ核酸配列は、5’から3’に向かって、第1のヘアピン及び第2のヘアピンを含み、第1のヘアピンは、第2のヘアピンよりも長いステムを有する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5517~5518又は配列番号5532~5534からなる群から選択される配列を含む、PAMへと結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2247に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5500に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5517又は配列番号5532を含むPAMへと結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2248に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5501に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5518又は配列番号5533を含むPAMへと結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2249に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5502に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5534を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2253又は配列番号2253~2481からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4067又は配列番号4067~4295からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5649によるペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号432又は配列番号432~660からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5468又は配列番号5503からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5519からなる群から選択される配列を含む、PAMへと結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2253に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5468又は配列番号5503に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5519を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2482~2489からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4296~4303からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号661~668からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号2490~2498からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4304~4312からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号669~677からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5504からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2499又は配列番号2499~2750からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4313又は配列番号4313~4564からなる群から選択される配列に対して少なくとも70%、80%、又は90%同一の配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5650~5667からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号678又は配列番号678~929からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5469又は配列番号5505に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5520又は配列番号5535を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2499に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5469又は配列番号5505に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5520又は配列番号5535を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2751又は配列番号2751~2913からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4565又は配列番号4565~4727からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5668~5678からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号930又は配列番号930~1092からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5470又は配列番号5506に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5521又は配列番号5536からなる群から選択される配列を含む、PAMへと結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2751に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5470又は配列番号5506に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5521又は配列番号5536を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号2914又は配列番号2914~3174からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4728又は配列番号4728~4988からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは配列番号5676~5678からなる群から選択される、少なくとも1個、少なくとも2個、又は少なくとも3個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1093又は配列番号1093~1353からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5471、配列番号5507、及び配列番号5540~5542からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、5塩基対未満のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予測される、tracrリボ核酸配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5522を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号2914に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5471又は配列番号5507に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5522を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号3175又は配列番号3175~3330からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号4989又は配列番号4989~5146からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5679~5686からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1354又は配列番号1354~1511からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5472又は配列番号5508からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5523又は配列番号5537からなる群から選択される配列を含む、PAMへと結合するように構成されている。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号3175に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5472又は配列番号5508に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5523又は配列番号5537を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号3331又は配列番号3331~3474からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5147又は配列番号5147~5290からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5674~5675及び配列番号5687~5693からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1512又は配列番号1512~1655からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5473又は配列番号5509からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5524を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号3331に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5473又は配列番号5509に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5524を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号3475又は配列番号3475~3568からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5291又は配列番号5291~5389からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5694~5699からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1656又は配列番号1656~1755からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5474又は配列番号5510に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5525を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号3475に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5474又は配列番号5510に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5525を含むPAMへと結合するように構成される。
いくつかの実施形態では、エンドヌクレアーゼは、配列番号3569又は配列番号3569~3637からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5390又は配列番号5390~5460からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5700~5717からなる群から選択される、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号1756又は配列番号1756~1826からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、ガイドRNA構造は、配列番号5475又は配列番号5511に対して、少なくとも70%、80%、又は90%同一である配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5526を含むPAMに結合するように構成される。いくつかの実施形態では、(a)エンドヌクレアーゼは、配列番号3569に対して少なくとも70%、80%、又は90%同一である配列を含み、(b)ガイドRNA構造は、配列番号5475又は配列番号5511に対して少なくとも70%、80%、又は90%同一である配列を含み、(c)エンドヌクレアーゼは、配列番号5526を含むPAMへと結合するように構成される。いくつかの実施形態では、配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はCLUSTALWによって決定される。いくつかの実施形態では、配列同一性は、3のワード長(W)、10の期待値(E)のパラメータ、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定される。
いくつかの態様では、本開示は、操作されたガイドリボ核酸ポリヌクレオチドであって、(a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含む、DNA標的化セグメント、及び(b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的ストレッチを含む、タンパク質結合セグメントを含み、ここで、ヌクレオチドの2つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、操作されたガイドリボ核酸ポリヌクレオチドは、配列番号1827~3637のいずれか1つに対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも88%、少なくとも90%、少なくとも92%、少なくとも95%、若しくは少なくとも98%の配列同一性を有する配列を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成するか、又は複合体を標的DNA分子の標的配列へと標的化するように構成される、操作されたガイドリボ核酸ポリヌクレオチドを提供する。いくつかの実施形態では、DNA標的化セグメントは、ヌクレオチドの2つの相補的ストレッチの両方の5’に位置する。
いくつかの実施形態では、(a)タンパク質結合セグメントは、配列番号5476~5479若しくは配列番号5476~5489からなる群から選択される配列に対して、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも88%、少なくとも90%、少なくとも92%、少なくとも95%、若しくは少なくとも98%の同一性を有する配列を含み、(b)タンパク質結合セグメントは、(配列番号5490~5491若しくは配列番号5490~5494)及び配列番号5538からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含む、(c)タンパク質結合セグメントは、配列番号5498~5499からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(d)タンパク質結合セグメントは、配列番号5495~5497及び配列番号5500~5502からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(e)タンパク質結合セグメントは、配列番号5503に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(f)タンパク質結合セグメントは、配列番号5504に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(g)タンパク質結合セグメントは、配列番号5505に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(h)タンパク質結合セグメントは、配列番号5506に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(i)タンパク質結合セグメントは、配列番号5507に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(j)タンパク質結合セグメントは、配列番号5508に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(k)タンパク質結合セグメントは、配列番号5509に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、(l)タンパク質結合セグメントは、配列番号5510に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含み、又は(m)タンパク質結合セグメントは、配列番号5511に対して、少なくとも70%、少なくとも80%、若しくは少なくとも90%の同一性を有する配列を含む。
いくつかの実施形態では、(a)ガイドリボ核酸ポリヌクレオチドは、ステム及びループを含むヘアピンを含むRNA配列を含み、ここで、ステムは、少なくとも10、少なくとも12、若しくは少なくとも14塩基対のリボヌクレオチド、及びループの4塩基対以内の非対称バルジを含み、(b)ガイドリボ核酸ポリヌクレオチドは、少なくとも8、少なくとも10、若しくは少なくとも12塩基対のリボヌクレオチドを含むヘアピンを含むと予測される、tracrリボ核酸配列を含み、(c)ガイドリボ核酸ポリヌクレオチドは、ガイドリボ核酸配列の少なくとも8個のヌクレオチド及びtracrリボ核酸配列の少なくとも8個のヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、ここで、tracrリボ核酸配列は、5’から3’に向かって、第1のヘアピン及び第2のヘアピンを含み、第1のヘアピンは、第2のヘアピンよりも長いステムを有し、又は(d)ガイドリボ核酸ポリヌクレオチドは、5塩基対未満のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予測される、tracrリボ核酸配列を含む。
いくつかの態様では、本開示は、本明細書中に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードする、デオキシリボ核酸ポリヌクレオチドを提供する。
いくつかの態様では、本開示は、生物における発現のために最適化された操作核酸配列を含む核酸であって、核酸は、RuvC_IIIドメイン及びHNHドメインを含むクラス2タイプIICasエンドヌクレアーゼをコードし、エンドヌクレアーゼは、未培養微生物に由来する、核酸を提供する。
いくつかの態様では、本開示は、生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸が、配列番号1827~3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする、核酸を提供する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号3638~5460のいずれか1つに対して少なくとも70%又は少なくとも80%の配列同一性を有するHNHドメインを含む。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5572~5591、又はこれに対して少なくとも70%の配列同一性を有するそのバリアントを含む。いくつかの実施形態では、エンドヌクレアーゼは、エンドヌクレアーゼのN末端又はC末端に近接した1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、NLSは、配列番号5597~5612から選択される配列を含む。
いくつかの実施形態では、生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである。いくつかの実施形態では、生物は、大腸菌(E.coli)であり、(a)核酸配列は、配列番号5572~5575からなる群から選択される配列に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(b)核酸配列は、配列番号5576~5577からなる群から選択される配列に対して、少なくとも70%、80%若しくは90%の同一性を有し、(c)核酸配列は、配列番号5578~5580からなる群から選択される配列に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(d)核酸配列は、配列番号5581に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(e)核酸配列は、配列番号5582に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(f)核酸配列は、配列番号5583に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(g)核酸配列は、配列番号5584に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(h)核酸配列は、配列番号5585に対して、少なくとも70%、80%、若しくは90%の同一性を有し、(i)核酸配列は、配列番号5586に対して、少なくとも70%、80%、若しくは90%の同一性を有し、又は(j)核酸配列は、配列番号5587に対して、少なくとも70%、80%、若しくは90%の同一性を有する。いくつかの実施形態では、生物は、ヒトであり、(a)核酸配列は、配列番号5588若しくは配列番号5589に対して、少なくとも70%、80%、若しくは90%の同一性を有し、又は(b)核酸配列は、配列番号5590若しくは配列番号5591に対して、少なくとも70%、80%、若しくは90%の同一性を有する。
いくつかの態様では、本開示は、RuvC_IIIドメイン及びHNHドメインを含むクラス2タイプIICasエンドヌクレアーゼをコードする核酸配列を含むベクターであって、エンドヌクレアーゼが、未培養微生物に由来する、ベクターを提供する。
いくつかの態様では、本開示は、本明細書に記載の核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、(a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び(b)エンドヌクレアーゼに結合するように構成されたtracrリボ核酸配列を含むエンドヌクレアーゼと複合体を形成するように構成された、操作されたガイドリボ核酸構造をコードする核酸を更に含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(adeno-associated virus:AAV)由来ビリオン、又はレンチウイルスである。
いくつかの態様では、本開示は、本明細書に記載のベクターのいずれかを含む細胞を提供する。
いくつかの態様では、本開示は、本明細書に記載の細胞のいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。
いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、(a)二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス2タイプIICasエンドヌクレアーゼと、エンドヌクレアーゼ及び二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において接触させることを含み、(b)二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、(c)PAMは、配列番号5512~5526又は配列番号5527~5537からなる群から選択される配列を含む、方法を提供する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖及びPAMを含む第2の鎖を含む。いくつかの実施形態では、PAMは、操作されたガイドリボ核酸構造の配列に相補的な配列の3’末端に直接隣接している。
いくつかの実施形態では、クラス2タイプIICasエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない。いくつかの実施形態では、クラス2タイプIICasエンドヌクレアーゼは、未培養微生物に由来する。いくつかの実施形態では、二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。
いくつかの実施形態では、(a)PAMは、配列番号5512~5515及び配列番号5527~5530からなる群から選択される配列を含み、(b)PAMは、配列番号5516又は配列番号5531を含み、(c)PAMは、配列番号5539を含み、(d)PAMは、配列番号5517又は配列番号5518を含み、(e)PAMは、配列番号5519を含み、(f)PAMは、配列番号5520又は配列番号5535を含み、(g)PAMは、配列番号5521又は配列番号5536を含み、(h)PAMは、配列番号5522を含み、(i)PAMは、配列番号5523又は配列番号5537を含み、(j)PAMは、配列番号5524を含み、(k)PAMは、配列番号5525を含み、又は(l)PAMは、配列番号5526を含む。
いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法であって、当該方法が、標的核酸遺伝子座へと、本明細書に記載の操作されたヌクレアーゼシステムのいずれかを送達することを含み、ここで、エンドヌクレアーゼが、操作されたガイドリボ核酸構造と複合体を形成するように構成され、複合体が、複合体が標的核酸遺伝子座へと結合する際に複合体が標的核酸遺伝子座を修飾するように構成される、方法を提供する。いくつかの実施形態では、標的核酸遺伝子座を修飾することは、標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む。いくつかの実施形態では、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。いくつかの実施形態では、標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含む。いくつかの実施形態では、標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である。
いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座へと送達することは、本明細書に記載の核酸のいずれか又は本明細書に記載のベクターのいずれかを送達することを含む。いくつかの実施形態では、操作されたヌクレアーゼシステムを標的核酸遺伝子座へと送達することは、エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。いくつかの実施形態では、標的核酸遺伝子座に対する操作されたヌクレアーゼシステムは、エンドヌクレアーゼをコードするオープンリーディングフレームを含有するキャップmRNAを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座に対する操作されたヌクレアーゼシステムは、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、標的核酸遺伝子座に対する操作されたヌクレアーゼシステムは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む。いくつかの実施形態では、エンドヌクレアーゼは、標的遺伝子座で、又は標的遺伝子座に近接して、一本鎖切断又は二本鎖切断を誘導する。
いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)配列番号5718~5846又は配列番号6257のいずれか1つに対して少なくとも75%の配列同一性を有する配列を含むエンドヌクレアーゼ、並びに(b)当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び(ii)当該エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)配列番号5847~5861又は6258~6278を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、当該エンドヌクレアーゼがクラス2タイプIICasエンドヌクレアーゼである、エンドヌクレアーゼ、並びに(b)当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び(ii)当該エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造を含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、当該エンドヌクレアーゼは、未培養微生物に由来する。いくつかの実施形態では、当該エンドヌクレアーゼは、異なるPAM配列へと結合するようには操作されていない。いくつかの実施形態では、当該エンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない。いくつかの実施形態では、当該エンドヌクレアーゼは、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する。いくつかの実施形態では、当該リボ核酸配列は、(a)配列番号5886~5887、5891、5893、若しくは5894のいずれか1つ、又は(b)配列番号5862~5885、5888~5890、5892、5895~5896、若しくは6279~6301のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む。いくつかの態様では、本開示は、操作されたヌクレアーゼシステムであって、(a)操作されたガイドリボ核酸構造であって、(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び(ii)エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含み、ここで、当該リボ核酸配列が、(a)配列番号5886~5887、5891、5893、若しくは5894のいずれか1つ、又は(b)配列番号5862~5885、5888~5890、5892、5895~5896又は6279~6301のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造、及び当該操作されたガイドリボ核酸に結合するように構成されたクラス2タイプIICasエンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。いくつかの実施形態では、エンドヌクレアーゼは、配列番号5847~5861又は配列番号6258~6278を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている。いくつかの実施形態では、当該ガイドリボ核酸配列は、15~24ヌクレオチド長又は19~24ヌクレオチド長である。いくつかの実施形態では、当該エンドヌクレアーゼは、当該エンドヌクレアーゼのN末端又はC末端に近接した1つ以上の核局在化配列(NLS)を含む。いくつかの実施形態では、当該NLSは、配列番号5597~5612から選択される配列を含む。いくつかの実施形態では、システムは、5’から3’の順で、当該標的デオキシリボ核酸配列に対して5’である少なくとも20ヌクレオチドの配列を含む第1のホモロジーアーム、少なくとも10ヌクレオチドの合成DNA配列、及び当該標的配列に対して3’である少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を更に含む。いくつかの実施形態では、当該第1のホモロジーアーム又は第2のホモロジーアームは、少なくとも40、80、120、150、200、300、500、又は1,000ヌクレオチドの配列を含む。いくつかの実施形態では、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はCLUSTALWによって決定される。いくつかの実施形態では、当該配列同一性は、3のワード長(W)、10の期待値(E)のパラメータ、及び11の存在、1の拡張におけるBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、当該BLASTP相同性検索アルゴリズムによって決定される。
いくつかの態様では、本開示は、操作されたガイドリボ核酸ポリヌクレオチドであって、(a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含む、DNA標的化セグメント、及び(b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的ストレッチを含む、タンパク質結合セグメントを含み、ここで、当該ヌクレオチドの2つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、当該操作されたガイドリボ核酸ポリヌクレオチドは、配列番号5718~5846又は配列番号6257のいずれか1つに対して少なくとも75%の配列同一性を有する配列を含むエンドヌクレアーゼと複合体を形成し、かつ当該複合体を当該標的DNA分子の当該標的配列へと標的化するように構成される、操作されたガイドリボ核酸ポリヌクレオチドを提供する。いくつかの実施形態では、当該DNA標的化セグメントは、当該ヌクレオチドの2つの相補的ストレッチの両方の5’に位置する。
いくつかの態様では、本開示は、本明細書中に記載される操作されたガイドリボ核酸ポリヌクレオチドのいずれかをコードする、デオキシリボ核酸ポリヌクレオチドを提供する。
いくつかの態様では、本開示は、生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸が、配列番号5718~5846又は配列番号6257のいずれか1つに対して少なくとも75%の配列同一性を有する配列を含むエンドヌクレアーゼをコードする、核酸を提供する。いくつかの実施形態では、当該エンドヌクレアーゼは、当該エンドヌクレアーゼのN末端又はC末端に近接した1つ以上の核局在化配列(NLS)をコードする配列を含む。いくつかの実施形態では、当該NLSは、配列番号5597~5612から選択される配列を含む。いくつかの実施形態では、当該生物は、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである。
いくつかの態様では、本開示は、本明細書に記載の核酸のいずれかを含むベクターを提供する。いくつかの実施形態では、ベクターは、(a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び(b)当該エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造をコードする核酸を更に含む。いくつかの実施形態では、ベクターは、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(adeno-associated virus:AAV)由来ビリオン、又はレンチウイルスである。
いくつかの態様では、本開示は、本明細書に記載のベクターのいずれかを含む細胞を提供する。
いくつかの態様では、本開示は、本明細書に記載の細胞のいずれかを培養することを含む、エンドヌクレアーゼを製造する方法を提供する。
いくつかの態様では、本開示は、二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、当該二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス2タイプIICasエンドヌクレアーゼと、当該エンドヌクレアーゼ及び当該二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において接触させることを含み、ここで、当該二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、当該PAMは、配列番号5847~5861又は配列番号6258~6278からなる群から選択される配列を含む、方法を提供する。いくつかの実施形態では、当該二本鎖デオキシリボ核酸ポリヌクレオチドは、当該操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖及び当該PAMを含む第2の鎖を含む。いくつかの実施形態では、当該PAMは、当該操作されたガイドリボ核酸構造の当該配列に相補的な当該配列の3’末端に直接隣接している。いくつかの実施形態では、当該クラス2タイプIICasエンドヌクレアーゼは、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない。いくつかの実施形態では、当該二本鎖デオキシリボ核酸ポリヌクレオチドは、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである。
いくつかの態様では、本開示は、標的核酸遺伝子座を修飾する方法であって、当該方法が、当該標的核酸遺伝子座へと、本明細書に記載の操作されたヌクレアーゼシステムのいずれかを送達することを含み、ここで、当該エンドヌクレアーゼが、当該操作されたガイドリボ核酸構造と複合体を形成するように構成され、当該複合体が、当該複合体が標的核酸遺伝子座へと結合する際に当該複合体が当該標的核酸遺伝子座を修飾するように構成される、方法を提供する。いくつかの実施形態では、当該標的核酸遺伝子座は、当該標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む。いくつかの実施形態では、当該標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。いくつかの実施形態では、当該標的核酸は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含む。いくつかの実施形態では、当該標的核酸遺伝子座は、インビトロである。いくつかの実施形態では、当該標的核酸遺伝子座は、細胞内にある。いくつかの実施形態では、当該細胞は、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である。いくつかの実施形態では、当該標的核酸遺伝子座に対する当該操作されたヌクレアーゼシステムは、本明細書に記載の核酸のいずれか又は本明細書に記載のベクターのいずれかを送達することを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することは、当該エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む。いくつかの実施形態では、当該核酸は、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームが動作可能に連結されたプロモーターを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAを送達することを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、翻訳されたポリペプチドを送達することを含む。いくつかの実施形態では、当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む。いくつかの実施形態では、当該エンドヌクレアーゼは、標的遺伝子座で、又は当該標的遺伝子座に近接して、一本鎖切断又は二本鎖切断を誘導する。
いくつかの態様では、本開示は、細胞内のTRAC遺伝子座を編集する方法であって、当該細胞を、(a)RNAガイドエンドヌクレアーゼ及び(b)操作されたガイドRNAと接触させることを含み、ここで、当該操作されたガイドRNAは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドRNAは、当該TRAC遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドRNAは、配列番号5950~5958又は配列番号5959~5965のいずれか1つの、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24ヌクレオチドの連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号5950~5958のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号421に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号5959~5965のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号423に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号5953~5957のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号5960~5961又は配列番号5963~5964のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。
いくつかの態様では、本開示は、細胞内のTRBC遺伝子座を編集する方法であって、当該細胞を、(a)RNAガイドエンドヌクレアーゼ及び(b)操作されたガイドRNAと接触させることを含み、ここで、当該操作されたガイドRNAは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドRNAは、当該TRBC遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドRNAは、配列番号5966~6004又は配列番号6005~6025のいずれか1つの、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24ヌクレオチドの連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号5966~6004のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号421に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6005~6025のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号423に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号5970、5971、5983、又は5984のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6006、6010、6011、又は6012のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。
いくつかの態様では、本開示は、細胞内のGR(NR3C1)遺伝子座を編集する方法であって、当該細胞を、(a)RNAガイドエンドヌクレアーゼ及び(b)操作されたガイドRNAと接触させることを含み、ここで、当該操作されたガイドRNAは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドRNAは、当該GR(NR3C1)遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドRNAは、配列番号6026~6090又は配列番号6091~6121のいずれか1つの、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24ヌクレオチドの連続するヌクレオチド連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6026~6090のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号421に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6091~6121のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号423に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6027~6028、6029、6038、6043、6049、6076、6080、6081、又は6086のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6092、6115、又は6119のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。
いくつかの態様では、本開示は、細胞内のAAVS1遺伝子座を編集する方法であって、当該細胞を、(a)RNAガイドエンドヌクレアーゼ及び(b)操作されたガイドRNAと接触させることを含み、ここで、当該操作されたガイドRNAは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドRNAは、当該AAVS1遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドRNAは、配列番号6122~6152のいずれか1つの、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24ヌクレオチドの連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6122、6125~6126、6128、6131、6133、6136、6141、6143、又は6148のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。
いくつかの態様では、本開示は、細胞内のTIGIT遺伝子座を編集する方法であって、当該細胞を、(a)RNAガイドエンドヌクレアーゼ及び(b)操作されたガイドRNAと接触させることを含み、ここで、当該操作されたガイドRNAは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドRNAは、当該TIGIT遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドRNAは、配列番号6153~6181のいずれか1つの、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24ヌクレオチドの連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号66155、6159、616、又は6172のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。
いくつかの態様では、本開示は、細胞内のCD38遺伝子座を編集する方法であって、当該細胞を、(a)RNAガイドエンドヌクレアーゼ及び(b)操作されたガイドRNAと接触させることを含み、ここで、当該操作されたガイドRNAは、当該エンドヌクレアーゼと複合体を形成するように構成され、当該操作されたガイドRNAは、当該CD38遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含み、当該操作されたガイドRNAは、配列番号6182~6248又は配列番号6249~6256のいずれか1つの、少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24ヌクレオチドの連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する標的配列を含む、方法を提供する。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの実施形態では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6182~6248のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号421に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6249~6256のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、当該エンドヌクレアーゼは、配列番号423に対して少なくとも75%の同一性を有する配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6182~6183、6189、6191、6208、6210、6211、又は6215のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。いくつかの実施形態では、当該操作されたガイドRNAは、配列番号6251の少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む。
上記の細胞中の特定の遺伝子座を編集する方法のいずれかのいくつかの実施形態では、当該細胞は、末梢血単核細胞、T細胞、NK細胞、造血幹細胞(hematopoietic stem cell:HSCT)、若しくはB細胞、又はこれらの任意の組合せである。
いくつかの態様では、本開示は、操作されたガイドリボ核酸ポリヌクレオチドであって、(a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含む、DNA標的化セグメント、及び(b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的ストレッチを含むタンパク質結合セグメントを含み、ここで、当該ヌクレオチドの2つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、当該操作されたガイドリボ核酸ポリヌクレオチドは、クラス2タイプIICasエンドヌクレアーゼと複合体を形成し、かつ当該複合体を当該標的DNA分子の当該標的配列へと標的化するように構成され、当該DNA標的化セグメントは、配列番号5950~5965、5966~6025、6026~6121、6122~6152、6153~6181、又は6182~6256のいずれか1つの少なくとも19、少なくとも20、少なくとも21、少なくとも22、少なくとも23、又は少なくとも24の連続するヌクレオチドに対して、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む、操作されたガイドリボ核酸ポリヌクレオチドを提供する。いくつかの実施形態では、当該タンパク質結合セグメントは、配列番号5466又は配列番号6304のいずれか1つに対して少なくとも85%の同一性を有する配列を含む。
いくつかの態様では、本開示は、編集された免疫細胞を生成するためのシステムであって、(a)RNAガイドエンドヌクレアーゼと、(b)当該RNAガイドエンドヌクレアーゼに結合するように構成された、請求項97に記載の操作されたガイドリボ核酸ポリヌクレオチドと、(c)キメラ抗原受容体(chimeric antigen receptor:CAR)をコードする配列に隣接する第1のホモロジーアーム及び第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型と、を含む、システムを提供する。いくつかの実施形態では、当該細胞は、末梢血単核細胞、T細胞、NK細胞、造血幹細胞(HSCT)、若しくはB細胞、又はこれらの任意の組合せである。いくつかの態様では、当該RNAガイドエンドヌクレアーゼは、クラスIIタイプIICasエンドヌクレアーゼである。いくつかの態様では、当該RNAガイドエンドヌクレアーゼは、配列番号2242又は配列番号2244に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含むRuvCIIIドメインを含む。いくつかの態様では、当該RNAガイドエンドヌクレアーゼは、HNHドメインを更に含む。いくつかの態様では、当該RNAガイドエンドヌクレアーゼは、配列番号421又は配列番号423に対して、少なくとも75%の同一性、少なくとも80%の同一性、少なくとも82%の同一性、少なくとも84%の同一性、少なくとも86%の同一性、少なくとも88%の同一性、少なくとも90%の同一性、少なくとも91%の同一性、少なくとも92%の同一性、少なくとも93%の同一性、少なくとも94%の同一性、少なくとも95%の同一性、少なくとも96%の同一性、少なくとも97%の同一性、少なくとも98%の同一性、少なくとも99%の同一性、又は少なくとも100%の同一性を有する配列を含む。
本開示の更なる態様及び利点は、本開示の例示的な実施形態のみが示され説明される以下の詳細な説明から当業者には容易に明らかになるであろう。理解されるように、本開示は、他の異なる実施形態が可能であり、そのいくつかの詳細は、全て本開示から逸脱することなく、様々な明白な点で修正が可能である。したがって、図面及び説明は、本質的に例示と見なされるべきであり、限定と見なされるべきではない。
参照による組込み
本明細書で言及される全ての刊行物、特許、及び特許出願は、あたかも各個々の刊行物、特許、又は特許出願が参照により組み込まれることが具体的かつ個別に示されているのと同程度に、参照により本明細書に組み込まれる。
本発明の新規な特徴は、添付の特許請求の範囲に詳細に記載されている。本発明の特徴及び利点のより良い理解は、本発明の原理が利用される例示的な実施形態を説明する以下の詳細な説明、及び添付の図面(また、本明細書では「図面(Figure)」及び「図(FIG.)」)を参照することによって得られるであろう。
図1は、異なるクラス及び型のCRISPR/Cas遺伝子座の典型的な組織を示す。 図2は、両方が結合しているハイブリッドsgRNAと比較した、天然のクラス2/II型 crRNA/tracrRNA対の構造を示す。 図3は、MG1ファミリーからの酵素をコードする、CRISPR遺伝子座の組織を示す概略図を示す。 図4は、MG2ファミリーからの酵素をコードする、CRISPR遺伝子座の組織を示す概略図を示す。 図5は、MG3ファミリーからの酵素をコードする、CRISPR遺伝子座の組織を示す概略図を示す。 図6は、黄色ブドウ球菌(Staphylococcus aureus)(配列番号5613)からのCas9に対する本開示の酵素(MG1-1)の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。 図7は、黄色ブドウ球菌(Staphylococcus aureus)からのCas9(配列番号5613)に対する本開示の酵素(MG2-1)の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。 図8は、アクチノミセス・ネスルンディ(Actinomyces naeslundii)からのCas9(配列番号5614)に対する本開示の酵素(MG3-1)の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。 図9Aは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Bは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Cは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Dは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Eは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Fは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Gは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。 図9Hは、MG1ファミリー酵素MG1-1からMG1-6(配列番号5、6、9、1、2及び3)の構造に基づくアラインメントを示す。機能についての予測された必須残基は、配列の下で呼び出される。保存された残基は黒色で強調する。 図10は、様々な長さの標的化配列を含有するその対応するsgRNAとの複合体におけるMG1-4によるDNAのインビトロ切断を示す。 図11は、MG1-4をその対応するsgRNAと共に使用いる大腸菌(E.coli)ゲノムDNAの細胞切断を示す。MG1-4で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す(上部)。上部のパネルは定量されたデータを示し、ここで、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。 図12は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例11に記載されるMG1-4又はMG1-6構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図13は、様々な長さの標的化配列を含有するその対応するsgRNAとの複合体におけるMG3-6によるDNAのビトロ切断を示す。 図14は、MG3-7をその対応するsgRNAと共に使用いる大腸菌(E.coli)ゲノムDNAの細胞切断を示す。MG3-7で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す(上部)。下部のパネルは定量されたデータを示し、ここで、左のバーは非標的sgRNAを表し、右のバーは標的sgRNAを表す。 図15は、ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例13に記載されるMG3-7構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図16は、様々な長さの標的化配列を含有するその対応するsgRNAとの複合体におけるMG15-1によるDNAのインビトロ切断を示す。 図17は、様々なMGファミリーヌクレアーゼ及びそれらの対応するtracrRNA又はsgRNAを含有するTXTL抽出物の存在下における、PAMベクターライブラリー切断の結果を示すアガロースゲルを示す。 図18は、様々なMGファミリーヌクレアーゼ及びそれらの対応するtracrRNA又はsgRNAを含有するTXTL抽出物の存在下における、PAMベクターライブラリー切断の結果を示すアガロースゲルを示す。 図19は、様々なMGファミリーヌクレアーゼ及びそれらの対応するtracrRNA又はsgRNAを含有するTXTL抽出物の存在下における、PAMベクターライブラリー切断の結果を示すアガロースゲルを示す。 図20は、様々なMGファミリーヌクレアーゼ及びそれらの対応するtracrRNA又はsgRNAを含有するTXTL抽出物の存在下における、PAMベクターライブラリー切断の結果を示すアガロースゲルを示す。 図21は、本明細書中に記載のMG酵素の対応するsgRNAの予測された構造(例えば、実施例7のように予測)を示す。 図22は、本明細書中に記載のMG酵素の対応するsgRNAの予測された構造(例えば、実施例7のように予測)を示す。 図23は、本明細書中に記載のMG酵素の対応するsgRNAの予測された構造(例えば、実施例7のように予測)を示す。 図24は、本明細書中に記載のMG酵素の対応するsgRNAの予測された構造(例えば、実施例7のように予測)を示す。 図25は、本明細書中に記載のMG酵素の対応するsgRNAの予測された構造(例えば、実施例7のように予測)を示す。 図26は、本明細書中に記載のMG酵素の対応するsgRNAの予測された構造(例えば、実施例7のように予測)を示す。 図27は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図28は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図29は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図30は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図31は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図32は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図33は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図34は、MG2-7をその対応するsgRNAと共に使用いる大腸菌(E.coli)ゲノムDNAの細胞切断を示す。MG2-7で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す(上部)。下部のパネルは定量されたデータを示し、ここで、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。 図35は、MG14-1をその対応するsgRNAと共に使用いる大腸菌(E.coli)ゲノムDNAの細胞切断を示す。MG14-1で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す(上部)。下部のパネルは定量されたデータを示し、ここで、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。 図36は、MG15-1をその対応するsgRNAと共に使用いる大腸菌(E.coli)ゲノムDNAの細胞切断を示す。MG15-1で形質転換した細胞の希釈系列を標的又は非標的スペーサーと共に示す(上部)。下部のパネルは定量されたデータを示し、ここで、右のバーは非標的sgRNAを表し、左のバーは標的sgRNAを表す。 図37は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例11に記載されるMG1-4、MG1-6、及びMG1-7構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図38は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例11に記載されるMG1-4、MG1-6、及びMG1-7構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図39は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例11に記載されるMG1-4、MG1-6、及びMG1-7構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図40は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例13に記載されるMG3-6、MG3-7、及びMG3-8構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図41は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例13に記載されるMG3-6、MG3-7、及びMG3-8構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図42は、ヒトゲノム中の様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例13に記載されるMG3-6、MG3-7、及びMG3-8構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図43は、ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例14に記載されるMG14-1構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図44は、ヒトゲノムの様々な位置を標的化する様々な異なる標的化配列を含有するそれらの対応するsgRNAと共に、実施例17に記載されるMG18-1構築物によるHEK細胞のトランスフェクションによって生成された細胞インデル形成を示す。 図45は、本明細書中に記載されるヌクレアーゼの環境分布を示す。選択されたタンパク質ファミリーの代表について、タンパク質長を示す。色は、各タンパク質が同定された環境又は環境型を示す。 図46は、本明細書中に記載されるヌクレアーゼの予測される触媒残基を示す。選択されたタンパク質ファミリーの代表について、タンパク質長を示す。色は、各タンパク質について予測された触媒残基の数を示す。本明細書に記載のエフェクター酵素について、HNH及びRuvCドメインに対応する6つの触媒残基を検索した。 図47は、本明細書中に記載されるヌクレアーゼの候補活性対タンパク質長を示す。 図48は、本明細書中に記載されるヌクレアーゼについて予測された触媒残基の数を示す。 図49は、本明細書中に記載される選択ヌクレアーゼの様々な特徴的な情報の表を示す。 図50は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図51は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図52は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図53は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図54は、本明細書中に記載されるようなNGSによって誘導されるPAM配列のseqLogo表現を示す(例えば、実施例6に記載される通り)。 図55は、MG3-6及びMG3-8によるTRACでのガイドRNAスクリーニングを示す。上部パネル(MG3-6)について、x軸番号は、配列番号5950~5958に対応するスペーサーを指す。下部パネル(MG3-8)について、x軸番号は、配列番号5959~5965に対応するスペーサーを指す。 図56は、様々なコア配列、長さ、及び用量のガイドRNAを用いたMG3-6の活性(インデル%)を示す。 図57は、様々な配列及び長さのガイドRNAを用いたMG3-8の活性(インデル%)を示す。 図58は、TRACガイド6を有するMG3-6及びTRACガイド8を有するMG3-8の活性(インデル%)を示す。 図59は、フローサイトメトリによるT細胞受容体発現に対するTRAC6ガイドRNAによるMG3-6の効果を示す。編集後の生存率に変化はなかった。 図60は、より多量のgRNAによるTRAC編集効率の増加を示す。 図61は、TCR発現が、どのように排除され、CAR発現と置き換えられ得るかを示す。 図62は、MG3-6との標的化CARインテグレーションを示す。 図63は、NR3Cl遺伝子の様々なエクソンを標的化する様々なガイドRNAによる、MG3-6によるGR(NR3Cl)編集を示す。 図64は、NR3Cl遺伝子の様々なエクソンを標的化する様々なガイドRNAによる、MG3-8によるGR(NR3Cl)編集を示す。 図65は、GR編集を、2つのMG3-6バッチ及び様々なガイドRNAと比較する。 図66は、遺伝子編集が同種異系CAR-NK細胞を作製するためにどのように使用され得るかのプロセスを示す。 図67は、TRAC6ガイドRNAと共にMG3-6を用いるTRAC編集を示す。 図68は、フローサイトメトリによるCD56+NK細胞における、MG3-6によるCAR発現(Y軸)を示す。 図69は、様々なガイドRNAと共にMG3-6及びMG3-8を用いる初代NK細胞におけるCD38編集を示す。 図70は、様々なガイドRNAによるMG3-6及びMG3-8による造血幹細胞におけるTRAC編集を示す。 図71は、2つの異なる緩衝液を用いる、TRACガイド6によるMG3-6によるB細胞におけるTRAC編集を示す。 図72は、実施例25の方法によって決定された、MG48-1(A)及びMG48-3(B)のコンセンサスPAM配列を示す。 図73は、MG48-1(A)及びMG48-3(B)について実施例25の方法によって行われた場合の、シーケンシングされたtracr領域が強調表示されたRNAseqマッピングを示す。
配列表の簡単な説明
本明細書と共に提出される配列表は、本開示にかかる方法、組成物、及びシステムにおいて使用するための例示的なポリヌクレオチド及びポリペプチド配列を提供する。以下は、その中の配列の例示的な説明である。
MG1
配列番号1~319は、MG1ヌクレアーゼの全長ペプチド配列を示す。
配列番号1827~2140は、上記のMG1ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号3638~3955は、上記のMG1ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5476~5479は、上記のMG1ヌクレアーゼ(例えば、それぞれ配列番号1~4と同じ遺伝子座)と同じ遺伝子座に由来するMG1 tracrRNAのヌクレオチド配列を示す。
配列番号5461~5464は、MG1ヌクレアーゼ(例えば、それぞれ配列番号1~4)で機能するように操作されたsgRNAのヌクレオチド配列を示し、ここで、Nsとは標的化配列のヌクレオチドを示す。
配列番号5572~5575は、MG1ファミリー酵素(配列番号1~4)の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5588~5589は、MG1ファミリー酵素(配列番号1及び3)に対するヒトコドン最適化コード配列のヌクレオチド配列を示す。
配列番号5616~5632は、MG1ファミリー酵素に特徴的なペプチドモチーフを示す。
MG2
配列番号320~420は、MG2ヌクレアーゼの全長ペプチド配列を示す。
配列番号2141~2241は、上記のMG2ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号3955~4055は、上記のMG2ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5490~5494は、上記のMG2ヌクレアーゼと同じ遺伝子座(例えば、それぞれ、配列番号320、321、323、325、及び326と同じ遺伝子座)に由来するMG2 tracrRNAのヌクレオチド配列を示す。
配列番号5465は、MG2ヌクレアーゼ(例えば、上記の配列番号321)で機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5572~5575は、MG2ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5631~5638は、MG2ファミリー酵素に特徴的なペプチド配列を示す。
MG3
配列番号421~431は、MG3ヌクレアーゼの全長ペプチド配列を示す。
配列番号2242~2252は、上記のMG3ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4056~4066は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5495~5502は、上記のMG3ヌクレアーゼと同じ遺伝子座に由来するMG3 tracrRNAのヌクレオチド配列を示す(例えば、それぞれ配列番号421~428と同じ遺伝子座)。
配列番号5466~5467は、MG3ヌクレアーゼ(例えば、配列番号421~423)と共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5578~5580は、MG3ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5639~5648は、MG3ファミリー酵素に特徴的なペプチド配列を示す。
MG4
配列番号432~660は、MG4ヌクレアーゼの全長ペプチド配列を示す。
配列番号2253~2481は、上記のMG4ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4067~4295は、上記のMG4ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5503は、上記のMG4ヌクレアーゼと同じ遺伝子座に由来するMG4 tracrRNAのヌクレオチド配列を示す。
配列番号5468は、MG4ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5649は、MG4ファミリー酵素に特徴的なペプチド配列を示す。
MG6
配列番号661~668は、MG6ヌクレアーゼの全長ペプチド配列を示す。
配列番号2482~2489は、上記のMG6ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4296~4303は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。
MG7
配列番号669~677は、MG7ヌクレアーゼの全長ペプチド配列を示す。
配列番号2490~2498は、上記のMG7ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4304~4312は、上記のMG3ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5504は、上記のMG7ヌクレアーゼと同じ遺伝子座に由来するMG7 tracrRNAのヌクレオチド配列を示す。
MG14
配列番号678~929は、MG14ヌクレアーゼの全長ペプチド配列を示す。
配列番号2499~2750は、上記のMG14ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4313~4564は、上記のMG14ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5505は、上記のMG14ヌクレアーゼと同じ遺伝子座に由来するMG14 tracrRNAのヌクレオチド配列を示す。
配列番号5581は、MG14ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5650~5667は、MG14ファミリー酵素に特徴的なペプチド配列を示す。
MG15
配列番号930~1092は、MG15ヌクレアーゼの全長ペプチド配列を示す。
配列番号2751~2913は、上記のMG15ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4565~4727は、上記のMG15ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5506は、上記のMG15ヌクレアーゼと同じ遺伝子座に由来するMG15 tracrRNAのヌクレオチド配列を示す。
配列番号5470は、MG15ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5582は、MG15ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5668~5675は、MG15ファミリー酵素に特徴的なペプチド配列を示す。
MG16
配列番号1093~1353は、MG16ヌクレアーゼの全長ペプチド配列を示す。
配列番号2914~3174は、上記のMG16ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4728~4988は、上記のMG16ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5507は、上記のMG3ヌクレアーゼと同じ遺伝子座に由来するMG16 tracrRNAのヌクレオチド配列を示す。
配列番号5471は、MG16ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5583は、MG16ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5676~5678は、MG16ファミリー酵素に特徴的なペプチド配列を示す。
MG18
配列番号1354~1511は、MG18ヌクレアーゼの全長ペプチド配列を示す。
配列番号3175~3330は、上記のMG18ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号4989~5146は、上記のMG18ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5508は、上記のMG18ヌクレアーゼと同じ遺伝子座に由来するMG18 tracrRNAのヌクレオチド配列を示す。
配列番号5472は、MG18ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5584は、MG18ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5679~5686は、MG18ファミリー酵素に特徴的なペプチド配列を示す。
MG21
配列番号1512~1655は、MG21ヌクレアーゼの全長ペプチド配列を示す。
配列番号3331~3474は、上記のMG21ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号5147~5290は、上記のMG21ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5509は、上記のMG21ヌクレアーゼと同じ遺伝子座に由来するMG21 tracrRNAのヌクレオチド配列を示す。
配列番号5473は、MG21ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5585は、MG21ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5687~5692及び配列番号5674~5675は、MG21ファミリー酵素に特徴的なペプチド配列を示す。
MG22
配列番号1656~1755は、MG22ヌクレアーゼの全長ペプチド配列を示す。
配列番号3475~3568は、上記のMG22ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号5291~5389は、上記のMG22ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5510は、上記のMG22ヌクレアーゼと同じ遺伝子座に由来するMG22 tracrRNAのヌクレオチド配列を示す。
配列番号5474は、MG22ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5586は、MG22ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5694~5699は、MG22ファミリー酵素に特徴的なペプチド配列を示す。
MG23
配列番号1756~1826は、MG23ヌクレアーゼの全長ペプチド配列を示す。
配列番号3569~3637は、上記のMG23ヌクレアーゼのRuvC_IIIドメインのペプチド配列を示す。
配列番号5390~5460は、上記のMG23ヌクレアーゼのHNHドメインのペプチドを示す。
配列番号5511は、上記のMG23ヌクレアーゼと同じ遺伝子座に由来するMG23 tracrRNAのヌクレオチド配列を示す。
配列番号5475は、MG23ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5587は、MG23ファミリー酵素の大腸菌(E.coli)コドン最適化コード配列のヌクレオチド配列を示す。
配列番号5700~5717は、MG23ファミリー酵素に特徴的なペプチド配列を示す。
MG40
配列番号5718~5750は、MG40ヌクレアーゼの全長ペプチド配列を示す。
配列番号5847~5852は、MG40ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5862~5873は、MG40ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
MG47
配列番号5751~5768は、MG47ヌクレアーゼの全長ペプチド配列を示す。
配列番号5853~5854は、MG47ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5878~5881は、MG47ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
MG48
配列番号5769~5804は、MG48ヌクレアーゼの全長ペプチド配列を示す。
配列番号5855~5856は、MG48ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5886、5890、及び5893は、上記のMG48ヌクレアーゼと同じ遺伝子座に由来するMG48 tracrRNAのヌクレオチド配列を示す。
配列番号5887、5891、及び5894は、本明細書に記載のMG48ヌクレアーゼに関連するCRISPRリピートを示す。
配列番号5888~5889、5892、及び5895~5896は、MG48ヌクレアーゼと共に機能するように設計された推定sgRNAを示す。
MG49
配列番号5805~5823は、MG49ヌクレアーゼの全長ペプチド配列を示す。
配列番号5857~5858は、MG49ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5862~5873は、MG40ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
配列番号5876~5877は、MG49ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
MG50
配列番号5824~5826は、MG50ヌクレアーゼの全長ペプチド配列を示す。
配列番号5859は、MG50ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5884~5885は、MG50ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
MG51
配列番号5827~5830は、MG51ヌクレアーゼの全長ペプチド配列を示す。
配列番号5860は、MG51ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5882~5883は、MG51ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
MG52
配列番号5831~5846は、MG52ヌクレアーゼの全長ペプチド配列を示す。
配列番号5861は、MG52ヌクレアーゼに関連するプロトスペーサー隣接モチーフを示す。
配列番号5874~5875は、MG42ヌクレアーゼと共に機能するように操作されたsgRNAのヌクレオチド配列を示す。
本発明の様々な実施形態を本明細書に示し説明してきたが、そのような実施形態が例としてのみ提供されることは当業者には明らかであろう。当業者には、本発明から逸脱することなく、多数のバリエーション、変更、及び置換が思い浮かび得る。本明細書に記載の本発明の実施形態に対する様々な代替形態が、採用され得ることを理解するべきである。
本明細書中に開示されるいくつかの方法の実施は、別段示されない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、及び組換えDNAの技術を採用する。例えば、Sambrook及びGreen、「Molecular Cloning:A Laboratory Manual」、第4版(2012年);「the series Current Protocols in Molecular Biology」(F.M.Ausubelら編);「the series Methods In Enzymology」(Academic Press,Inc.)、「PCR 2:A Practical Approach」(M.J.MacPherson、B.D.Hames及びG.R.Taylor編(1995年))、Harlow及びLane編(1988年)、「Antibodies,A Laboratory Manual,and Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications」、第6版(R.I.Freshney編(2010年)(これは、参照により全体が本明細書に組み込まれる)。
本明細書で使用される場合、単数形「a」、「an」、及び「the」は、文脈が明らかにそうでないことを示さない限り、複数形も含むことが意図される。更に、「含む(including)」、「含む(includes)」、「有する(having)」、「有する(has)」、「有する(with)」という用語、又はそれらの変形が、詳細な説明及び/又は特許請求の範囲のいずれかで使用される限り、そのような用語は、「含むこと(comprising)」という用語と同様に包括的な様式であることを意図している。
「約(about)」又は「およそ(approximately)」という用語は、当業者によって決定される特定の値の許容可能な誤差範囲内を意味し、これは、値がどのように測定又は決定されるか、すなわち測定システムの制限に部分的に依存する。例えば、「約(about)」は、当技術分野の慣例に従って、1つ又は2つ以上の標準偏差内を意味し得る。あるいは、「約(about)」は、所与の値の最大20%、最大15%、最大10%、最大5%、又は最大1%の範囲を意味し得る。
本明細書で使用される場合、「細胞」は、概して、生物学的細胞を指す。細胞は、生物の基本的な構造、機能、及び/又は生物学的単位であり得る。細胞は、1つ以上の細胞を有する任意の生物に由来し得る。いくつかの非限定的な例としては、原核細胞、真核細胞、細菌細胞、古細菌細胞、単一細胞真核生物の細胞、原虫細胞、植物由来の細胞(例えば、植物作物、果実、野菜、穀物、ダイズ、トウモロコシ(corn)、トウモロコシ(maize)、コムギ、種子、トマト、イネ、キャッサバ、サトウキビ、カボチャ、乾草、ジャガイモ、ワタ、大麻、タバコ、顕花植物、針葉樹、裸子植物、シダ、ヒカゲノカズラ、ツノゴケ類、ゼニゴケ、コケ)、藻類細胞(例えば、ボツリオコッカス・ブラウニー(Botryococcus braunii)、コナミドリムシ(Chlamydomonas reinhardtii)、ナンノクロロプシス・ガディタナ(Nannochloropsis gaditana)、クロレラ・ピレノイドサ(Chlorella pyrenoidosa)、及びヤツマタモク(Sargassum patens C.Agardh)など)、海藻(例えば、ケルプ)、真菌細胞(例えば、酵母細胞、キノコ由来の細胞)、動物細胞、無脊椎動物由来の細胞(例えば、ショウジョウバエ、刺胞動物、エキノデルム、線虫等)、脊椎動物由来の細胞(例えば、魚、両生類、爬虫類、鳥類、哺乳動物)、並びに哺乳動物由来の細胞(例えば、ブタ、ウシ、ヤギ、ヒツジ、げっ歯類、ラット、マウス、非ヒト霊長類、ヒト等)等が挙げられる。細胞は、天然の生物に由来しない場合がある(例えば、細胞は、人工細胞と称されることもある、合成的に作製されたものであり得る)。
本明細書で使用される場合、「ヌクレオチド」という用語は、概して、塩基-糖-リン酸の組合せを指す。ヌクレオチドは、合成ヌクレオチドを含み得る。ヌクレオチドは、合成ヌクレオチド類似体を含み得る。ヌクレオチドは、核酸配列のモノマー単位(例えば、デオキシリボ核酸(DNA)及びリボ核酸(RNA))であり得る。ヌクレオチドという用語は、リボヌクレオシド三リン酸アデノシン三リン酸(adenosine triphosphate:ATP)、ウリジン三リン酸(uridine triphosphate:UTP)、シトシン三リン酸(cytosine triphosphate:CTP)、グアノシン三リン酸(guanosine triphosphate:GTP)、及びデオキシリボヌクレオシド三リン酸、例えばdATP、dCTP、dITP、dUTP、dGTP、dTTP、又はそれらの誘導体などを含み得る。そのような誘導体には、例えば、[αS]dATP、7-デアザ-dGTP及び7-デアザ-dATP、並びにそれらを含有する核酸分子にヌクレアーゼ耐性を付与するヌクレオチド誘導体が含まれ得る。本明細書で使用されるヌクレオチドという用語は、ジデオキシリボヌクレオシド三リン酸(dideoxyribonucleoside triphosphate:ddNTP)及びそれらの誘導体を指し得る。ジデオキシリボヌクレオシド三リン酸の例示的な例には、ddATP、ddCTP、ddGTP、ddITP、及びddTTPが含まれ得るが、これらに限定されない。ヌクレオチドは、光学的に検出可能な部分(例えば、フルオロフォア)を含む部分を用いるなどして、非標識又は検出可能に標識され得る。標識はまた、量子ドットを用いて行うこともできる。検出可能な標識としては、例えば、放射性同位体、蛍光標識、化学発光標識、生物発光標識、及び酵素標識が挙げられ得る。ヌクレオチドの蛍光標識としては、限定されないが、フルオレセイン、5-カルボキシフルオレセイン(FAM)、2’7’-ジメトキシ-4’5-ジクロロ-6-カルボキシフルオレセイン(JOE)、ローダミン、6-カルボキシローダミン(R6G)、N,N,N’、N’-テトラメチル-6-カルボキシローダミン(TAMRA)、6-カルボキシ-X-ローダミン(ROX)、4-(4’ジメチルアミノフェニルアゾ)安息香酸(DABCYL)、Cascade Blue、Oregon Green、Texas Red、シアニン、及び5-(2’-アミノエチル)アミノナフタレン-1-スルホン酸(EDANS)が挙げられ得る。蛍光標識ヌクレオチドの具体例としては、カリフォルニア州フォスターシティのPerkin Elmerから入手可能な[R6G]dUTP、[TAMRA]dUTP、[R110]dCTP、[R6G]dCTP、[TAMRA]dCTP、[JOE]ddATP、[R6G]ddATP、[FAM]ddCTP、[R110]ddCTP、[TAMRA]ddGTP、[ROX]ddTTP、[dR6G]ddATP、[dR110]ddCTP、[dTAMRA]ddGTP、及び[dROX]ddTTP;イリノイ州アーリントンハイツのAmershamから入手可能なFluoroLinkデオキシリボヌクレオチド、FluoroLink Cy3-dCTP、FluoroLink Cy5-dCTP、FluoroLink Fluor X-dCTP、FluoroLink Cy3-dUTP、及びFluoroLink Cy5-dUTP;インディアナ州インディアナポリスのBoehringer Mannheimから入手可能なフルオレセイン-15-dATP、フルオレセイン-12-dUTP、テトラメチル-ローダミン-6-dUTP、IR770-9-dATP、フルオレセイン-12-ddUTP、フルオレセイン-12-UTP、及びフルオレセイン-15-2’-dATP;並びにオレゴン州ユージーンのMolecular Probesから入手可能なBODIPY-FL-14-UTP、BODIPY-FL-4-UTP、BODIPY-TMR-14-UTP、BODIPY-TMR-14-dUTP、BODIPY-TR-14-UTP、BODIPY-TR-14-dUTP、Cascade Blue-7-UTP、Cascade Blue-7-dUTP、フルオレセイン-12-UTP、フルオレセイン-12-dUTP、Oregon Green 488-5-dUTP、Rhodamine Green-5-UTP、Rhodamine Green-5-dUTP、テトラメチルローダミン-6-UTP、テトラメチルローダミン-6-dUTP、Texas Red-5-UTP、Texas Red-5-dUTP、及びTexas Red-12-dUTPを挙げることができる。ヌクレオチドはまた、化学修飾によって標識又はマーキングされ得る。化学修飾された単一ヌクレオチドは、ビオチン-dNTPであり得る。ビオチン化dNTPのいくつかの非限定的な例としては、ビオチン-dATP(例えば、ビオ-N6-ddATP、ビオチン-14-dATP)、ビオチン-dCTP(例えば、ビオチン-11-dCTP、ビオチン-14-dCTP)、及びビオチン-dUTP(例えば、ビオチン-11-dUTP、ビオチン-16-dUTP、ビオチン-20-dUTP)を挙げることができる。
「ポリヌクレオチド」、「オリゴヌクレオチド」、及び「核酸」という用語は、概して、一本鎖形態、二本鎖形態、又は複数鎖形態のいずれかの、デオキシリボヌクレオチド若しくはリボヌクレオチド、又はそれらの類似体のいずれかの任意の長さのヌクレオチドのポリマー形態を指すために、互換的に使用される。ポリヌクレオチドは細胞に対して外因性又は内因性であり得る。ポリヌクレオチドは無細胞環境に存在し得る。ポリヌクレオチドは遺伝子又はその断片であり得る。ポリヌクレオチドはDNAであり得る。ポリヌクレオチドはRNAであり得る。ポリヌクレオチドは、任意の三次元構造を有していてもよく、任意の機能を果たしていてもよい。ポリヌクレオチドは、1つ以上の類似体(例えば、変更されたバックボーン、糖、又は核酸塩基)を含み得る。存在する場合、ヌクレオチド構造に対する修飾は、ポリマーの組み立ての前又は後に付与され得る。類似体のいくつかの非限定的な例としては、5-ブロモウラシル、ペプチド核酸、異種核酸、モルホリノ、ロックド核酸、グリコール核酸、トレオース核酸、ジデオキシヌクレオチド、コーディセピン、7-デアザ-GTP、フルオロフォア(例えば、糖に連結されたローダミン又はフルオレセイン)、チオール含有ヌクレオチド、ビオチン結合ヌクレオチド、蛍光塩基類似体、CpGアイランド、メチル-7-グアノシン、メチル化ヌクレオチド、イノシン、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、及びワイオシンが挙げられる。ポリヌクレオチドの非限定的な例としては、遺伝子又は遺伝子断片のコード領域又は非コード領域、連鎖分析から定義される遺伝子座(複数)(遺伝子座(単数))、エクソン、イントロン、メッセンジャRNA(mRNA)、トランスファRNA(tRNA)、リボソームRNA(rRNA)、短鎖干渉RNA(siRNA)、ショートヘアピンRNA(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換えポリヌクレオチド、分枝ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離されたRNA、無細胞DNA(cfDNA)及び無細胞RNA(cfRNA)を含む無細胞ポリヌクレオチド、核酸プローブ、及びプライマが挙げられる。ヌクレオチドの配列は、非ヌクレオチド構成成分によって中断され得る。
「トランスフェクション」又は「トランスフェクトされた」という用語は、概して、非ウイルス又はウイルスベースの方法による細胞への核酸の導入を指す。核酸分子は、完全なタンパク質又はその機能的部分をコードする遺伝子配列であり得る。例えば、Sambrookら、1989年、「Molecular Cloning:A Laboratory Manual」、第18.1~18.88頁を参照されたい。
「ペプチド」、「ポリペプチド」、及び「タンパク質」という用語は、概して、ペプチド結合(複数可)によって連結された少なくとも2つのアミノ酸残基のポリマーを指すために本明細書で互換的に使用される。この用語は、特定の長さのポリマーを暗示するものではなく、またペプチドが、組換え技術、化学合成、若しくは酵素合成を用いて産生されるか、又は天然に存在するかを、暗示又は区別することを意図するものでもない。この用語は、天然に存在するアミノ酸ポリマー、及び少なくとも1つの修飾アミノ酸を含むアミノ酸ポリマーに適用される。場合によっては、ポリマーは非アミノ酸によって中断され得る。この用語は、全長タンパク質、並びに二次及び/又は三次構造(例えば、ドメイン)を有する又は有しないタンパク質を含む、任意の長さのアミノ酸鎖を含む。この用語はまた、例えば、ジスルフィド結合形成、グリコシル化、脂質化、アセチル化、リン酸化、酸化、及び標識構成成分とのコンジュゲーションなどの任意の他の操作によって修飾されているアミノ酸ポリマーを包含する。本明細書で使用される場合、「アミノ酸(単数)」及び「アミノ酸(複数)」という用語は、概して、修飾アミノ酸及びアミノ酸類似体を含む天然及び非天然アミノ酸を指すが、これらに限定するものではない。修飾アミノ酸として天然アミノ酸及び非天然アミノ酸が含まれてもよく、これらは、アミノ酸上に天然に存在しない基又は化学部分を含むように化学的に修飾されている。アミノ酸類似体は、アミノ酸誘導体を指してもよい。「アミノ酸」という用語は、D-アミノ酸とL-アミノ酸との両方を含む。
本明細書で使用される場合、「非天然」とは、概して、天然の核酸又はタンパク質には見られない核酸又はポリペプチド配列を指すことができる。非天然はアフィニティタグを指し得る。非天然とは融合物を指し得る。非天然とは、突然変異、挿入、及び/又は欠失を含む、天然に存在する核酸又はポリペプチド配列を指し得る。非天然配列は、非天然配列が融合される核酸及び/又はポリペプチド配列によってもまた提示され得る活性(例えば、酵素活性、メチルトランスフェラーゼ活性、アセチルトランスフェラーゼ活性、キナーゼ活性、ユビキチン化活性等)を、呈し得る及び/又はコードし得る。非天然核酸又はポリペプチド配列は、キメラ核酸及び/又はポリペプチドをコードするキメラ核酸及び/又はポリペプチド配列を生成するために、遺伝子工学によって天然に存在する核酸又はポリペプチド配列(又はそのバリアント)に連結され得る。
本明細書で使用される場合、「プロモーター」という用語は、概して、遺伝子の転写又は発現を制御し、RNA転写が開始されるヌクレオチド又はヌクレオチドの領域に隣接して又はそれと重複して位置し得る調節DNA領域を指す。プロモーターは、RNAポリメラーゼのDNAへの結合を促進して遺伝子転写をもたらす、転写因子と称されることが多いタンパク質因子に結合する特異的DNA配列を含有し得る。「コアプロモーター」とも称される「基本プロモーター」は、概して、動作可能に連結されたポリヌクレオチドの転写発現を促進するために必要な全ての基本要素を含有するプロモーターを指し得る。真核生物の基本プロモーターは、必ずしもそうとは限らないが、典型的には、TATAボックス及び/又はCAATボックスを含有する。
本明細書で使用される場合、「発現」という用語は、概して、核酸配列又はポリヌクレオチドがDNA鋳型から(mRNA又は他のRNA転写物などに)転写されるプロセス、及び/又は転写されたmRNAが、続いて、ペプチド、ポリペプチド、又はタンパク質へと翻訳されるプロセスを指す。転写物及びコードされたポリペプチドは、集合的に「遺伝子産物」と称され得る。ポリヌクレオチドがゲノムDNAに由来する場合、発現は、真核細胞におけるmRNAのスプライシングを含み得る。
本明細書で使用される場合、「動作可能に連結された(operably linked)」、「動作可能な連結」、「動作可能に連結された(operatively linked)」、又はそれらの文法上の等価物は、概して、遺伝子要素、例えば、プロモーター、エンハンサー、ポリアデニル化配列等の並置を指し、当該要素は、それらが予想される様式で動作することを可能にする関係にある。例として、プロモーター配列及び/又はエンハンサ配列を含み得る調節要素は、調節要素がコード配列の転写の開始を助ける場合、コード領域へと動作可能に連結される。この機能的関係が維持される限り、調節要素とコード領域との間に介在残基が存在し得る。
本明細書で使用される場合、「ベクター」とは、概して、ポリヌクレオチドを含むか又はポリヌクレオチドと会合し、細胞へのポリヌクレオチドの送達を媒介するために使用され得る、高分子又は高分子の会合体を指す。ベクターの例としては、プラスミド、ウイルスベクター、リポソーム、及び他の遺伝子送達ビヒクルが挙げられる。ベクターは、概して、標的における遺伝子の発現を促進するために遺伝子へと動作可能に連結された、遺伝子要素、例えば調節要素を含む。
本明細書で使用される場合、「発現カセット」及び「核酸カセット」は、概して、一緒に発現されるか、又は発現のために動作可能に連結される、核酸配列又は要素の組合せを指すために互換的に使用される。場合によっては、発現カセットは、調節要素と、それらが発現のために動作可能に連結される1つ又は複数の遺伝子との組合せを指す。
DNA又はタンパク質配列の「機能的断片」とは、概して、全長DNA又はタンパク質配列の生物学的活性と実質的に同様である生物学的活性(機能的又は構造的のいずれか)を保持する断片を指す。DNA配列の生物学的活性は、全長配列に起因することが知られている様式で発現に影響を及ぼすその能力であり得る。
本明細書で使用される場合、「操作された」物体とは、概して、物体が人間の介入によって変更されたことを示す。非限定的な例によれば、核酸は、その配列を天然には存在しない配列へと変更することによって修飾され得る。核酸は、ライゲーションされた産物が元の核酸に存在しない機能を有するように、それが天然では会合しない核酸へとライゲーションすることによって修飾され得る。操作された核酸は、天然に存在しない配列を用いてインビトロで合成され得る。タンパク質は、そのアミノ酸配列を天然には存在しない配列へと変更することによって修飾され得る。操作されたタンパク質は、新しい機能又は特性を獲得し得る。「操作された」システムは、少なくとも1つの操作された構成成分を含む。
本明細書で使用される場合、「合成」及び「人工」は、天然に存在するヒトタンパク質に対して、低い配列同一性(例えば、50%未満の配列同一性、25%未満の配列同一性、10%未満の配列同一性、5%未満の配列同一性、1%未満の配列同一性)を有する、タンパク質又はそのドメインを指すように互換的に使用される。例えば、VPRドメイン及びVP64ドメインは合成トランス活性化ドメインである。
本明細書で使用される場合、「tracrRNA」又は「tracr配列」という用語は、概して、野生型の例示的なtracrRNA配列(例えば、化膿性連鎖球菌(S.pyogenes)黄色ブドウ球菌(S.aureus)等に由来するtracrRNA、又は配列番号5476~5511)に対して、少なくとも約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、若しくは100%の配列同一性及び/又は配列類似性を有する核酸を指すことができる。tracrRNAは、野生型の例示的なtracrRNA配列(例えば、化膿性連鎖球菌(S.pyogenes)黄色ブドウ球菌(S.aureus)等に由来するtracrRNA)に対して、最大で約5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、若しくは100%の配列同一性及び/又は配列類似性を有する核酸を指すことができる。tracrRNAは、欠失、挿入、又は置換、バリアント、突然変異、又はキメラなどのヌクレオチド変化を含むことができるtracrRNAの修飾形態を指し得る。tracrRNAは、少なくとも6個の連続するヌクレオチドのストレッチにわたって野生型の例示的tracrRNA(例えば、化膿性連鎖球菌(S.pyogenes)黄色ブドウ球菌(S.aureus)等に由来するtracrRNA)配列に対して、少なくとも約60%同一であり得る核酸を指してもよい。例えば、tracrRNA配列は、少なくとも6個の連続するヌクレオチドのストレッチにわたって、野生型の例示的tracrRNA(例えば、化膿性連鎖球菌(S.pyogenes)黄色ブドウ球菌(S.aureus)等に由来するtracrRNA)配列に対して、少なくとも約60%同一、少なくとも約65%同一、少なくとも約70%同一、少なくとも約75%同一、少なくとも約80%同一、少なくとも約85%同一、少なくとも約90%同一、少なくとも約95%同一、少なくとも約98%同一、少なくとも約99%同一、又は100%同一であり得る。II型tracrRNA配列は、隣接するCRISPRアレイにおいてリピート配列の一部と相補性を有する領域を同定することによってゲノム配列上で予測することができる。
本明細書で使用される場合、「ガイド核酸」とは、概して、別の核酸にハイブリダイズし得る核酸を指すことができる。ガイド核酸はRNAであり得る。ガイド核酸はDNAであり得る。ガイド核酸は、核酸の配列に部位特異的に結合するようにプログラムされ得る。標的化される核酸、又は標的核酸は、ヌクレオチドを含み得る。ガイド核酸はヌクレオチドを含み得る。標的核酸の一部はガイド核酸の一部と相補的であり得る。ガイド核酸に相補的であり、かつガイド核酸とハイブリダイズする二本鎖標的ポリヌクレオチドの鎖は、相補鎖と称され得る。相補鎖に相補的であり、したがってガイド核酸に相補的でない可能性がある二本鎖標的ポリヌクレオチドの鎖は、非相補鎖と呼ばれ得る。ガイド核酸は、ポリヌクレオチド鎖を含んでもよく、「シングルガイド核酸」と呼ばれ得る。ガイド核酸は、2つのポリヌクレオチド鎖を含んでもよく、「ダブルガイド核酸」と呼ばれ得る。特に明記しない限り、「ガイド核酸」という用語は、シングルガイド核酸及びダブルガイド核酸の両方を指す包括的なものであり得る。ガイド核酸は、「核酸標的化セグメント」又は「核酸標的化配列」と称され得るセグメントを含み得る。核酸標的化セグメントは、「タンパク質結合セグメント」又は「タンパク質結合配列」又は「Casタンパク質結合セグメント」と称され得るサブセグメントを含み得る。
2つ以上の核酸又はポリペプチド配列の文脈における「配列同一性」又は「同一性パーセント」という用語は、概して、配列比較アルゴリズムを用いて測定した際に局所的又は全体的な比較ウィンドウにわたり比較し、かつ最大対応で整列させた場合、同じであるか、又は同じであるアミノ酸残基若しくはヌクレオチドの指定された割合を有する、2つ(例えば、対のアライメントにおいて)以上(例えば、多重配列アラインメントにおいて)の配列を指す。ポリペプチド配列に好適な配列比較アルゴリズムとしては、例えば、3のワード長、10の期待値Iのパラメータを用いる、及び11の存在、1の拡張におけるBLOSUM62スコアリングマトリックス設定ギャップコスト、及び30残基より長いポリペプチド配列の条件付き組成スコアマトリックス調整を用いる、BLASTPを含む。2のワード長(W)、1000000の期待値(E)、及びPAM30スコアリングマトリックス設定ギャップのパラメータを用いるBLASTPは、30残基未満の配列に対して、ギャップを開くために9の、ギャップを拡張するために1のコストがかかる(これらは、https://blast.ncbi.nlm.nih.govで利用可能な一組のBLASTにおけるBLASTのデフォルトパラメータである);2の一致、-1の不一致、-1のギャップのパラメータを持つSmith-Waterman相同性検索アルゴリズム;デフォルトパラメータを有するMUSCLE;2のリツリー(retree)及び1000のパラメータを有するMAFFT;デフォルトパラメータを有するNovafold;をデフォルトパラメータを有するHMMER hmmalignのパラメータを有するCLUSTALW。
本開示には、1つ以上の保存的アミノ酸置換を有する本明細書に記載の酵素のいずれかのバリアントが含まれる。そのような保存的置換は、ポリペプチドの三次元構造又は機能を破壊することなく、ポリペプチドのアミノ酸配列において行うことができる。保存的置換は、類似の疎水性、極性、及びR鎖長を有するアミノ酸を互いに置換することによって達成することができる。追加的又は代替的に、異なる種由来の相同タンパク質の整列した配列を比較することによって、コードされたタンパク質の基本的機能を変更することなく、種間で突然変異しているアミノ酸残基(例えば、非保存残基)を配置することによって保存的置換を同定することができる。そのような保存的に置換されたバリアントは、本明細書に記載のエンドヌクレアーゼタンパク質配列(例えば、本明細書中に記載のMG1、MG2、MG3、MG4、MG6、MG7、MG14、MG15、MG16、MG18、MG21、MG22、又はMG23ファミリーエンドヌクレアーゼ)のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するバリアントを含み得る。いくつかの実施形態では、そのような保存的置換バリアントは、機能的バリアントである。そのような機能的バリアントは、エンドヌクレアーゼの重要な活性部位残基の活性が破壊されないような置換を有する配列を包含し得る。いくつかの実施形態では、本明細書に記載されるタンパク質のいずれかの機能的バリアントは、図6、図7、図8、図9A、図9B、図9C、図9D、図9E、図9F、図9G、又は図9Hにおいて称される保存又は機能的残基の少なくとも1つの置換を欠く。いくつかの実施形態では、本明細書に記載されるタンパク質のいずれかの機能的バリアントは、図6、図7、図8、図9A、図9B、図9C、図9D、図9E、図9F、図9G、又は図9Hにおいて称される保存又は機能的残基の全ての置換を欠く。
機能的に類似するアミノ酸を提供する保存的置換表は、様々な参考文献から入手可能である(例えば、Creighton、「Proteins:Structures and Molecular Properties」(W H Freeman&Co.;第2版(1993年12月))。以下の8つの群は、各々、互いに保存的置換であるアミノ酸を含有する。
(1)アラニン(A)、グリシン(G);
(2)アスパラギン酸(D)、グルタミン酸(E);
(3)アスパラギン(N)、グルタミン(Q);
(4)アルギニン(R)、リジン(K);
(5)イソロイシン(I)、ロイシン(L)、メチオニン(M)、バリン(V);
(6)フェニルアラニン(F)、チロシン(Y)、トリプトファン(W);
(7)セリン(S)、トレオニン(T);及び
(8)システイン(C)、メチオニン(M)
本明細書で使用される場合、用語「RuvC_IIIドメイン」とは、概して、RuvCエンドヌクレアーゼドメイン(RuvCヌクレアーゼドメインは、3つの不連続なセグメント、RuvC_I、RuvC_II、及びRuvC_IIIから構成される)の第3の不連続なセグメントのことを指す。RuvCドメイン又はそのセグメントは、概して、既知のドメイン配列へのアラインメントによって、アノテーションされたドメインを有するタンパク質への構造アラインメントによって、又は既知のドメイン配列に基づいて構築された隠れマルコフモデル(Hidden Markov Model:HMM)との比較によって、同定することができる(例えば、RuvC_IIIについてはPfam HMM PF18541)。
本明細書で使用される場合、「HNHドメイン」という用語は、概して、特徴的なヒスチジン残基及びアスパラギン残基を有するエンドヌクレアーゼドメインを指す。HNHドメインは、概して、既知のドメイン配列へのアラインメントによって、アノテーションされたドメインを有するタンパク質への構造アラインメントによって、又は既知のドメイン配列に基づいて構築された隠れマルコフモデル(Hidden Markov Model:HMM)との比較によって、同定することができる(例えば、ドメインHNHについてはPfam HMM PF01844)。
概要
独特の機能性及び構造を有する新規Cas酵素の発見は、デオキシリボ核酸(DNA)編集技術を更に破壊し、速度、特異性、機能性、及び使いやすさを改善する可能性を提供し得る。微生物におけるクラスター化して規則的な配置の短い回文配列リピート(CRISPR)システムの予測される有病率、及び微生物種の全くの多様性と比較して、文献において、機能的に特徴付けられたCRISPR/Cas酵素は比較的少ない。これは、膨大な数の微生物種が実験室条件下において容易に培養されない可能性があるためである。多数の微生物種を表す天然の環境ニッチからのメタゲノムシーケンシングは、公知の新しいCRISPR/Casシステムの数を劇的に増加させ、かつ新しいオリゴヌクレオチド編集機能の発見を加速する可能性を提供し得る。そのようなアプローチの有益性の最近の例は、天然の微生物コミュニティのメタゲノム分析からのCasX/CasY CRISPRシステムの2016年の発見によって実証されている。
CRISPR/Casシステムは、微生物において適応免疫システムとして機能することが記載されているRNA指向性ヌクレアーゼ複合体である。それらの自然な状況では、CRISPR/Casシステムは、CRISPR(クラスター化して規則的な配置の短い回文配列リピート)オペロン又は遺伝子座において生じ、これらは概して、2つの部分:(i)RNAベースの標的化要素をコードする、等しく短いスペーサー配列によって隔てられた短い反復配列のアレイ(30~40bp)、及び(ii)アクセサリタンパク質/酵素と共にRNAベースの標的化要素によって誘導されるヌクレアーゼポリペプチドをコードするCasをコードするORFを含む。特定の標的核酸配列の効率的なヌクレアーゼ標的化は、概して、(i)標的の最初の6~8個の核酸(標的シード)とcrRNAガイドとの間の相補的ハイブリダイゼーション、及び(ii)標的シードの定義された近傍内にプロトスペーサー隣接モチーフ(PAM)配列が存在すること(PAMは、通常、宿主ゲノム内で一般的に表されない配列である)の両方を必要とする。システムの正確な機能及び構成に応じて、CRISPR-Casシステムは、一般に、共有された機能的特徴及び進化的類似性に基づいて、2つのクラス、5つのタイプ(型)、及び16のサブタイプに組織化される。
クラスIのCRISPR-Casシステムは、大きなマルチサブユニットエフェクター複合体を有し、I型(タイプI)、III型(タイプIII)、及びIV型(タイプIV)を含む。
I型CRISPR-Casシステムは、構成成分に関して中程度の複雑さを有すると考えられる。I型CRISPR-Casシステムでは、RNA標的化要素のアレイは、核酸標的は、プロトスペーサー隣接モチーフ(PAM)と呼ばれる好適な短いコンセンサス配列が続く場合にヌクレアーゼ複合体を核酸標的に向ける、短い成熟crRNAを遊離させるようにリピート要素でプロセシングされる長い前駆体crRNA(pre-crRNA)として転写され、このプロセシングは、crRNA指向型ヌクレアーゼ複合体のヌクレアーゼ(Cas3)タンパク質構成成分もまた含む、カスケードと呼ばれる大きなエンドヌクレアーゼ複合体のエンドリボヌクレアーゼサブユニット(Cas6)を介して起こる。Cas Iヌクレアーゼは主にDNAヌクレアーゼとして機能する。
III型CRISPRシステムは、Csm又はCmrタンパク質サブユニットを含むリピート関連ミステリアスタンパク質(repeat-associated mysterious protein:RAMP)と共に、Cas10として知られる中央ヌクレアーゼの存在を特徴とし得る。I型システムと同様に、成熟crRNAは、Cas6様酵素を用いてpre-crRNAからプロセシングされる。I型及びII型システムとは異なり、III型システムは、DNA-RNA二重鎖(RNAポリメラーゼの鋳型として使用されているDNA鎖など)を標的とし、かつ切断するようである。
IV型CRISPR-Casシステムは、高度に還元された大サブユニットヌクレアーゼ(csf1)と、Cas5(csf3)及びCas7(csf2)群のRAMPタンパク質に対する2つの遺伝子と、場合によっては、予測される小サブユニットに対する遺伝子と、からなるエフェクター複合体を保有する。そのようなシステムは、内因性プラスミドに一般的に見られる。
クラスIIのCRISPR-Casシステムは、概して、単一ポリペプチドマルチドメインヌクレアーゼエフェクターを有し、II型(タイプII)、V型(タイプV)、及びVI型(タイプVI)を含む。
II型CRISPR-Casシステムは、構成成分に関して最も単純であると考えられている。II型CRISPR-Casシステムでは、CRISPRアレイの成熟crRNAへのプロセシングは、特別なエンドヌクレアーゼサブユニットの存在を必要とせず、むしろアレイリピート配列に相補的な領域を有する小さなトランスコードcrRNA(tracrRNA)の存在を必要とする。このtracrRNAは、その対応するエフェクターヌクレアーゼ(例えば、Cas9)及びリピート配列の両方と相互作用して前駆体dsRNA構造を形成し、これは、内因性RNAse IIIによって切断されて、tracrRNA及びcrRNAの両方が負荷された成熟エフェクター酵素を生成する。Cas IIヌクレアーゼはDNAヌクレアーゼとして知られている。2型エフェクターは、概して、RuvC様ヌクレアーゼドメインのフォールド内に挿入された、無関係なHNHヌクレアーゼドメインを有するRNase Hフォールドを採用するRuvC様エンドヌクレアーゼドメインからなる構造を呈する。RuvC様ドメインは、標的(例えば、crRNA相補的)DNA鎖の切断を担い、一方でHNHドメインは、置き換えられたDNA鎖の切断を担う。
V型CRISPR-Casシステムは、RuvC様ドメインを含む、II型エフェクターのものと同様のヌクレアーゼエフェクター(例えば、Cas12)構造を特徴とする。II型と同様に、ほとんどの(全てではないが)V型CRISPRシステムは、プレcrRNAを成熟crRNAにプロセシングするためにtracrRNAを使用する。しかしながら、プレcrRNAを複数のcrRNAへと切断するためにRNAse IIIを必要とするII型システムとは異なり、V型システムは、エフェクターヌクレアーゼ自体を用いてpre-crRNAを切断することができる。II型CRISPR-Casシステムと同様に、V型CRISPR-Casシステムは、やはりDNAヌクレアーゼとして知られている。II型CRISPR-Casシステムとは異なり、いくつかのV型酵素(例えば、Cas12a)は、二本鎖標的配列の最初のcrRNA指向性切断によって活性化される、堅牢な一本鎖非特異的デオキシリボヌクレアーゼ活性を有するようである。
VI型CRIPSR-Casシステムは、RNAガイドRNAエンドヌクレアーゼを有する。RuvC様ドメインの代わりに、VI型システムの単一ポリペプチドエフェクター(例えば、Cas13)は、2つのHEPNリボヌクレアーゼドメインを含む。II型システム及びV型システムのどちらとも異なり、VI型システムはまた、pre-crRNAをcrRNAにプロセシングするためのtracrRNAを必要としないようである。しかしながら、V型システムと同様に、いくつかのVI型システム(例えば、C2C2)は、標的RNAの最初のcrRNA指向性切断によって活性化される堅牢な一本鎖非特異的ヌクレアーゼ(リボヌクレアーゼ)活性を有するようである。
それらのより単純な構造のために、クラスIIのCRISPR-Casは、設計者ヌクレアーゼ/ゲノム編集用途として工学及び開発に最も広く採用されている。
インビトロ使用のためのそのようなシステムの初期の用途の1つは、Jinekら(「Science.」、2012年8月17日;第337巻(第6096号):第816~21頁、参照によりその全体が本明細書に組み込まれる)に見出すことができる。Jinekの研究は、最初に、(i)化膿性連鎖球菌(S.pyogenes)SF370から単離された組換え発現された精製全長Cas9(例えば、クラスIIの、II型Cas酵素)、(ii)切断が望まれる標的DNA配列に相補的な5’の約20ntを担持する精製された成熟約42nt、続いて3’のtracr結合配列(全crRNAは、T7プロモーター配列を保有する合成DNA鋳型からインビトロ転写される)、(iii)T7プロモーター配列を保有する合成DNA鋳型からインビトロ転写された精製tracrRNA、及び(iv)Mg2+を含むシステムが記載された。Jinekは、後に、(ii)のcrRNAがリンカー(例えば、GAAA)によって(iii)の5’末端に連結されて、Cas9を単独で標的に誘導することができる単一の融合合成ガイドRNA(sgRNA)を形成する、改良され操作されたシステムを記載した(図2の上部パネルと下部パネルとを比較)。
参照により全体が本明細書に組み込まれるMaliら(「Science.」、2013年2月15日;第339巻(第6121号):第823~826頁)は、後に、(i)C末端核局在化配列(例えば、SV40NLS)及び好適なポリアデニル化シグナル(例えば、TKpAシグナル)を有する好適な哺乳動物プロモーター下におけるコドン最適化Cas9(例えば、クラスIIタイプIICas酵素)をコードするORF、及び(ii)好適なポリメラーゼIIIプロモーター(例えば、U6プロモーター)下におけるsgRNA(Gで始まる5’配列と、その後に続く3’のtracr結合配列に連結された20ntの相補的標的化核酸配列、リンカー、及びtracrRNA配列)をコードするORFをコードするDNAベクターを提供することによって、哺乳動物細胞における使用のためにこのシステムを適合させた。
MG酵素
一態様では、本開示は、メタゲノムシーケンシングによって発見された操作されたヌクレアーゼシステムを提供する。場合によっては、メタゲノムシーケンシングは、試料に対して行われる。場合によっては、試料は、様々な環境によって収集され得る。そのような環境は、ヒト微生物叢、動物微生物叢、高温の環境、低温の環境であり得る。そのような環境は沈殿物を含み得る。本明細書に記載の操作されたヌクレアーゼシステムのそのような環境の種類の例は、図45に見出すことができる。
MG1酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号1827~2140のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号1827~2140のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号1827~2140のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号1827~1831のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1827~1831のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1827~1831のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1827に対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1828に対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1829に対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1830に対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1831に対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号3638~3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3638~3955のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638~3955のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638~3955のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3638~3955のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638~3955のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638~3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3638~3641のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638~3641のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3638のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3638のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3639のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3639のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3639のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3640のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3640のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3640のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3641のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3641のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3641のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号1~6又は配列番号9~319のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1~6又は配列番号9~319のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号1~4のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1~4のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号5615、5616、又は5617のいずれか1つと実質的に同一のペプチドモチーフを含み得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号1~6若しくは配列番号9~319のいずれか1つに対して、又は配列番号1~319のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、以下の表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、エンドヌクレアーゼは、組換え体(例えば、大腸菌(E.coli)での発現、それに続くエピトープタグ精製などの好適な方法によって、クローニング、発現、及び精製)であり得る。場合によっては、エンドヌクレアーゼは、配列番号5592~5595のいずれか1つに対して少なくとも約90%の同一性を有する16S rRNA遺伝子を有する細菌に由来し得る。エンドヌクレアーゼは、配列番号5592~5595のいずれか1つに対して、少なくとも約80%、少なくとも約82%、少なくとも約83%、少なくとも約84%、少なくとも約85%、少なくとも約86%、少なくとも約87%、少なくとも約88%、少なくとも約89%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性の16S rRNA遺伝子を有する種に由来し得る。エンドヌクレアーゼは、配列番号5592~5595のいずれか1つと実質的に同一の16S rRNA遺伝子を有する種に由来し得る。エンドヌクレアーゼは、ウェルコミクロビウム(Verrucomicrobia)門又はカンディダートゥス・ペレグリニバクテリア(Candidatus Peregrinibacteria)門に属する細菌に由来し得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5476~5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5476~5489のいずれか1つの連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5476~5489のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5476~5489のいずれかを含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5461~5464のいずれか1つに対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5461~5464のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5461~5464のいずれか1つと実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が標的核酸遺伝子座に結合する際に、標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号1827~2140のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5572~5575のいずれかに対して、又は配列番号5572~5575のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
場合によっては、本開示は、本明細書に開示されるシステム又は本明細書に記載される核酸を含む発現カセットを提供し得る。場合によっては、発現カセット又は核酸はベクターとして供給され得る。場合によっては、発現カセット、核酸、又はベクターは、細胞内に供給され得る。場合によっては、細胞は、配列番号5592~5595のいずれか1つに対して少なくとも約90%(例えば、少なくとも約99%)の同一性を有する16S rRNA遺伝子を有する細菌の細胞である。
MG2酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2141~2241のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2141~2241のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2141~2142のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2141~2142のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2141~2142のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2141~2142のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号3955~4055のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3955~4055のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3955~4055のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3955~3956のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3955~3956のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号3955~3956のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号320~420のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号320~420のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号320~321のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号320~321のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号320~420のいずれか1つに対して、又は配列番号320~420のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5490~5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5490~5494のいずれか1つの連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5490~5494のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5490~5494のいずれかを含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5465に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5465に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5465と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2141~2241のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5576~5577のいずれかに対して、又は配列番号5576~5577のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG3酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2242~2251のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2242~2251のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2242~2251のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2242~2244のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2242~2244のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2242~2244のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4056~4066のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4056~4066のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4056~4066のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4056~4058のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4056~4058のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4056~4058のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号421~431のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号421~431のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号421~423のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号421~423のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号421~431のいずれか1つに対して、又は配列番号421~431のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5495~5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5495~5502のいずれか1つの連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5495~5502のいずれか1つの少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5495~5502のいずれかを含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5466~5467のいずれか1つに対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5466~5467のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5466~5467のいずれか1つと実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2242~2251のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5578~5580のいずれかに対して、又は配列番号5578~5580のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG4酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2253~2481のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2253~2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2253~2481のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2253~2481のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2253~2481のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2253~2481のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4067~4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4067~4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4067~4295のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4067~4295のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4067~4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4067~4295のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号432~660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号432~660のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号432~660のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号432~660のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号432~660のいずれか1つに対して、又は配列番号432~660のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5503の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5503の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5503を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5468に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5468に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5468と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2253~2481のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG6酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2482~2489のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2482~2489のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2482~2489のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4296~4303のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4296~4303のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4056~4066のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号661~668のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号661~668のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号661~668のいずれか1つに対して、又は配列番号661~668のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるガイドRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2482~2489のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG7酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2490~2498のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2490~2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2490~2498のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2490~2498のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2490~2498のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2490~2498のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4304~4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4304~4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4304~4312のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4304~4312のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4304~4312のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4304~4312のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号669~677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号669~677のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号669~677のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号669~677のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号669~677のいずれか1つに対して、又は配列番号669~677のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5504の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5504の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5504を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2490~2498のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG14酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2499~2750のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2499~2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2499~2750のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2499~2750のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2499~2750のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2499~2750のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4313~4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4313~4564のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4313~4564のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4313~4564のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4067~4295のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4313~4564のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号678~929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号678~929のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号678~929のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号678~929のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号678~929のいずれか1つに対して、又は配列番号678~929のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5505の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5505の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5505を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5469に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5469に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5469と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2499~2750のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5581に対して、又は配列番号5581に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG15酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2751~2913のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2751~2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2751~2913のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2751~2913のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2751~2913のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2751~2913のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4565~4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4565~4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4565~4727のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4565~4727のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4565~4727のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4565~4727のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号930~1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号930~1092のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号930~1092のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号930~1092のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号930~1092のいずれか1つに対して、又は配列番号930~1092のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5506の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5506の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5506を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5470に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5470に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5470と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2751~2913のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5582に対して、又は配列番号5582に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG16酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号2914~3174のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号2914~3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号2914~3174のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号2914~3174のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2914~3174のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号2914~3174のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4728~4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4728~4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4728~4988のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4728~4988のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4728~4988のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4728~4988のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号1093~1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1093~1353のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号1093~1353のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1093~1353のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号1093~1353のいずれか1つに対して、又は配列番号1093~1353のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5507の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5507の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5507を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5471に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5471に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5471と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号2914~3174のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5583に対して、又は配列番号5583に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG18酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号3175~3300のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号3175~3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号3175~3300のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号3175~3300のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3175~3300のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3175~3300のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号4989~5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4989~5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4989~5146のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4989~5146のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号4989~5146のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号4989~5146のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号1354~1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1354~1511のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号1354~1511のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1354~1511のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号1354~1511のいずれか1つに対して、又は配列番号1354~1511のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5508の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5508の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5508を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5472に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5472に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5472と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は、配列番号3175~3300のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5584に対して、又は配列番号5584に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG21酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号3331~3474のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号3331~3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号3331~3474のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号3331~3474のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3331~3474のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3331~3474のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号5147~5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号5147~5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5147~5290のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5147~5290のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号5147~5290のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5147~5290のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号1512~1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1512~1655のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号1512~1655のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1512~1655のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号1512~1655のいずれか1つに対して、又は配列番号1512~1655のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5509の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5509の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5509を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5473に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5473に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5473と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は配列番号3331~3474のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5585に対して、又は配列番号5585に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG22酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号3475~3568のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号3475~3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号3475~3568のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号3475~3568のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3475~3568のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3475~3568のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号5291~5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号5291~5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5291~5389のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5291~5389のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号5291~5389のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5291~5389のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号1656~1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1656~1755のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号1656~1755のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1656~1755のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号432~660のいずれか1つに対して、又は配列番号1656~1755のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5510の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5510の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5510を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5474に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5474に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5474と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は配列番号3475~3568のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5586に対して、又は配列番号5586に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
MG23酵素
一態様では、本開示は、(a)エンドヌクレアーゼを含む、操作されたヌクレアーゼシステムを提供する。場合によっては、エンドヌクレアーゼは、Casエンドヌクレアーゼである。場合によっては、エンドヌクレアーゼは、II型、クラスIIのCasエンドヌクレアーゼである。エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、当該RuvC_IIIドメインは、配列番号3569~3637のいずれか1つに対して少なくとも約70%の配列同一性を有する。場合によっては、エンドヌクレアーゼはRuvC_IIIドメインを含んでもよく、ここで、RuvC_IIIドメインは、配列番号3569~3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する。場合によっては、エンドヌクレアーゼは、配列番号3569~3637のいずれか1つと実質的に同一であるRuvC_IIIドメインを含み得る。エンドヌクレアーゼは、配列番号3569~3637のいずれか1つに対して少なくとも約70%の配列同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3569~3637のいずれか1つに対して、少なくとも約20%、少なくとも約25%、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有するRuvC_IIIドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号3569~3637のいずれか1つと実質的に同一のRuvC_IIIドメインを含み得る。
エンドヌクレアーゼは、配列番号5390~5460のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号5390~5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5390~5460のいずれか1つと実質的に同一のHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5390~5460のいずれか1つに対して少なくとも約70%の同一性を有するHNHドメインを含み得る。場合によっては、エンドヌクレアーゼは、配列番号5390~5460のいずれか1つに対して、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有すHNHドメインを含み得る。エンドヌクレアーゼは、配列番号5390~5460のいずれか1つと実質的に同一のHNHドメインを含み得る。
場合によっては、エンドヌクレアーゼは、配列番号1756~1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1756~1826のいずれか1つと実質的に同一であり得る。場合によっては、エンドヌクレアーゼは、配列番号1756~1826のいずれか1つに対して、少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントを含み得る。場合によっては、エンドヌクレアーゼは、配列番号1756~1826のいずれか1つと実質的に同一であり得る。
場合によっては、エンドヌクレアーゼは、1つ以上の核局在化配列(NLS)を有するバリアントを含み得る。NLSは、当該エンドヌクレアーゼのN末端又はC末端に近接していてもよい。NLSは、配列番号1756~1826のいずれか1つに対して、又は配列番号1756~1826のいずれか1つに対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有するバリアントに対して、N末端又はC末端に付加され得る。NLSはSV40ラージT抗原NLSであり得る。NLSはc-myc NLSであり得る。NLSは、配列番号5593~5608のいずれか1つに対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約99%の同一性を有する配列を含み得る。NLSは、配列番号5593~5608のいずれか1つと実質的に同一の配列を含み得る。NLSは、表1の配列のいずれか、又はこれらの組合せを含み得る。
場合によっては、当該配列同一性は、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、Novafold、又はCLUSTALWによって決定され得る。配列同一性は、3のワード長(W)、10の期待値(E)のパラメータを用いて、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、及び条件付き組成スコアマトリックス調整を用いて、BLASTP相同性検索アルゴリズムによって決定され得る。
場合によっては、上記システムは、(b)所望の切断配列に相補的な5’標的化領域を担持するエンドヌクレアーゼと複合体を形成することができる、少なくとも1つの操作された合成ガイドリボ核酸(synthetic guide ribonucleic acid:sgRNA)を含み得る。場合によっては、5’標的化領域は、エンドヌクレアーゼと適合性のあるPAM配列を含み得る。場合によっては、標的化領域の5’における大部分のヌクレオチドは、Gであり得る。場合によっては、5’標的化領域は、15~23ヌクレオチド長であり得る。ガイド配列及びtracr配列は、別々のリボ核酸(RNA)又は単一のリボ核酸(RNA)として供給され得る。ガイドRNAは、標的化領域への3’におけるcrRNA tracrRNA結合配列を含み得る。ガイドRNAは、crRNA tracrRNA結合領域への3’における4-ヌクレオチドリンカが先行するtracrRNA配列を含み得る。sgRNAは、5’から3’に向かって、細胞中の標的配列、及びtracr配列にハイブリダイズすることができる非天然ガイド核酸配列を含み得る。場合によっては、非天然ガイド核酸配列及びtracr配列は共有結合している。
場合によっては、tracr配列は特定の配列を有し得る。tracr配列は、天然のtracrRNA配列の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%を有し得る。tracr配列は、配列番号5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドに対して、少なくとも約80%の配列同一性を有し得る。場合によっては、tracrRNAは、配列番号5511の連続するヌクレオチドの、少なくとも約60~90(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有し得る。場合によっては、tracrRNAは、配列番号5511の少なくとも約60~100(例えば、少なくとも約60、少なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも約85、又は少なくとも約90)の連続するヌクレオチドと実質的に同一であり得る。tracrRNAは配列番号5511を含み得る。
場合によっては、エンドヌクレアーゼと複合体を形成することができる少なくとも1つの操作された合成ガイドリボ核酸(sgRNA)は、配列番号5475に対して少なくとも約80%の同一性を有する配列を含み得る。sgRNAは、配列番号5475に対して、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する配列を含み得る。sgRNAは、配列番号5475と実質的に同一の配列を含み得る。
場合によっては、上記のシステムは、標的DNA遺伝子座における切断のための第1の領域及び第2の領域を標的化する2つの異なるsgRNAを含んでもよく、ここで、第2の領域は第1の領域に対して3’にある。場合によっては、上記システムは、5’から3’に向かって、第1の領域に対して5’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも約10ヌクレオチドの合成DNA配列、及び第2の領域に対して3’において少なくとも約20(例えば、少なくとも約40、80、120、150、200、300、500、又は1kb)ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を含み得る。
別の態様では、本開示は、目的の標的核酸遺伝子座を修飾する方法を提供する。本方法は、本明細書に開示される酵素及び少なくとも1つの合成ガイドRNA(sgRNA)を含む、本明細書に開示される非天然システムのいずれかを標的核酸遺伝子座へと送達することを含み得る。酵素は、少なくとも1つのsgRNAと複合体を形成し得、複合体が目的の標的核酸遺伝子座に結合する際に、目的の標的核酸遺伝子座を修飾し得る。酵素を当該遺伝子座へと送達することは、システム又はシステムをコードする核酸により細胞をトランスフェクトすることを含み得る。ヌクレアーゼを前記遺伝子座に送達することは、システム又はシステムをコードする核酸により細胞を電気穿孔することを含み得る。ヌクレアーゼを当該遺伝子座へと送達することは、目的の遺伝子座を含む核酸と共に、緩衝液中でシステムをインキュベートすることを含み得る。場合によっては、標的核酸遺伝子座は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む。標的核酸遺伝子座は、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含み得る。標的核酸遺伝子座は、細胞内にあり得る。標的核酸遺伝子座はインビトロであり得る。標的核酸遺伝子座は、真核細胞又は原核細胞内にあり得る。細胞は、動物細胞、ヒト細胞、細菌細胞、古細菌細胞、又は植物細胞であり得る。酵素は、目的の標的遺伝子座で、又は目的の標的遺伝子座に近接して、一本鎖又は二本鎖の切断を誘導し得る。
標的核酸遺伝子座が細胞内にあり得る場合、酵素は配列番号3569~3637のいずれか1つに対して、少なくとも約75%(例えば、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%)の同一性を有するRuvC_IIIドメインを有する酵素をコードする、オープンリーディングフレームを含有する核酸として供給され得る。当該エンドヌクレアーゼをコードするオープンリーディングフレームを含有するデオキシリボ核酸(DNA)は、配列番号5587に対して、又は配列番号5587に対して少なくとも約30%、少なくとも約35%、少なくとも約40%、少なくとも約45%、少なくとも約50%、少なくとも約55%、少なくとも約60%、少なくとも約65%、少なくとも約70%、少なくとも約75%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有するバリアントにおいて、実質的に同一の配列を含み得る。場合によっては、核酸は、エンドヌクレアーゼをコードするオープンリーディングフレームが動作可能に連結されたプロモーターを含む。プロモーターは、CMV、EF1a、SV40、PGK1、Ubc、ヒトベータアクチン、CAG、TRE、又はCaMKIIaプロモーターであり得る。エンドヌクレアーゼは、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有するキャップmRNAとして供給され得る。エンドヌクレアーゼは翻訳されたポリペプチドとして供給され得る。少なくとも1つの操作されたsgRNAは、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該少なくとも1つの操作されたsgRNAをコードする遺伝子配列を含有する、デオキシリボ核酸(DNA)として供給され得る。場合によっては、生物は、真核生物であり得る。場合によっては、生物は、真菌であり得る。場合によっては、生物は、ヒトであり得る。
本開示のシステムは、例えば、核酸編集(例えば、遺伝子編集)、核酸分子への結合(例えば、配列特異的結合)などの様々な用途に使用することができる。このようなシステムは、例えば、細胞内でのその機能を確認するために遺伝子を不活性化する、対象に疾患を引き起こし得る遺伝的に継承された突然変異に対処する(例えば、取り外し又は交換)ため、疾患の原因となる遺伝子要素を(例えば、逆転写されたウイルスRNA又は疾患の原因となる突然変異をコードする増幅されたDNA配列の切断を介して)検出するための診断ツールとして、特定のヌクレオチド配列(例えば、抗生物質耐性int細菌をコードする配列)を標的とし検出するためのプローブと組み合わせた非活性化酵素として、ウイルスゲノムを標的とすることによってウイルスを不活性又は宿主細胞に感染できないようにするように、遺伝子を追加して又は代謝経路を修正して生物に有益な低分子、高分子、若しくは二次代謝産物を産生させるように、進化的選択のための遺伝子駆動要素を確立するように、バイオセンサとしての外来の低分子及びヌクレオチドによる細胞の摂動を検出するように、使用される。
実施例1-新規タンパク質のメタゲノム分析
メタゲノム試料を、沈殿物、土壌、及び動物から収集した。デオキシリボ核酸(DNA)を、Zymobiomics DNA mini-prepキットで抽出し、Illumina HiSeq(登録商標)2500でシーケンシングした。試料は不動産所有者の同意を得て収集された。公的供給源からの追加の生配列データには、動物微生物叢、堆積物、土壌、温泉、熱水噴出孔、海洋、泥炭湿原、永久凍土、及び下水配列が含まれた。メタゲノム配列データを、II型Casエフェクタータンパク質を含む既知のCasタンパク質配列に基づいて生成された隠れマルコフモデルを用いて検索して、新しいCasエフェクターを同定した(図45を参照されたく、これは、異なる試料型から検出されたそのようなタンパク質の分布を示す)。検索によって同定された新規エフェクタータンパク質を既知のタンパク質に整列させて、潜在的な活性部位を同定した(図46を参照されたく、これは、異なる部位から同定された酵素間のCas触媒残基の分布を示す)。このメタゲノムワークフローは、本明細書に記載のクラスIIタイプIICRISPRエンドヌクレアーゼのMG1、MG2、MG3、MG4、MG6、MG14、MG15、MG16、MG18、MG21、MG22、及びMG23ファミリーの描写をもたらした。
実施例2A.-CRISPRシステムのMG1ファミリーの発見
実施例1のメタゲノム分析からのデータの分析により、最初に6つのメンバー(配列番号5、6、1、2、及び3としてそれぞれ記録された、MG1-1、MG1-2、MG1-3、MG1-4、MG1-5、及びMG1-6)を含む、以前に記載されていない推定CRISPRシステムの新しいクラスターが明らかになった。このファミリーは、HNHドメイン及びRuvCドメインを担持する酵素を特徴とする。このファミリーのRuvCドメインは、以前に記載されたCas9ファミリーメンバーとの相同性が低いRuvC_III部分を有する。初期ファミリーメンバーはそれらの間で最大56.8%の同一性を有するが、6つの酵素は全てRuvCドメインの異なるRuvC_III部分を呈し、RHHALDAMV(配列番号5615)、KHHALDAMC(配列番号5616)、又はKHHALDAIC(配列番号5617)の共通モチーフを担持する。これらのモチーフは、他の記載されたCas9様酵素には見られない。これらの新規酵素及びそれらの関連サブドメインの対応するタンパク質及び核酸配列を配列表に提示する。推定tracrRNA配列を、他の遺伝子に対するそれらの位置に基づいて同定し、配列番号5476~5479として提示する。酵素システムは、CRISPRシステムを含有するゲノムbin由来の16S RNAの配列に基づいて、ウェルコミクロビウム(Verrucomicrobia)門、カンディダートゥス・ペレグリニバクテリア(Candidatus Peregrinibacteria)門、又はカンディダートゥス・メライナバクテリア(Candidatus Melainabacteria)門に由来すると思われる。16S rRNA配列を配列番号5592~5596として提示する)。Shmakovらによって記載された特徴(「Mol Cell.」、2015年11月5日;第60巻(第3号):第385~97頁、参照によりその全体が組み込まれる)を一緒に呼び出すCRISPRシステム配列の詳細なドメインレベルのアラインメントを、図9A、図9B、図9C、図9D、図9E、図9F、図9G、及び図9Hに示す。MG1-1、1-2、及び1-3と追加の独自タンパク質データセットとの比較により、配列番号7~319として提示される、同様の構造を有する追加のタンパク質配列が明らかになった。これらのMG1タンパク質配列は、配列番号5618~5632に示されるような追加のMG1モチーフの発見をもたらした。
実施例2B.-CRISPRシステムのMG2ファミリーの発見
実施例1のメタゲノム分析からのデータの分析により、6つのメンバー(MG2-1、MG2-2、MG2-3、MG2-5、及びMG2-6)を含む、これまでに記載されていない推定CRISPRシステムの新しいクラスターが明らかになった。これらの新規酵素及び例示的なサブドメインの対応するタンパク質及び核酸配列は、配列番号320、322~325として提示されている。他の遺伝子に対するそれらの位置に基づいて、推定tracrRNA配列を、オペロンにおいて同定し、配列番号5490、5492~5494、及び5538として提示する。Shmakovら(「Mol Cell.」、2015年11月5日;第60巻(第3号):第385~97頁)に概説されているCas9に対するこれらの配列の詳細なドメインレベルのアラインメントを図7に示す。
MG2-1、MG2-2、MG2-3、MG2-5、及びMG2-6対追加の独自タンパク質データセットの比較により、配列番号321及び配列番号326~420として提示される、類似の構造を有する追加のタンパク質配列が明らかになった。MG2ファミリーメンバーで一般的に見られるモチーフは、配列番号5631~5638として提示されている。
実施例2C.-CRISPRシステムのMG3ファミリーの発見
実施例1のメタゲノム分析からのデータの分析により、新規のこれまでに記載されていない推定CRISPRシステム:MG3-1が明らかになった。この新規酵素及びその例示的なサブドメインの対応するアミノ酸配列を、配列番号424、2245、及び4059として提示する。オペロン中の他の要素への近接に基づいて、推定tracrRNA含有配列が同定され、配列番号5498として含まれる。アクチノミセス・ネスルンディ(Actinomyces naeslundii)由来のCas9に対する配列の詳細なドメインレベルのアラインメントを図8に示す。
MG3-1対追加の独自のタンパク質データセットの比較により、配列番号421~423、425~431として提示される、類似の構造を有する追加のタンパク質配列が明らかになった。
実施例2D.-CRISPRシステムのMG4、7、14、15、16、18、21、22、23ファミリーの発見
実施例1のメタゲノム分析からのデータの分析により、各1つのメンバーの9つのファミリーを含む以前に記載されていない推定CRISPRシステムの新しいクラスターが明らかになった(MG4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1)。これらの新規酵素及びそれらの例示的なサブドメインの対応するタンパク質及び核酸配列は、配列番号432、669、678、930、1093、1354、1512、1656、1756として提示されている。オペロン中の他の要素との近接に基づいて、推定tracr含有配列を各ファミリーについて同定した。これらの配列は、それぞれ、配列番号5503~5511として配列表に提示されている。
MG 4-5、MG7-2、MG14-1、MG15-1、MG16-2、MG18-1、MG21-1、MG22-1、MG23-1と追加の独自タンパク質データセットとの比較により、配列番号433~660、670~677、679~929、931~1092、1094~1353、1355~1511、1513~1655、1657~1755、及び1757~1826として提示される、類似の構造を有する追加のタンパク質配列が明らかになった。CRISPRシステムのこれらのセットのヌクレアーゼに共通するモチーフは、MG4では配列番号5649、MG14では配列番号5650~5667、MG15では5668~5675、MG16では配列番号5676~5678、MG18では配列番号5679~5686、MG21では配列番号5687~5693及び配列番号5674~5675、MG22では配列番号5694~5699、並びにMG23では配列番号5700~5717として提示される。
実施例3.-予測--プロトスペーサー隣接モチーフの決定。
実験は、Karvelisら、「Methods.」、2017年5月15日;第121~122巻:第3~8頁の実施例のいずれかと同様に行う。これは、本明細書に記載の新規酵素のプロトスペーサー隣接モチーフ(PAM)配列特異性を同定して、最適な合成配列標的化を可能にするために、参照により本明細書に完全に組み込まれる。
一例(インビボスクリーニング)では、本明細書に記載の酵素のいずれかをコードするプラスミド、及びプロトスペーサー標的化ガイドRNAを担持する細胞を、抗生物質耐性遺伝子、及びランダム化PAM配列に隣接するプロトスペーサー配列を含有するプラスミドライブラリーで同時形質転換する。機能性PAMを含有するプラスミドは酵素によって切断され、細胞死をもたらす。生存細胞から単離された酵素切断耐性プラスミドプールのディープシーケンシングは、機能的切断許容PAMを含有する枯渇プラスミドのセットを示す。
別の例(インビトロスクリーニング)では、DNAプラスミド又は鎖状体リピートの形態のPAMライブラリーを、インビトロ又は細胞溶解物中で組み立てられたRNP複合体(例えば、酵素、tracrRNA及びcrRNA、又は酵素及びハイブリッドsgRNAを含む)による切断に供する。成功した切断事象から得られた遊離DNA末端は、アダプタライゲーションによって捕捉され、続いてPAM側産物のPCR増幅が行われる。機能性PAMの増幅ライブラリーをディープシーケンシングに供し、DNA切断をライセンスするPAMを同定する。
実施例4.-予告(Prophetic)-ゲノム編集のための哺乳動物細胞における本明細書に記載の合成CRISPRシステムの使用
(i)細胞適合性C末端核局在化配列(例えば、ヒト細胞の場合にはSV40NLS)及び好適なポリアデニル化シグナル(例えば、ヒト細胞の場合のTK pAシグナル)を有する細胞適合性プロモーター下におけるコドン最適化酵素をコードするORFと、(ii)好適なポリメラーゼIIIプロモーター(例えば、哺乳動物細胞におけるU6プロモーター)下におけるsgRNA(Gで始まる5’配列に続いてゲノムDNAを標的化する20ntの相補的標的化核酸配列を有し、その後に例3を介して同定された対応する適合PAMと、3’tracr結合配列、リンカー、及びtracrRNA配列を有する)をコードするORF)をコードするORFと、をコードするDNA/RNA配列を調製する。いくつかの実施形態では、これらの配列は、好適な技術を介して真核細胞にトランスフェクトされる、同じ又は別個のプラスミドベクター上で調製される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクト又は微量注入される、別個のDNA配列として調製される。いくつかの実施形態では、これらの配列は、細胞にトランスフェクト又は微量注入される合成RNA又はインビトロ転写RNAとして調製される。いくつかの実施形態では、これらの配列はタンパク質に翻訳され、細胞にトランスフェクト又は微量注入される。
どちらのトランスフェクション方法を選択したとしても、(i)及び(ii)を細胞へと導入する。酵素及び/又はsgRNAを活性形態へと転写及び/又は翻訳することができるように、インキュベーション期間を経過させる。インキュベーション期間後、標的化配列の近傍のゲノムDNAを分析する(例えば、シーケンシングによる)。インデルは、酵素媒介切断及び非相同末端結合の結果として、標的化配列の近傍のゲノムDNAへと導入される。
いくつかの実施形態では、(i)及び(ii)は、相同組換え修復を促進する、25bp以上のサイズの切断部位に隣接するゲノムの領域をコードする第3の修復ヌクレオチドを有する細胞へと導入される。これらの隣接配列内に含有されるのは、単一塩基対突然変異、機能的遺伝子断片、発現のための外来遺伝子若しくはネイティブ遺伝子、又は生化学経路を構成するいくつかの遺伝子であり得る。
実施例5.-予告-インビトロでの本明細書に記載の合成CRISPRシステムの使用
本明細書に記載の酵素のいずれかは、精製タグを含有する好適な大腸菌(E.coli)発現プラスミドにクローニングされ、大腸菌(E.coli)で組換え発現され、組換えタグを用いて精製される。5’Gと、それに続く20nt標的化配列及びPAM配列、適合性crRNAのtracrRNA結合領域、GAAAリンカー、並びに適合性tracrRNAとを含むRNAは、好適な固相RNA合成方法によって合成される。組換え酵素及びsgRNAを、Mg2+(例えば、20mM HEPES pH7.5、100mM KCl、5mM MgCl、1mM DTT、5%グリセロール)を含有する好適な切断緩衝液中で組み合わせ、標的化配列及びPAM配列に相補的な配列を含む標的DNAを導入することによって、反応を開始する。DNAの切断を好適なアッセイ(例えば、アガロースゲル電気泳動と、それに続く臭化エチジウム染色(又は同様に作用するDNA挿入剤)及びUV可視化と)によって監視する。
実施例6.-(一般プロトコル)本明細書に記載のエンドヌクレアーゼのPAM配列の同定/確認
PAM配列は、大腸菌(E.coli)溶解物ベースの発現システム(myTXTL、Arbor Biosciences)で発現される推定エンドヌクレアーゼによって切断され得る、ランダムに生成されたPAM配列を含有するプラスミドをシーケンシングすることによって決定した。このシステムでは、大腸菌(E.coli)コドン最適化ヌクレオチド配列を、T7プロモーターの制御下においてPCR断片から転写及び翻訳した。T7プロモーター下におけるtracr配列、及びT7プロモーターとそれに続くリピートスペーサー反復配列からなる最小CRISPRアレイとを有する第2のPCR断片を同じ反応で転写した。TXTLシステムにおけるエンドヌクレアーゼ及びtracr配列の発現の成功、その後のCRISPRアレイプロセシングは、活性なインビトロCRISPRヌクレアーゼ複合体を提供した。
最小アレイとそれに続く8N混合塩基(推定PAM配列)と一致するスペーサー配列を含有する標的プラスミドのライブラリーを、TXTL反応の出力とともにインキュベートした。1~3時間後、反応を停止させ、DNAを、DNAクリーンアップキット、例えばZymoDCC、AMPureXPビーズ、QiaQuick等によって回収した。アダプタ配列を、エンドヌクレアーゼによって切断されている活性PAM配列を有するDNAに平滑末端ライゲーションしたが、一方で切断されなかったDNAはライゲーションにアクセスできなかった。次いで、活性PAM配列を含むDNAセグメントを、ライブラリー及びアダプタ配列に特異的なプライマを用いたPCRによって増幅した。PCR増幅産物をゲル上で分解して、切断事象に対応するアンプリコンを同定した。切断反応の増幅セグメントはまた、NGSライブラリーを調製するための鋳型としても使用した。出発8Nライブラリーのサブセットであったこの得られたライブラリーのシーケンシングにより、活性CRISPR複合体に対する正しいPAMを含有する配列が明らかになった。単一のRNA構築物を用いたPAM試験のために、インビトロ転写RNAをプラスミドライブラリーと共に添加し、tracr/最小CRISPRアレイ鋳型を省略したことを除いて、同じ手順を繰り返した。NGSライブラリーが調製されたエンドヌクレアーゼについては、seqLogo(例えば、Huberら、「Nat Methods.」、2015年2月;第12巻(第2号):第115~21頁)表現が構築され、図27、図38、図29、図30、図31、図32、図33、図34、及び図35に提示される。これらの表現を構築するために使用されるseqLogoモジュールは、DNA配列モチーフ(例えば、PAMシーケンス)の位置重みマトリックスを取り、Schneider及びStephensによって導入された対応する配列ロゴをプロットする(例えば、Schneiderら、「Nucleic Acids Res.」、1990年10月25日;第18巻(第20号):第6097~100頁。seqLogo表現内の配列を表す文字は、整列された配列(例えば、PAM配列)内の各位置で互いに積み重ねられている。各文字の高さはその頻度に比例し、最も一般的な文字が上になるように文字がソートされている。
実施例7.-(一般プロトコル)tracrRNA及びsgRNA構造のRNAフォールディング
Andronescuら、「Bioinformatics.」、2007年7月1日;第23巻(第13号):第i19~28頁(参照によりその全体が本明細書に組み込まれる)の方法を用いて、37℃でのガイドRNA配列のフォールド構造を計算した。本明細書中に記載される例示的なsgRNAの予測される構造を、図21、図22、図23、図24、図25、及び図26に提示する。
実施例8.-(一般プロトコル)MG CRISPR複合体のインビトロ切断効率
エンドヌクレアーゼを、プロテアーゼ欠損大腸菌(E.coli)B株における誘導可能なT7プロモーターからのHisタグ化融合タンパク質として発現させた。Hisタグ化タンパク質を発現する細胞を超音波処理によって溶解し、Hisタグ化タンパク質を、AKTA Avant FPLC(GE Lifescience)でのHisTrapFFカラム(GE Lifescience)におけるNi-NTAアフィニティクロマトグラフィによって精製した。溶出液をアクリルアミドゲル(Bio-Rad)上でSDS-PAGEによって分解し、InstantBlueUltrafastクーマシー(Sigma-Aldrich)で染色した。ImageLabソフトウェア(Bio-Rad)を用いたタンパク質バンドのデンシトメトリを用いて純度を決定した。精製エンドヌクレアーゼを、50mM Tris-HCl、300mM NaCl、1mM TCEP、5%グリセロールからなる保存緩衝液に透析し、pH7.5、-80℃で保存した。
スペーサー配列及びPAM配列(例えば、実施例6のように決定)を含有する標的DNAを、DNA合成によって構築した。単一の代表的なPAMを、PAMが縮重塩基を有する場合の試験のために選択した。標的DNAは、一端から700bpに位置するPAM及びスペーサーを用いたPCR増幅によって、プラスミドに由来する2200bpの線状DNAを含んでいた。切断が成功すると、700bp及び1500bpの断片が得られた。標的DNA、インビトロ転写単一RNA、及び精製組換えタンパク質を、過剰なタンパク質及びRNAを伴う切断緩衝液(10mMトリス、100mM NaCl、10mM MgCl)中で合わせ、5分間~3時間、通常は1時間インキュベートした。反応を、RNAse Aの添加及び60分間のインキュベーションによって停止させた。次いで、反応物を1.2%TAEアガロースゲルで分解し、切断された標的DNAの画分をImageLabソフトウェアで定量化する。
実施例9.-(一般プロトコル)大腸菌(E.coli)におけるMG CRISPR複合体のゲノム切断活性の試験
大腸菌(E.coli)は二本鎖DNA切断を効率的に修復する能力を欠く。したがって、ゲノムDNAの切断は致死的な事象であり得る。この現象を利用して、エンドヌクレアーゼ活性を、そのゲノムDNAに組み込まれたスペーサー/標的及びPAM配列を有する標的株においてエンドヌクレアーゼ及びtracrRNAを組換え発現させることによって、大腸菌(E.coli)において試験した。
このアッセイでは、PAM配列は、実施例6に記載の方法によって決定されるように、試験されているエンドヌクレアーゼに特異的である。sgRNA配列は、tracrRNAの配列及び予測される構造に基づいて決定された。リピート部の5’末端から開始して、8~12bp(一般に、10bp)のリピート-抗-リピート(repeat-anti-repeat)対を選択した。リピートの残りの3’末端及びtracrRNAの5’末端をテトラループで置き換えた。概して、テトラループはGAAAであったが、特にGAAA配列がフォールディングを妨害すると予測される場合、他のテトラループを使用することができる。これらの場合、TTCGテトラループを使用した。
ゲノムDNAに組み込まれたPAM配列を有する操作された株を、エンドヌクレアーゼをコードするDNAで形質転換した。次いで、形質転換体を化学適格性にし、標的配列に対して特異的(「オンターゲット」)又は標的に対して非特異的(「ノンターゲット」)のいずれかである50ngのシングルガイドRNAで形質転換した。熱衝撃後、形質転換を37℃で2時間にわたりSOC中で回収させた。次いで、誘導培地上で増殖させた5倍希釈系列によってヌクレアーゼ効率を決定した。コロニーを3連で希釈系列から定量化した。
実施例10a.-(一般プロトコル)哺乳動物細胞におけるMG CRISPR複合体のゲノム切断活性の試験
哺乳動物細胞における標的化及び切断活性を示すために、MG Casエフェクタータンパク質配列を、2つの哺乳動物発現ベクターで試験した:(a)C末端SV40 NLS及び2A-GFPタグを有する1つ、並びに(b)GFPタグを有しない1つ、及び2つのSV40 NLS配列、N末端上の1つ及びC末端上の1つ。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列を、哺乳動物細胞における発現のためにコドン最適化した。
標的化配列が結合した対応するシングルガイドRNA配列(sgRNA)を、第2の哺乳動物発現ベクターへとクローニングする。2つのプラスミドをHEK293T細胞へコトランスフェクトする。HEK293T細胞への発現プラスミド及びsgRNA標的プラスミドのコトランスフェクションの72時間後、DNAを抽出し、NGSライブラリーの調製に使用する。パーセントNHEJを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証する。各タンパク質の活性を試験するために、少なくとも10個の異なる標的部位を選択した。
実施例10b.(一般プロトコル)哺乳動物細胞におけるMG CRISPR複合体のゲノム切断活性の試験
哺乳動物細胞における標的化及び切断活性を示すために、MG Casエフェクタータンパク質配列を2つの哺乳動物発現ベクターへとクローニングした:(a)隣接するN及びC末端SV40 NLS配列、C末端Hisタグ、及びHisタグの後のC末端に2A-GFPタグを有する1つ(バックボーン1)、並びに(b)隣接するNLS配列及びC末端Hisタグを有するがT2A GFPタグを有しない1つ(バックボーン2)。いくつかの例では、エンドヌクレアーゼをコードするヌクレオチド配列は、天然配列、大腸菌(E.coli)での発現のためにコドン最適化されたもの、又は哺乳動物細胞での発現のためにコドン最適化されたものであった。
標的化配列が結合した対応するシングルガイドRNA配列(sgRNA)を、第2の哺乳動物発現ベクターへとクローニングした。2つのプラスミドをHEK293T細胞へコトランスフェクトした。HEK293T細胞への発現プラスミド及びsgRNA標的プラスミドのコトランスフェクションの72時間後、DNAを抽出し、NGSライブラリーの調製に使用した。パーセントNHEJを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証した。各タンパク質の活性を試験するために、約7~12個の異なる標的部位を選択した。5%インデルの任意の閾値を使用して、活性候補を同定した。
実施例11.-MG1ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG1ファミリーエンドヌクレアーゼシステムの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。増幅産物は、MG1-4(デュアルガイド:ゲル1、レーン3を参照、シングルガイド:ゲル6レーン2を参照)、MG1-5(ゲル2レーン10)、MG1-6(デュアルガイド:ゲル5レーン6を参照、シングルガイド:ゲル6レーン5を参照)、及びMG1-7(デュアルガイド:ゲル3レーン13参照、シングルガイド:ゲル3レーン2参照)について観察された(それぞれ、タンパク質配列番号1~4)。PCR産物のシーケンシングにより、表2に示すように、これらの酵素の活性PAM配列が明らかになった。
合成シングルガイドRNA(sgRNA)を、tracrRNAの配列及び予測構造に基づいて設計し、配列番号5461~5464として提示する。実施例6のPAM配列スクリーニングをsgRNAで繰り返した。この実験の結果はまた表2にも提示するが、この結果は、sgRNAを用いた場合にPAM特異性がわずかに変化したことを明らかにする。
インビトロでの標的化エンドヌクレアーゼ活性
PAM配列CAGGAAGGを有する標的DNAに対するMG1-4エンドヌクレアーゼシステム(sgRNA配列番号5461を有するタンパク質配列番号1)のインビトロ活性を、実施例8の方法を用いて検証した。上で報告されたシングルガイド配列(配列番号5461)を使用し、18~24ntの様々なスペーサー/標的化配列長を配列のNに置き換えた。結果を図10に示し、左側パネルは、異なる標的化配列長(18~24nt)を有する対応するシングルガイドsgRNAと組み合わせたMG1-4によるDNA切断を実証するゲルを示し、右側パネルは、棒グラフとして定量化された同じデータを示す。データは、18~24ヌクレオチドからの標的化配列がMG1-4/sgRNAシステムで機能的であることを実証した。
細菌細胞における標的化エンドヌクレアーゼ活性
MG1-4エンドヌクレアーゼシステム(タンパク質配列番号1、sgRNA配列番号5461)のインビボ活性を、実施例9のようにPAM配列CAGGAAGGを用いて試験した。形質転換した大腸菌(E.coli)を段階希釈で播種し、結果(左側のパネルに大腸菌(E.coli)段階希釈を示し、右側のパネルに増殖の定量を示す)を図11に提示する。非標的sgRNAを発現する大腸菌(E.coli)と比較して、標的sgRNA上で発現する大腸菌(E.coli)の増殖における実質的な減少は、ゲノムDNAが大腸菌(E.coli)細胞中でエンドヌクレアーゼによって特異的に切断されたことを示す。
哺乳動物細胞における標的化エンドヌクレアーゼ活性(a)
実施例10の方法を使用して、哺乳動物細胞における標的化及び切断活性を実証した。MG1-4(タンパク質配列番号5527)及びMG1-6(タンパク質配列番号5529)配列をコードするオープンリーディングフレームを、2つの哺乳動物発現ベクターへとクローニングし、1つはC末端SV40 NLS及び2A-GFPタグを有し(大腸菌(E.coli)MG-BB)、1つはGFPタグを有さず、2つのNLS配列を有し、1つはN末端上にあり、1つはC末端上にある(大腸菌(E.coli)pMG5-BB)。MG1-6については、オープンリーディングフレームを哺乳動物発現のために更にコドン最適化し(配列番号5589)、2-NLSプラスミドバックボーンへとクローニングした(MG-16hs)。この実験の結果を図12に示す。エンドヌクレアーゼに特異的なtracr配列及び表3~表4から選択されるガイド配列を有するsgRNA(例えば、配列番号5512又は配列番号5515)を発現するための第2のベクターを用いて、エンドヌクレアーゼ発現ベクターをHEK293T細胞にコトランスフェクトした。コトランスフェクションの72時間後、DNAを抽出し、NGSライブラリーの調製に使用した。標的部位の配列に近接する内部欠失(NHEJレムナント)の出現によって切断活性を検出した。パーセントNHEJを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証し、これを図12に提示する。
哺乳動物細胞における標的化エンドヌクレアーゼ活性(b)
MG1-4標的遺伝子座を選択して、PAM nRRRAA(配列番号5527)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表4aに列挙する。様々な標的部位におけるMG1-4の活性を表4a及び図37に示す。
MG1-6標的遺伝子座を選択して、PAM nnRRAC(配列番号5529)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表4bに列挙する。様々な標的部位におけるMG1-6の活性を表4b及び図38に示す。
MG1-7標的遺伝子座を選択して、PAM nRRRAAG(配列番号5515)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表4cに列挙する。様々な標的部位におけるMG1-7の活性を表4c及び図39に示す。
実施例12.-MG2ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG2ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムで確認した。このアッセイの結果を図17~図20に示す。図17~図20に示すアッセイでは、ライブラリーを首尾よく切断する活性タンパク質は、ゲル中に約170bpのバンドをもたらす。MG2-1(ゲル2レーン11及びゲル4レーン6参照)並びにMG2-7(ゲル11レーン10参照)について、増幅産物が観察された(それぞれ、配列番号320及び配列番号321)。PCR産物のシーケンシングにより、以下の表5の活性なPAM配列が明らかになった。
細菌細胞における標的化エンドヌクレアーゼ活性
sgRNA(エンドヌクレアーゼ配列番号321;sgRNA配列番号5465)及びAGCGTAAG PAM配列を有するMG2-7エンドヌクレアーゼシステムのインビボ活性を、実施例9に記載の方法を用いて確認した。形質転換した大腸菌(E.coli)を段階希釈で播種し、結果(左側のパネルに大腸菌(E.coli)段階希釈を示し、右側のパネルに増殖の定量を示す)を図34に提示する。非標的sgRNAを発現する大腸菌(E.coli)と比較して、標的sgRNA上で発現する大腸菌(E.coli)の増殖における実質的な減少は、ゲノムDNAが大腸菌(E.coli)細胞中でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示す。
実施例13.-MG3ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG3ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、tracr配列及びCRISPRアレイを用いて、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。増幅産物は、MG3-6(デュアルガイド:ゲル2レーン8参照;シングルガイド:ゲル3レーン3参照)、MG3-7(デュアルガイド:ゲル2レーン3参照、シングルガイド:ゲル3レーン4参照)、及びMG3-8(デュアルガイド:ゲル9レーン5参照)について観察された(それぞれ、配列番号421、422、及び423)。PCR産物のシーケンシングにより、以下の表6の活性なPAM配列が明らかになった。
合成シングルガイドRNA(sgRNA)を、tracrRNAの配列及び予測構造に基づいて設計し、配列番号5466~5467として提示する。実施例6のPAM配列スクリーニングをsgRNAで繰り返した。この実験の結果はまた表6にも提示するが、この結果は、sgRNAを用いた場合にPAM特異性がわずかに変化したことを明らかにする。
インビトロでの標的化エンドヌクレアーゼ活性
MG3-6(エンドヌクレアーゼ配列番号421)のインビトロ活性を、実施例8の方法を用いてPAM配列GTGGGTTAで検証した。上で報告されたシングルガイド配列(配列番号5466)を使用し、18~24ntの様々なスペーサー/標的化配列長を配列のNに置き換えた。結果を図13に示し、上部パネルは、異なる標的化配列長(18~24nt)を有する異なるsgRNAと組み合わせたMG3-6によるDNA切断を実証するゲルを示し、下部パネルは、棒グラフとして定量化された同じデータを示す。データは、18~24ヌクレオチドからの標的化配列がMG3-6/sgRNAシステムで機能的であることを実証した。
細菌細胞における標的化エンドヌクレアーゼ活性
MG3-7エンドヌクレアーゼシステム(タンパク質配列番号422;sgRNA配列番号5467)のインビボ活性を、実施例9の方法を用いてPAM配列TGGACCTGで試験した。形質転換した大腸菌(E.coli)を段階希釈で播種し、結果(上部のパネルに大腸菌(E.coli)段階希釈を示し、下部のパネルに増殖の定量を示す)を図14に示す。非標的sgRNAを発現する大腸菌(E.coli)と比較して、標的sgRNA上で発現する大腸菌(E.coli)の増殖における実質的な減少は、ゲノムDNAがMG3-7エンドヌクレアーゼシステムによって特異的に切断されていたことを示す。
哺乳動物細胞における標的化エンドヌクレアーゼ活性(a)
実施例10の方法を使用して、哺乳動物細胞における標的化及び切断活性を実証した。MG3-7(タンパク質配列番号422)をコードするオープンリーディングフレームを、2つの哺乳動物発現ベクターへとクローニングし、1つはC末端SV40 NLS及び2A-GFPタグを有し(大腸菌(E.coli)MG-BB)、1つはGFPタグを有さず、2つのNLS配列を有し、1つはN末端上にあり、1つはC末端上にある(大腸菌(E.coli)pMG5-BB)。エンドヌクレアーゼ発現ベクターを、表7から選択されるガイド配列を有する上記sgRNAを発現するための第2のベクターでHEK293T細胞へとコトランスフェクトした。この実験の結果を図12に示す。コトランスフェクションの72時間後、DNAを抽出し、NGSライブラリーの調製に使用した。標的部位の近傍における内部欠失(NHEJレムナント)の出現によって切断活性を検出した。結果を図15に提示する。
sgRNAプラスミドにコードされた標的部位を以下の表7に示す。
哺乳動物細胞における標的化エンドヌクレアーゼ活性(b)
MG3-6標的遺伝子座を選択して、PAM nnRGGTT(配列番号5532)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン1のsgRNAスキャフォールドにクローニングした。部位を以下の表7aに列挙する。様々な標的部位におけるMG3-6の活性を表7a及び図40に示す。
MG3-7標的遺伝子座を選択して、PAM nnRnTAC(配列番号6303)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムにおけるsgRNAスキャフォールドにクローニングした。部位を以下の表7bに列挙する。様々な標的部位におけるMG3-7の活性を表7b及び図41に示す。
MG3-8標的遺伝子座を選択して、PAM nnRGGTT(配列番号5534)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン1のsgRNAスキャフォールドにクローニングした。部位を以下の表7cに列挙する。様々な標的部位におけるMG3-8の活性を表7c及び図42に示す。
実施例13.-MG4ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG4ファミリーエンドヌクレアーゼシステムの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG4-2(デュアルガイド:ゲル2レーン9参照、シングルガイド:ゲル10レーン7参照)について、増幅産物が観察された(配列番号432)。PCR産物のシーケンシングにより、以下の表8に示す活性なPAM配列が明らかになった。
実施例14.-MG14ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG14ファミリーメンバーの標的化されたエンドヌクレアーゼ活性(実施例6に記載されるようなmyTXTLシステムを用いて確認した)。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG14-1(デュアルガイド:ゲル1レーン4参照、シングルガイド:ゲル3レーン8参照)について、増幅産物が観察された(配列番号678)。PCR産物のシーケンシングにより、以下の表9に特異的に示す活性なPAM配列が明らかになった。
細菌細胞における標的化エンドヌクレアーゼ活性
sgRNA(エンドヌクレアーゼ配列番号678;sgRNA配列番号5469)及びGGCGGGGA PAM配列を有するMG14-1エンドヌクレアーゼシステムのインビボ活性を、実施例9に記載の方法を用いて確認した。形質転換した大腸菌(E.coli)を段階希釈で播種し、結果(左側のパネルに大腸菌(E.coli)段階希釈を示し、右側のパネルに増殖の定量を示す)を図35に提示する。非標的sgRNAを発現する大腸菌(E.coli)と比較して、標的sgRNA上で発現する大腸菌(E.coli)の増殖における実質的な減少は、ゲノムDNAが大腸菌(E.coli)細胞中でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示す。
哺乳動物細胞における標的化エンドヌクレアーゼ活性
MG14-1標的遺伝子座を選択して、ゲノム内の位置をPAM nnnnnGGTA(配列番号5535)により試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表9aに列挙する。様々な標的部位におけるMG14-1の活性を表9a及び図43に示す。
実施例15.-MG15ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG15ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG15-1(デュアルガイド:ゲル7レーン7参照、シングルガイド:ゲル3レーン9参照)について、増幅産物が観察された(配列番号930)。PCR産物のシーケンシングにより、以下の表10に特異的に詳述する活性なPAM配列が明らかになった。
インビトロ活性
MG15-1エンドヌクレアーゼシステム(タンパク質配列番号930;sgRNA配列番号5470)のインビトロ活性を、実施例8の方法を用いてPAM配列GGGTCAAAで試験した。上で報告されたシングルガイド配列(配列番号5470)を使用し、18~24ntの様々なスペーサー/標的化配列長で使用した(配列のNに置換え)。結果を図16に示し、上部パネルは、異なる標的化配列長(18~24nt)を有する異なるsgRNAと組み合わせたMG15-1によるDNA切断を実証するゲルを示し、下部パネルは、棒グラフとして定量化された同じデータを示す。データは、18~24ヌクレオチドからの標的化配列がMG15-1/sgRNAシステムで機能的であることを実証した。
細菌細胞における標的化エンドヌクレアーゼ活性
sgRNA(エンドヌクレアーゼ配列番号930;sgRNA配列番号5470)及びGGGTCAAA PAM配列を有するMG15-1エンドヌクレアーゼシステムのインビボ活性を、実施例9に記載の方法を用いて確認した。形質転換した大腸菌(E.coli)を段階希釈で播種し、結果(左側のパネルに大腸菌(E.coli)段階希釈を示し、右側のパネルに増殖の定量を示す)を図35に提示する。非標的sgRNAを発現する大腸菌(E.coli)と比較して、標的sgRNA上で発現する大腸菌(E.coli)の増殖における実質的な減少は、ゲノムDNAが大腸菌(E.coli)細胞中でMG1-4エンドヌクレアーゼによって特異的に切断されたことを示す。
実施例16.-MG16ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG16ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG16-2(ゲル11、レーン17参照)について、増幅産物が観察された(配列番号1093)。PCR産物のシーケンシングにより、以下の表11に特異的に詳述する活性なPAM配列が明らかになった。
実施例17.-MG18ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG18ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG18-1(デュアルガイド:ゲル9レーン9参照、シングルガイド:ゲル11レーン12参照)について、増幅産物が観察された(配列番号1354)。PCR産物のシーケンシングにより、以下の表12に特異的に詳述する活性なPAM配列が明らかになった。
哺乳動物細胞における標的化エンドヌクレアーゼ活性
MG18-1標的遺伝子座を選択して、PAM nRWART(配列番号5537)によりゲノム内の位置を試験した。選択した標的部位に対応するスペーサーを、実施例10bに記載の哺乳動物ベクターシステムバックボーン1のsgRNAスキャフォールドにクローニングした。部位を以下の表12aに示す。様々な標的部位におけるMG18-1の活性を表12a及び図44に示す。
実施例18.-MG21ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG21ファミリーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG21-1(ゲル11レーン2参照)について、増幅産物が観察された(配列番号1512)。PCR産物のシーケンシングにより、以下の表13に特異的に詳述する活性なPAM配列が明らかになった。
実施例19.-MG22ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG22ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。図17~図20に示すアッセイでは、ライブラリーを首尾よく切断する活性タンパク質は、ゲル中に約170bpのバンドをもたらす。MG22-1(ゲル11レーン3参照)について、増幅産物が観察された(タンパク質配列番号1656)。PCR産物のシーケンシングにより、以下の表14に特異的に詳述する活性なPAM配列が明らかになった。
実施例20.-MG23ファミリーメンバーの性質決定
PAM特異性、tracrRNA/sgRNA検証
MG23ファミリーメンバーの標的化されたエンドヌクレアーゼ活性を、実施例6に記載されるようなmyTXTLシステムを用いて確認した。このアッセイでは、切断された標的プラスミドのPCR増幅により、図17~図20に示すように、ゲル中においておよそ170bpで移動する産物が得られる。MG23-1(ゲル11レーン4参照)について、増幅産物が観察された(配列番号1756)。PCR産物のシーケンシングにより、以下の表15に詳述するこれらの酵素の活性PAM配列特異性が明らかになった。
実施例21.-MG21~MG23ファミリーメンバーの哺乳動物活性
哺乳動物細胞における標的化及び切断活性を示すために、タンパク質配列を、隣接するN末端及びC末端のSV40 NLS配列、C末端のHisタグ、及びHisタグの後のC末端に2A-GFPタグを有する哺乳動物発現ベクター(バックボーン1)、又は隣接するNLS配列及びC末端のHisタグを有するが2A GFPタグを有しない発現ベクター(バックボーン2)にクローニングした。タンパク質のDNA配列は、天然配列、大腸菌(E.coli)コドン最適化配列、又は哺乳動物コドン最適化配列であり得る。目的の遺伝子標的を有するシングルガイドRNA配列もまた哺乳動物発現ベクターへとクローニングされる。2つのプラスミドをHEK293T細胞へコトランスフェクトする。HEK293T細胞への発現プラスミド及びsgRNA標的プラスミドのコトランスフェクションの72時間後、DNAを抽出し、NGSライブラリーの調製に使用する。パーセントNHEJを、標的部位のシーケンシングにおけるインデルを介して測定して、哺乳動物細胞における酵素の標的化効率を実証する。各タンパク質の活性を試験するために、7~12個の異なる標的部位を選択した。5%インデルの任意の閾値を使用して、活性候補を同定する。
MG21-1標的遺伝子座を選択して、PAM nnRnRを有する位置を試験した。選択した標的部位に対応するスペーサーを、上記の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表16に列挙する。
MG22-1標的遺伝子座を選択して、PAM nnRCnTを有する位置を試験した。選択した標的部位に対応するスペーサーを、上記の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表17に列挙する。
MG23-1標的遺伝子座を選択して、PAM nRRAを有する位置を試験した。選択した標的部位に対応するスペーサーを、上記の哺乳動物ベクターシステムバックボーン2のsgRNAスキャフォールドにクローニングした。部位を以下の表18に列挙する。
実施例22-本明細書に記載のシステムを用いたT細胞編集
様々なMGシステムが哺乳動物細胞において機能することを確立したことで、本発明者らは、ヒトT細胞ゲノムを編集するためのそれらの有用性を試験しようとした。この目的のためにMG3-6(タンパク質配列番号421)及びMG3-8(タンパク質配列番号423)を最初に使用しようとしたことで、本発明者らは、ヒト細胞におけるガイド活性に基づいて、MG3-6コンセンサスPAM配列が5’-NNRGRYY-3’(配列番号5949)であると決定した。MG3-8のPAMは、5’-NNRGGTT-3’(配列番号5534)として以前に決定された。
TRAC遺伝子座標的化
編集された細胞を生成するために、T細胞におけるTRAC遺伝子座を標的化する適切なスペーサー配列を、MG3-6(例えば、実験においてMG3-6ガイド1~9と称される配列番号5950~5958で表されるスペーサー)、及びMG3-8(例えば、実験において「MG3-8ガイド1-7」と呼ばれる、配列番号5959~5965で表されるスペーサー)の両方について設計した。スペーサー配列を、MG3-6については配列番号5466 sgRNA、及びMG3-8については配列番号6304 sgRNAのバックグラウンドで使用した(以下に列挙する)。
本発明者らは、まず、各エンドヌクレアーゼに適合するTRAC遺伝子を標的とするために使用されるスペーサーの最適な長さを決定しようとした。MG3-6については、本発明者らは、配列を短縮した場合に5’PAM遠位端からトランケートした22~16ヌクレオチドの範囲にわたる長さを持つ、上記スペーサーのサブセット(配列番号5953~5957、実験では「MG3-6ガイド4~8」と称される)を持つsgRNAをヌクレオフェクト(nucleofect)した。これらのスペーサーを担持するガイドRNAは、Lonza4Dエレクトロポレータ及び溶液P3を用いて、それぞれ32若しくは64若しくは128pmolのガイドRNAと共に26若しくは52若しくは104pmolのMG3-6タンパク質を送達し、条件ごとに200K初代T細胞(以前にCD2/3/28ビーズで増殖させたもの)にヌクレオフェクトされた。T細胞からゲノムDNAを3日後に採取し、NGSによって分析した。データを図56に提示するが、これは、MG3-6ガイド4~8を22~16ヌクレオチドからトランケートする効果を示し、19~22ヌクレオチドの長さがMG3-6の短いスペーサーよりも優れた性能を示したことを実証している。
MG3-8を用いて同じスペーサー長最適化実験を実施するために、本発明者らは、配列を短縮した場合に5’PAM遠位端からトランケートした22~16ヌクレオチドの範囲にわたる長さを持つ、上記のスペーサーのサブセット(実験においてMG3-8ガイド2、3、5、及び8と称される配列番号5960~5961及び配列番号5963~5964)でsgRNAをヌクレオフェクトした。これらのスペーサーを担持するガイドRNAは、Lonza4Dエレクトロポレータ及び溶液P3を用いて、104pmolのMG3-8タンパク質及び120pmolのガイドRNAを送達し、200K初代T細胞(条件ごとに(以前にCD2/3/28ビーズで増殖させたもの)にヌクレオフェクトされた。T細胞からゲノムDNAを3日後に採取し、NGSによって分析した。データを図57に提示するが、これは、MG3-8ガイド2、3、5、及び8を22~16ヌクレオチドからトランケートする効果を示し、19~22ヌクレオチドの長さがMG3-8の短いスペーサーよりも優れた性能を示したことを実証している。
TRACを標的とすると思われるスペーサー配列を同定したことで、本発明者らは、これらのスペーサーがTRAC遺伝子にインデルを誘導し、細胞におけるTRAC発現を破壊する能力を試験した。本発明者らは、104pmolのMG3-6タンパク質及び128pmolのガイドRNAを用いて、最高性能の22個のヌクレオチドスペーサーを担持するsgRNA(MG3-6ガイド6、配列番号5955;及びMG3-8ガイド5、配列番号5963)を上記のように初代T細胞へとヌクレオフェクトした。ゲノムDNAを回収の3日後に採取し、インデルの出現についてNGSによって、又は抗TCRアルファ鎖Abを用いるフローサイトメトリによって分析した。NGSインデル分析を図58に示す。これは、MG3-6及びMG3-8の両方のsgRNA/酵素の組合せが、TRAC遺伝子におよそ90%以上の頻度のインデルを生成することを実証している。フローサイトメトリ分析を図59に示す。これは、MG3-6sgRNA/酵素の組合せがおよそ95%のTCR陰性細胞を生成することを実証している。
MG3-6/ガイド6の組合せがフローサイトメトリによってTRACノックアウトを効果的に生成することを観察したことで、本発明者らは、トランスフェクションエンハンサ又はより高いガイド濃度の添加が、より性能の低いMG3-6TRACスペーサー担持ガイドのノックアウトの効率を改善し得るかどうかを試験した。したがって、本発明者らは、上記のようにT細胞をトランスフェクトし、52pmolのMG3-6タンパク質、及び60pmolのガイドRNA、及び1μLのIDTトランスフェクションエンハンサ(利用する場合)、又は120pmolのガイドRNA若しくは180pmolのガイドRNAを、MG3-6ガイド4~6(配列番号5953~5955のスペーサー配列であり、22ヌクレオチド長であった)の各々へと送達し、抗TCRアルファ鎖Abを用いて再度フローサイトメトリによってアッセイした。結果を図60に示し、これは、ガイド4及びガイド5について、ガイド濃度を増加させることにより、TRACノックアウトの効率をそれぞれ約87%又は約71%まで増加させることができることを実証する。
TRBC遺伝子座標的化
上記でT細胞におけるTRAC遺伝子座ターゲティングを実証したことで、本発明者らは次に、TRBC遺伝子座を標的化するための試薬を設計及びスクリーニングした。したがって、本発明者らは、上記のようにMG3-6及びMG3-8に対応するスペーサーを再び設計し(MG3-6については表19、MG3-8については表20を参照)、TRBC遺伝子座の配列に対してのみそれらを指示した。TRBCは2つのスプライスバリアント(TRBC1及びTRBC2)を有するので、本発明者らは、各々を標的とするスペーサーを設計した。本発明者らは、上記のように、ガイドRNAを担持する各22ntスペーサーを酵素と共にT細胞へとヌクレオフェクトし、抗TCR Abを用いてT細胞受容体の発現を評価した。各スペーサー担持ガイドのTCRを、フローサイトメトリの時間におけるT細胞の生存率%と共に、以下の表19及び表20に示す。表19及び表20は、いくつかのスペーサー(MG3-6については5、6、18、及び19、MG3-8については2、6、7、及び8)が、T細胞におけるTCRノックアウトの誘導において中程度から非常に有効であることを示す。
CAR-T発現に伴うTCRアブレーション
本発明者らは、本発明者らのエンドヌクレアーゼ/ガイドの組合せを用いてT細胞におけるTCR発現を効果的にノックアウトすることができることを実証したことで、本発明者らは次に、TCRをノックアウトし、同じ細胞において異種CAR(キメラ抗原受容体)を発現させることによって同種異系CAR-T細胞を生成することができるかどうかを求めた。この実験のために本発明者らが使用したスキームを図61に示しており、これは、TCR遺伝子座の提案された標的化と、それに続く相同組換えによる同じ遺伝子座でのCARのインテグレーションとを示す。
したがって、本発明者らは、300KのMOIでTRACホモロジーアームを有する異種CAR配列を担持するAAV#3029を有する同じT細胞のみに感染させる、TRAC標的化MG3-6ガイド6、配列番号5955を有する高性能MG3-6酵素を用いて上記のようにT細胞をヌクレオフェクトした。TCR受容体及び異種CAR抗原に対するフローサイトメトリを用いて対照と一緒にトランスフェクト細胞を観察した後、本発明者らは、MG3-6トランスフェクション条件が約60%のおよその頻度でCAR+/TCR-細胞を生成し得ることを観察した。
GR(糖質コルチコイド受容体)遺伝子座標的化
本発明者らは、本発明者らのエンドヌクレアーゼ/ガイドの組合せを用いてT細胞におけるTCR発現を効果的にノックアウトすることができたことを実証したことで、本発明者らは次に、T細胞の他の特徴を調節するためにGR(グルココルチコイド受容体)遺伝子座を標的とすることができるかどうかを尋ねた(例えば、糖質コルチコイドに対する応答)。本発明者らは、MG3-6及びMG3-8に適切なスペーサーを再度設計したが、今回はGR遺伝子座の配列を標的とした(以下の表21及び以下の表22を参照)。
MG3-6標的化配列(表21)について、配列1~40をGRエクソン2を標的とするように設計し、配列41~45をGRエクソン3を標的とするように設計し、配列46をGRエクソン4を標的とするように設計し、配列47~54をGRエクソン5を標的とするように設計し、配列55~58をGRエクソン6を標的とするように設計し、配列59~61をGRエクソン7を標的とするように設計し、配列62~65をGRエクソン8を標的とするように設計した。配列を、126pmolのMG3-6タンパク質及び160pmolのガイドを用いて上記の初代T細胞へのヌクレオフェクションによってスクリーニングし、NGSによって以前のように分析した。スクリーニングの結果を図63に示し、これは表21の番号付けされたガイドによって生成されたインデルの%を示す。結果は、いくつかのスペーサー配列(下記の表21の2、3、4、13、18、24、51、55、56、及び61)が、MG3-6を用いてGR遺伝子内にインデルを生成するのに中程度有効であることを示した。
MG3-8標的化配列(表22)について、配列1~17はGRエクソン2を標的とするように設計され、配列18はGRエクソン3を標的とするように設計され、配列19~20はGRエクソン4を標的とするように設計され、配列21~24はGRエクソン5を標的とするように設計され、配列25~26はGRエクソン6を標的とするように設計され、配列27~29はGRエクソン7を標的とするように設計され、配列30~31はGRエクソン8を標的とするように設計された。配列を、52pmolのMG3-8タンパク質及び60pmolのガイドを用いて上記のように初代T細胞へのヌクレオフェクションによってスクリーニングし、NGSによって以前のように分析した。スクリーニングの結果を図64に示す。これは、表22の番号付けされたガイドによって生成されたインデル%を示す。結果は、一部のスペーサー配列(下記表22中の2、25、及び29)が、MG3-8を用いたGR遺伝子におけるインデルの生成において中程度有効であることを示した。
AAVS1セーフハーバ遺伝子座標的化
本発明者らは、本発明者らのエンドヌクレアーゼ/ガイドの組合せを用いてT細胞におけるTCR発現を効果的にノックアウトすることができることを実証したことで、本発明者らは次に、T細胞においてAAVS1セーフハーバ遺伝子座を標的とすることができるかどうかを求めた。本発明者らはMG3-6に適切なスペーサーを設計したが、今回はAAVS1遺伝子座の配列を標的とした(以下の表23参照)。配列を、126pmolのMG3-6タンパク質及び160pmolのガイドを用いて上記のように初代T細胞へのヌクレオフェクションによってスクリーニングし、AAVS1遺伝子座におけるインデル形成についてNGSによって分析した。表23は、トランスフェクトされたT細胞において各AAVS1標的化スペーサー配列と共に生成されたインデルのパーセンテージを示し、いくつかの配列(A1、D1、E1、G1、B2、D2、G2、D3、F3、及びC4)が、MG3-6を有するAAVS1遺伝子座において中頻度~高頻度を有するインデルを生成することを実証している。
TIGIT遺伝子座標的化
本発明者らは、本発明者らのエンドヌクレアーゼ/ガイドの組合せを用いてT細胞におけるTCR発現を効果的にノックアウトすることができることを実証したことで、本発明者らは次に、T細胞におけるTIGIT遺伝子座を標的とすることができるかどうかを求めた。本発明者らはMG3-6に適切なスペーサーを設計したが、今回はTIGIT遺伝子座の配列を標的とした(以下の表24参照)。配列を、126pmolのMG3-6タンパク質及び160pmolのガイドを用いて上記のように初代T細胞へのヌクレオフェクションによってスクリーニングし、上記のようにNGSによって分析した。表24は、トランスフェクトされたT細胞における各TIGIT標的化スペーサー配列と共に生成されたインデルのパーセンテージを示し、いくつかの配列(C1、G1、H1、D3)がMG3-6との高いインデル生成活性を有することを実証している。ゲノムDNAを3日後に採取し、NGSによって分析した(以下の表24参照)。
実施例23-本明細書に記載のシステムを用いたNK細胞編集
CAR発現と組み合わせたTCRアブレーション
本発明者らは、T細胞におけるTCR発現を効率的にノックアウトすることができることを観察したことで、本発明者らは次に、NK細胞におけるTRACを編集することができるかどうか、例えば、TRACホモロジーアームを有するCARの導入と同時にTCRを破壊して、同種異系CAR-NK細胞を作製することができるかどうかを求めた(スキームの例については図66を参照されたい)。したがって、本発明者らはCloudz Human NK cell Expansion Kitを用いてNK細胞を培養した。NK細胞を、104pmolのMG3-6タンパク質及び180pmolのガイドRNA(TRAC標的化MG3-6ガイド6、配列番号5955を有する高性能MG3-6酵素の使用)を含むRautelaらのマンニトール含有緩衝液(参照により本明細書に組み込まれる、https://doi.org/10.1101/406934を参照)を用いて、Lonza4Dシステムでトランスフェクトし、続いて、TRACホモロジーアームを有するCAR配列を担持するAAV#3029を有する300KMOIを用いて感染させた。ゲノムDNAを回収5日後に細胞から採取し、NGSによって分析した。同時に、NK細胞マーカーCD56に対する抗体と並行してビオチン化BCMAタンパク質を用いるフローサイトメトリによってCAR発現をアッセイした。結果を図67(TRACインデル形成を示す)及び図68(x軸上のCD56発現、及びy軸上のCAR発現についてのフローサイトメトリを示す)に提示する。結果は、CAR発現と一緒のMG3-6/ガイドRNAの組合せがCAR陽性NK細胞の生成に有効であったことを実証している。
CD38標的化
次いで、NK細胞中のCD38遺伝子を標的とするようにMG3-6(表24)及びMG3-8(表25)用に設計されたスペーサー配列を用いて、初代NK細胞においてCD38ガイドスクリーニングを行った。結果を表24及び表25の配列と共に提示し、いくつかの配列(MG3-6についてはA1、B1、H1、B2、C4、E4、F4、B5、D5、及びMG3-8についてはC1)が、それらのそれぞれのエンドヌクレアーゼと共に細胞へと導入された場合に、CD38遺伝子座においてインデルを生成するための中~高い活性を有することを実証している。
実施例23-本明細書に記載のシステムを用いる造血幹細胞における遺伝子編集
造血幹細胞(Hematopoietic stem cell:HSC)の編集のために、HSCをAllcellsの説明書に従って37で解凍し、DMEM+10%FBSで洗浄し、StemspanII培地及びCC110サイトカインに再懸濁した。Lonza4Dエレクトロポレータ及び溶液P3を用いて200K細胞をヌクレオフェクトした。ゲノムDNAをトランスフェクションの3日後に採取し、NGSによって分析した(図70を参照されたい)。MG3-6を、TRACガイド5(配列番号5954)及びTRACガイド6(配列番号5955)で試験した。MG3-8を、TRACガイド2(配列番号5960)及びTRACガイド5(配列番号5963)で試験した。
実施例24.-本明細書に記載のシステムを用いたB細胞における遺伝子編集
B細胞編集のために、104pmolのMG3-6タンパク質及び180pmolのガイドを含む緩衝液P3又は緩衝液#2(Rautelaら、「Efficient genome editing of human natural killer cells by CRISPR RNP」(2021年)(https://doi.org/10.1101/406934で利用可能)に記載されるマンニトール含有緩衝液)を用いて、Lonza4DシステムによりB細胞をトランスフェクトした。ゲノムDNAをトランスフェクションの3日後に採取し、NGSによって分析した(図71を参照されたい)。MG3-6をTRACガイド6(配列番号5955)で試験した。
実施例25.-MG48ファミリーメンバーの性質決定
転写/翻訳のための鋳型DNA
MG48-1(タンパク質配列番号5769)及びMG48-3(タンパク質配列番号5771)の大腸菌(E.coli)コドン最適化配列を、T7プロモーターを用いて順序づけた(Twist Biosciences)。線状鋳型を、T7及びヌクレアーゼ配列を含むようにPCRによってプラスミドから増幅した。最小アレイ線状鋳型を、T7プロモーター、天然リピート、本発明者らのプラスミドライブラリーを標的化するユニバーサルスペーサー、天然リピート、増幅のためのアダプタ配列に隣接する配列から増幅した。ORF又はCRISPRアレイの近くの3つの遺伝子間配列をメタゲノムコンティグから同定し、増幅のために隣接するアダプタ配列を有するgBlockとして順序付けた(Integrated DNA Technologies)。
転写/翻訳及び切断反応
MG48-1及びMG48-3ヌクレアーゼ、遺伝子間配列、及び最小アレイを、myTXTL(登録商標)Sigma 70 Master Mix Kit(Arbor Biosciences)を用いて転写-翻訳反応混合物中で発現させた。最終反応混合物は、5nMのヌクレアーゼDNA鋳型、12nMの遺伝子間DNA鋳型、15nMの最小アレイDNA鋳型、0.1nMのpTXTL-P70a-T7rnap、及び1XのmyTXTL(登録商標)Sigma 70 Master Mixを含有した。反応物を29℃で16時間インキュベートし、次いで4℃で保存した。
5nMの標的ライブラリー、TXTL発現物の5倍希釈物、10nMのTris-HCl、10nMのMgCl2、及び100mMのNaClを、37℃で2時間混合することによって、プラスミドライブラリーDNA切断反応を行った。反応を停止させ、SPRIselectビーズ(BeckmanCoulter,Inc.)で洗浄し、Tris EDTA pH8.0緩衝液に溶出した。1.5nMの切断産物を、150nMアダプタ、1×T4リガーゼ緩衝液(New England Biolabs)、20U/μL T4 DNAリガーゼ(New England Biolabs)を用いて、室温で20分間ライゲーションした。ライゲーションした産物を、NGSプライマを用いたPCRによって増幅し、NGSによってシーケンシングしてPAMを得た。この実験の結果は、NGSから得られたMG48-1(パネルA、配列番号5855)及びMG48-3(パネルB、配列番号5856)についてのコンセンサスPAM配列を示す図72に示される。
転写/翻訳からの遺伝子間濃縮のRNAseqライブラリー調製
RNAを、Quick-RNA(商標)Miniprep Kit(Zymo Research)に従ってTXTL発現から抽出し、50μLの水に溶出した。転写物の総濃度をNanodrop及びTapestationで測定した。
各試料からの100ngの総RNAを、RealSeq-AC miRNA Library Kit(Somagenics)を用いてRNAシーケンシングのために準備した。162~163bpの間のアンプリコンをTapestationで定量化し、20nMの最終濃度までプールした。6pMの最終濃度をNano Miseq V2キットにロードし、Miseqシステム(Illumina)でシーケンシングした。RNAseqリードを使用して、遺伝子(シーケンシングされたtracr領域が強調表示されたRNAseqマッピングを例示する、図73を参照)のtracr配列(MG48-1については配列番号5886及びMG48-3については配列番号5893)を同定した。tracr配列を用いて、本発明者らは、HiScribe T7キット(New England Biolabs)を用いてdsDNA鋳型からインビトロ転写された、sgRNA(MG48-1については配列番号5888及びMG48-3については配列番号5895)を設計した。sgRNAを、活性を検証するために上記の実施例と同じプロトコルを用いてインビトロで試験し、機能的であると検証した。
実施形態
以下の実施形態は、本質的に例示的なものであり、いかなる方法でも限定することを意図するものではない。
1.操作されたヌクレアーゼシステムであって、
(a)RuvC_IIIドメイン及びHNHドメインを含むエンドヌクレアーゼであって、当該エンドヌクレアーゼが未培養微生物に由来し、当該エンドヌクレアーゼがクラス2タイプIICasエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
(ii)当該エンドヌクレアーゼへと結合するように構成されたtracrリボ核酸配列を含む、操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
2.当該RuvC_IIIドメインが、配列番号1827~3637のいずれか1つに対して、少なくとも70%、少なくとも75%、少なくとも80%、又は少なくとも90%の配列同一性を有する配列を含む、実施形態1に記載の操作されたヌクレアーゼシステム。
3.操作されたヌクレアーゼシステムであって、
(a)配列番号1827~3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと、
(b)当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
(ii)当該エンドヌクレアーゼへと結合するように構成されたtracrリボ核酸配列を含む、操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
4.操作されたヌクレアーゼシステムであって、
(a)配列番号5512~5537を含むプロトスペーサー隣接モチーフ(PAM)配列へと結合するように構成されたエンドヌクレアーゼであって、当該エンドヌクレアーゼがクラス2タイプIICasエンドヌクレアーゼである、エンドヌクレアーゼと、
(b)当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
(ii)当該エンドヌクレアーゼへと結合するように構成されたtracrリボ核酸配列を含む、操作されたガイドリボ核酸構造と、
を含む、操作されたヌクレアーゼシステム。
5.当該エンドヌクレアーゼが、未培養微生物に由来する、実施形態2に記載の操作されたヌクレアーゼシステム。
6.当該エンドヌクレアーゼが、異なるPAM配列に結合するように操作されていない、実施形態2~3のいずれか一項に記載の操作されたヌクレアーゼシステム。
7.当該エンドヌクレアーゼが、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない、実施形態2に記載の操作されたヌクレアーゼシステム。
8.当該エンドヌクレアーゼが、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する、実施形態2に記載の操作されたヌクレアーゼシステム。
9.当該エンドヌクレアーゼが、HNHドメインを更に含む、実施形態1~6のいずれか一項に記載の操作されたヌクレアーゼシステム。
10.当該tracrリボ核酸配列が、配列番号5476~5511及び配列番号5538のいずれか1つから選択される約60~90個の連続するヌクレオチドに対して、少なくとも80%の配列同一性を有する配列を含む、実施形態1~9のいずれか一項に記載の操作されたヌクレアーゼシステム。
11.操作されたヌクレアーゼシステムであって、
(a)操作されたガイドリボ核酸構造であって、
(i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
(ii)当該エンドヌクレアーゼへと結合するように構成されたtracrリボ核酸配列を含み、
ここで、当該tracrリボ核酸配列は、配列番号5476~5511及び配列番号5538のいずれか1つから選択される約60~90個の連続するヌクレオチドに対して、少なくとも80%の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造と、
(b)当該操作されたガイドリボ核酸へと結合するように構成されたクラス2タイプIICasエンドヌクレアーゼと、
を含む、操作されたヌクレアーゼシステム。
12.当該エンドヌクレアーゼが、配列番号5512~5537を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列へと結合するように構成されている、実施形態1~1又は8のいずれか一項に記載の操作されたヌクレアーゼシステム。
13.当該操作されたガイドリボ核酸構造が、少なくとも2つのリボ核酸ポリヌクレオチドを含む、実施形態1~8のいずれか一項に記載の操作されたヌクレアーゼシステム。
14.当該操作されたガイドリボ核酸構造が、当該ガイドリボ核酸配列及び当該tracrリボ核酸配列を含む1つのリボ核酸ポリヌクレオチドを含む、実施形態1~8のいずれか一項に記載の操作されたヌクレアーゼシステム。
15.当該ガイドリボ核酸配列が、原核生物、細菌、古細菌、真核生物、真菌、植物、哺乳動物、又はヒトのゲノム配列に相補的である、実施形態1~14のいずれか一項に記載の操作されたヌクレアーゼシステム。
16.当該ガイドリボ核酸配列が、15~24ヌクレオチド長である、実施形態1~15のいずれか一項に記載の操作されたヌクレアーゼシステム。
17.当該エンドヌクレアーゼが、当該エンドヌクレアーゼのN末端又はC末端に近接した1つ以上の核局在化配列(NLS)を含む、実施形態1~10のいずれか一項に記載の操作されたヌクレアーゼシステム。
18.当該NLSが、配列番号5597~5612から選択される配列を含む、実施形態1~11のいずれか一項に記載の操作されたヌクレアーゼシステム。
19.
システムは、5’から3’に向かって、当該標的デオキシリボ核酸配列に対して5’で少なくとも20ヌクレオチドの配列を含む第1のホモロジーアームに対して、少なくとも10ヌクレオチドの合成DNA配列と、当該標的配列に対して3’で少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームと、を含む、一本鎖又は二本鎖DNA修復鋳型を更に含む、実施形態1~12のいずれか一項に記載の操作されたヌクレアーゼシステム。
20.当該第1のホモロジーアーム又は第2のホモロジーアームが、少なくとも40、80、120、150、200、300、500、又は1,000ヌクレオチドの配列を含む、実施形態13に記載の操作されたヌクレアーゼシステム。
21.当該システムが、Mg2+の供給源を更に含む、実施形態1~14のいずれか一項に記載の操作されたヌクレアーゼシステム。
22.当該エンドヌクレアーゼ及び当該tracrリボ核酸配列が、同じ門内の異なる細菌種に由来する、実施形態1~21のいずれか一項に記載の操作されたヌクレアーゼシステム。
23.当該エンドヌクレアーゼが、デルマバクター(Dermabacter)属に属する細菌に由来する、実施形態1~22のいずれか一項に記載の操作されたヌクレアーゼシステム。
24.当該エンドヌクレアーゼが、ウェルコミクロビウム(Verrucomicrobia)門、カンディダートゥス・ペレグリニバクテリア(Candidatus Peregrinibacteria)門、又はカンディダートゥス・メライナバクテリア(Candidatus Melainabacteria)門に属する細菌に由来する、実施形態1~22のいずれか一項に記載の操作されたヌクレアーゼシステム。
25.当該エンドヌクレアーゼが、配列番号5592~5595のいずれか1つに対して少なくとも90%の同一性を有する16S rRNA遺伝子を含む細菌に由来する、実施形態1~22のいずれか一項に記載の操作されたヌクレアーゼシステム。
26.当該HNHドメインが、配列番号3638~3955のいずれか1つに対して少なくとも70%又は少なくとも80%の同一性を有する配列を含む、実施形態1~25のいずれか一項に記載の操作されたヌクレアーゼシステム。
27.当該エンドヌクレアーゼが、配列番号1~1826、又はそれに対して少なくとも55%の同一性を有するそのバリアントを含む、実施形態1~26のいずれか一項に記載の操作されたヌクレアーゼシステム。
28.当該エンドヌクレアーゼが、配列番号1827~1830又は配列番号1827~2140からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
29.当該エンドヌクレアーゼが、配列番号3638~3641又は配列番号3638~3954からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~28のいずれか一項に記載の操作されたヌクレアーゼシステム。
30.当該エンドヌクレアーゼが、配列番号5615~5632からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~29のいずれか一項に記載の操作されたヌクレアーゼシステム。
31.当該エンドヌクレアーゼが、配列番号1~4又は配列番号1~319からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~30のいずれか一項に記載の操作されたヌクレアーゼシステム。
32.当該ガイドRNA構造が、配列番号5461~5464、配列番号5476~5479、又は配列番号5476~5489からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~31のいずれか一項に記載の操作されたヌクレアーゼシステム。
33.当該ガイドRNA構造が、ステム及びループからなるヘアピンを含むと予測されるRNA配列を含み、当該ステムが、少なくとも10、少なくとも12、又は少なくとも14塩基対のリボヌクレオチドと、当該ループの4塩基対以内の非対称バルジと、を含む、実施形態1~32のいずれか一項に記載の操作されたヌクレアーゼシステム。
34.当該エンドヌクレアーゼが、配列番号5512~5515又は配列番号5527~5530からなる群から選択される配列を含む、PAMに結合するように構成されている、実施形態1~33のいずれか一項に記載の操作されたヌクレアーゼシステム。
35.
a)当該エンドヌクレアーゼが、配列番号1827に対して少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5461又は配列番号5476の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5512又は配列番号5527を含むPAMへと結合するように構成されている、
実施形態1~34のいずれか一項に記載の操作されたヌクレアーゼシステム。
36.
a)当該エンドヌクレアーゼが、配列番号1828に対して少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5462又は配列番号5477の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5513又は配列番号5528を含むPAMへと結合するように構成されている、
実施形態1~34のいずれか一項に記載の操作されたヌクレアーゼシステム。
37.
a)当該エンドヌクレアーゼが、配列番号1829に対して少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5463又は配列番号5478の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5514又は配列番号5529を含むPAMへと結合するように構成されている、
実施形態1~34のいずれか一項に記載の操作されたヌクレアーゼシステム。
38.
a)当該エンドヌクレアーゼが、配列番号1830に対して少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5464又は配列番号5479の少なくとも1つに対して、少なくとも70%、少なくとも80%、又は少なくとも90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5515又は配列番号5530を含むPAMへと結合するように構成されている、
実施形態1~34のいずれか一項に記載の操作されたヌクレアーゼシステム。
39.当該エンドヌクレアーゼが、配列番号2141~2142又は配列番号2141~2241からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
40.当該エンドヌクレアーゼが、配列番号3955~3956又は配列番号3955~4055からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態39のいずれか一項に記載の操作されたヌクレアーゼシステム。
41.当該エンドヌクレアーゼが、配列番号5632~5638からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態39~40のいずれか一項に記載の操作されたヌクレアーゼシステム。
42.当該エンドヌクレアーゼが、配列番号320~321又は配列番号320~420からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態39~41のいずれか一項に記載の操作されたヌクレアーゼシステム。
43.当該ガイドRNA構造が、配列番号5465、配列番号5490~5491、又は配列番号5490~5494からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態39~42のいずれか一項に記載の操作されたヌクレアーゼシステム。
44.当該ガイドRNA構造が、少なくとも8、少なくとも10、又は少なくとも12塩基対のリボヌクレオチドを含むヘアピンを含む、tracrリボ核酸配列を含む、実施形態1~27又は実施形態39~43のいずれか一項に記載の操作されたヌクレアーゼシステム。
45.当該エンドヌクレアーゼが、配列番号5516及び配列番号5531からなる群から選択される配列を含む、PAMに結合するように構成されている、実施形態1~27又は実施形態39~44のいずれか一項に記載の操作されたヌクレアーゼシステム。
46.
a)当該エンドヌクレアーゼが、配列番号2141に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5490に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5531を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態39~45のいずれか一項に記載の操作されたヌクレアーゼシステム。
47.
a)当該エンドヌクレアーゼが、配列番号2142に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5465又は配列番号5491に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5516を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態39~45のいずれか一項に記載の操作されたヌクレアーゼシステム。
48.当該エンドヌクレアーゼが、配列番号2245~2246からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
49.当該エンドヌクレアーゼが、配列番号4059~4060からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態48のいずれか一項に記載の操作されたヌクレアーゼシステム。
50.当該エンドヌクレアーゼが、配列番号5639~5648からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態48~49のいずれか一項に記載の操作されたヌクレアーゼシステム。
51.当該エンドヌクレアーゼが、配列番号424~425からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態48~50のいずれか一項に記載の操作されたヌクレアーゼシステム。
52.当該ガイドRNA構造が、配列番号5498~5499及び配列番号5539からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態48~51のいずれか一項に記載の操作されたヌクレアーゼシステム。
53.当該ガイドRNA構造が、ガイドリボ核酸配列の少なくとも8ヌクレオチド及びtracrリボ核酸配列の少なくとも8ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、当該tracrリボ核酸配列が、5’から3’に向かって、第1のヘアピン及び第2のヘアピンを含み、当該第1のヘアピンが、当該第2のヘアピンよりも長いステムを有する、実施形態1~27又は実施形態48~52のいずれか一項に記載の操作されたヌクレアーゼシステム。
54.当該エンドヌクレアーゼが、配列番号2242~2244又は配列番号2247~2249からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
55.当該エンドヌクレアーゼが、配列番号4056~4058及び配列番号4061~4063からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態54のいずれか一項に記載の操作されたヌクレアーゼシステム。
56.当該エンドヌクレアーゼが、配列番号5639~5648からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態54~55のいずれか一項に記載の操作されたヌクレアーゼシステム。
57.当該エンドヌクレアーゼが、配列番号421~423又は配列番号426~428からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態54~56のいずれか一項に記載の操作されたヌクレアーゼシステム。
58.当該ガイドRNA構造が、配列番号5466~5467、配列番号5495~5497、配列番号5500~5502、及び配列番号5539からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態54~57のいずれか一項に記載の操作されたヌクレアーゼシステム。
59.当該ガイドRNA構造が、ガイドリボ核酸配列の少なくとも8ヌクレオチド及びtracrリボ核酸配列の少なくとも8ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、当該tracrリボ核酸配列が、5’から3’に向かって、第1のヘアピン及び第2のヘアピンを含み、当該第1のヘアピンが、当該第2のヘアピンよりも長いステムを有する、実施形態1~27又は実施形態54~58のいずれか一項に記載の操作されたヌクレアーゼシステム。
60.当該エンドヌクレアーゼが、配列番号5517~5518又は配列番号5532~5534からなる群から選択される配列を含む、PAMに結合するように構成されている、実施形態1~27又は実施形態54~59のいずれか一項に記載の操作されたヌクレアーゼシステム。
61.
a)当該エンドヌクレアーゼが、配列番号2247に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5500に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5517又は配列番号5532を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態54~60のいずれか一項に記載の操作されたヌクレアーゼシステム。
62.
a)当該エンドヌクレアーゼが、配列番号2248に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5501に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5518又は配列番号5533を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態54~60のいずれか一項に記載の操作されたヌクレアーゼシステム。
63.
a)当該エンドヌクレアーゼが、配列番号2249に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5502に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5534を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態54~60のいずれか一項に記載の操作されたヌクレアーゼシステム。
64.当該エンドヌクレアーゼが、配列番号2253又は配列番号2253~2481からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
65.当該エンドヌクレアーゼが、配列番号4067又は配列番号4067~4295からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態64のいずれか一項に記載の操作されたヌクレアーゼシステム。
66.当該エンドヌクレアーゼが、配列番号5649によるペプチドモチーフを含む、実施形態1~27又は実施形態64~65のいずれか一項に記載の操作されたヌクレアーゼシステム。
67.当該エンドヌクレアーゼが、配列番号432又は配列番号432~660からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態64~66のいずれか一項に記載の操作されたヌクレアーゼシステム。
68.当該ガイドRNA構造が、配列番号5468又は配列番号5503からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態64~67のいずれか一項に記載の操作されたヌクレアーゼシステム。
69.当該エンドヌクレアーゼが、配列番号5519からなる群から選択される配列を含む、PAMに結合するように構成されている、実施形態1~27又は実施形態64~68のいずれか一項に記載の操作されたヌクレアーゼシステム。
70.
a)当該エンドヌクレアーゼが、配列番号2253に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5468又は配列番号5503に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5519を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態64~69のいずれか一項に記載の操作されたヌクレアーゼシステム。
71.当該エンドヌクレアーゼが、配列番号2482~2489からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
72.当該エンドヌクレアーゼが、配列番号4296~4303からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態71のいずれか一項に記載の操作されたヌクレアーゼシステム。
73.当該エンドヌクレアーゼが、配列番号661~668からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態71~72のいずれか一項に記載の操作されたヌクレアーゼシステム。
74.当該エンドヌクレアーゼが、配列番号2490~2498からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
75.当該エンドヌクレアーゼが、配列番号4304~4312からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態74のいずれか一項に記載の操作されたヌクレアーゼシステム。
76.当該エンドヌクレアーゼが、配列番号669~677からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態74~75のいずれか一項に記載の操作されたヌクレアーゼシステム。
77.当該ガイドRNA構造が、配列番号5504からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態74~76のいずれか一項に記載の操作されたヌクレアーゼシステム。
78.当該エンドヌクレアーゼが、配列番号2499又は配列番号2499~2750からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
79.当該エンドヌクレアーゼが、配列番号4313又は配列番号4313~4564からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態78のいずれか一項に記載の操作されたヌクレアーゼシステム。
80.当該エンドヌクレアーゼが、配列番号5650~5667からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態78~79のいずれか一項に記載の操作されたヌクレアーゼシステム。
81.当該エンドヌクレアーゼが、配列番号678又は配列番号678~929からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態78~80のいずれか一項に記載の操作されたヌクレアーゼシステム。
82.当該ガイドRNA構造が、配列番号5469又は配列番号5505に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態78~81のいずれか一項に記載の操作されたヌクレアーゼシステム。
83.当該エンドヌクレアーゼが、配列番号5520又は配列番号5535を含むPAMに結合するように構成されている、実施形態1~27又は実施形態78~82のいずれか一項に記載の操作されたヌクレアーゼシステム。
84.
a)当該エンドヌクレアーゼが、配列番号2499に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5469又は配列番号5505に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5520又は配列番号5535を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態78~82のいずれか一項に記載の操作されたヌクレアーゼシステム。
85.当該エンドヌクレアーゼが、配列番号2751又は配列番号2751~2913からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
86.当該エンドヌクレアーゼが、配列番号4565又は配列番号4565~4727からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態85のいずれか一項に記載の操作されたヌクレアーゼシステム。
87.当該エンドヌクレアーゼが、配列番号5668~5678からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態85~86のいずれか一項に記載の操作されたヌクレアーゼシステム。
88.当該エンドヌクレアーゼが、配列番号930又は配列番号930~1092からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態85~87のいずれか一項に記載の操作されたヌクレアーゼシステム。
89.当該ガイドRNA構造が、配列番号5470又は配列番号5506に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態85~88のいずれか一項に記載の操作されたヌクレアーゼシステム。
90.当該エンドヌクレアーゼが、配列番号5521又は配列番号5536からなる群から選択される配列を含む、PAMに結合するように構成されている、実施形態1~27又は実施形態85~89のいずれか一項に記載の操作されたヌクレアーゼシステム。
91.
a)当該エンドヌクレアーゼが、配列番号2751に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5470又は配列番号5506に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5521又は配列番号5536を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態85~90のいずれか一項に記載の操作されたヌクレアーゼシステム。
92.当該エンドヌクレアーゼが、配列番号2914又は配列番号2914~3174からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
93.当該エンドヌクレアーゼが、配列番号4728又は配列番号4728~4988からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態92のいずれか一項に記載の操作されたヌクレアーゼシステム。
94.当該エンドヌクレアーゼが、配列番号5676~5678からなる群から選択される少なくとも1個、少なくとも2個、又は少なくとも3個のペプチドモチーフを含む、実施形態1~27又は実施形態92~93のいずれか一項に記載の操作されたヌクレアーゼシステム。
95.当該エンドヌクレアーゼが、配列番号1093又は配列番号1093~1353からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態92~94のいずれか一項に記載の操作されたヌクレアーゼシステム。
96.当該ガイドRNA構造が、配列番号5471、配列番号5507及び配列番号5540~5542からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態92~95のいずれか一項に記載の操作されたヌクレアーゼシステム。
97.当該ガイドRNA構造が、5塩基対未満のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予測される、tracrリボ核酸配列を含む、実施形態1~27又は実施形態92~96のいずれか一項に記載の操作されたヌクレアーゼシステム。
98.当該エンドヌクレアーゼが、配列番号5522を含むPAMに結合するように構成されている、実施形態1~27又は実施形態92~97のいずれか一項に記載の操作されたヌクレアーゼシステム。
99.
a)当該エンドヌクレアーゼが、配列番号2914に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5471又は配列番号5507に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5522を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態92~98のいずれか一項に記載の操作されたヌクレアーゼシステム。
100.当該エンドヌクレアーゼが、配列番号3175又は配列番号3175~3330からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
101.当該エンドヌクレアーゼが、配列番号4989又は配列番号4989~5146からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態100のいずれか一項に記載の操作されたヌクレアーゼシステム。
102.当該エンドヌクレアーゼが、配列番号5679~5686からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態100~101のいずれか一項に記載の操作されたヌクレアーゼシステム。
103.当該エンドヌクレアーゼが、配列番号1354又は配列番号1354~1511からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態100~102のいずれか一項に記載の操作されたヌクレアーゼシステム。
104.当該ガイドRNA構造が、配列番号5472又は配列番号5508からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態100~103のいずれか一項に記載の操作されたヌクレアーゼシステム。
105.当該エンドヌクレアーゼが、配列番号5523又は配列番号5537からなる群から選択される配列を含む、PAMに結合するように構成されている、実施形態1~27又は実施形態100~104のいずれか一項に記載の操作されたヌクレアーゼシステム。
106.
a)当該エンドヌクレアーゼが、配列番号3175に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5472又は配列番号5508に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5523又は配列番号5537を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態100~105のいずれか一項に記載の操作されたヌクレアーゼシステム。
107.当該エンドヌクレアーゼが、配列番号3331又は配列番号3331~3474からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
108.当該エンドヌクレアーゼが、配列番号5147又は配列番号5147~5290からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態107のいずれか一項に記載の操作されたヌクレアーゼシステム。
109.当該エンドヌクレアーゼが、配列番号5674~5675及び配列番号5687~5693からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態107~108のいずれか一項に記載の操作されたヌクレアーゼシステム。
110.当該エンドヌクレアーゼが、配列番号1512又は配列番号1512~1655からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態107~109のいずれか一項に記載の操作されたヌクレアーゼシステム。
111.当該ガイドRNA構造が、配列番号5473又は配列番号5509からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態107~110のいずれか一項に記載の操作されたヌクレアーゼシステム。
112.当該エンドヌクレアーゼが、配列番号5524を含むPAMに結合するように構成されている、実施形態1~27又は実施形態107~111のいずれか一項に記載の操作されたヌクレアーゼシステム。
113.
a)当該エンドヌクレアーゼが、配列番号3331に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5473又は配列番号5509に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5524を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態107~112のいずれか一項に記載の操作されたヌクレアーゼシステム。
114.当該エンドヌクレアーゼが、配列番号3475又は配列番号3475~3568からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
115.当該エンドヌクレアーゼが、配列番号5291又は配列番号5291~5389からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態114のいずれか一項に記載の操作されたヌクレアーゼシステム。
116.当該エンドヌクレアーゼが、配列番号5694~5699からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態114~115のいずれか一項に記載の操作されたヌクレアーゼシステム。
117.当該エンドヌクレアーゼが、配列番号1656又は配列番号1656~1755からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態114~116のいずれか一項に記載の操作されたヌクレアーゼシステム。
118.当該ガイドRNA構造が、配列番号5474又は配列番号5510に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態114~117のいずれか一項に記載の操作されたヌクレアーゼシステム。
119.当該エンドヌクレアーゼが、配列番号5525を含むPAMに結合するように構成されている、実施形態1~27又は実施形態114~118のいずれか一項に記載の操作されたヌクレアーゼシステム。
120.
a)当該エンドヌクレアーゼが、配列番号3475に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5474又は配列番号5510に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5525を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態114~119のいずれか一項に記載の操作されたヌクレアーゼシステム。
121.当該エンドヌクレアーゼが、配列番号3569又は配列番号3569~3637からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27のいずれか一項に記載の操作されたヌクレアーゼシステム。
122.当該エンドヌクレアーゼが、配列番号5390又は配列番号5390~5460からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態121のいずれか一項に記載の操作されたヌクレアーゼシステム。
123.当該エンドヌクレアーゼが、配列番号5700~5717からなる群から選択される少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、又は少なくとも5個のペプチドモチーフを含む、実施形態1~27又は実施形態121~122のいずれか一項に記載の操作されたヌクレアーゼシステム。
124.当該エンドヌクレアーゼが、配列番号1756又は配列番号1756~1826からなる群から選択される配列に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態121~123のいずれか一項に記載の操作されたヌクレアーゼシステム。
125.当該ガイドRNA構造が、配列番号5475又は配列番号5511に対して、少なくとも70%、80%、又は90%同一の配列を含む、実施形態1~27又は実施形態121~124のいずれか一項に記載の操作されたヌクレアーゼシステム。
126.当該エンドヌクレアーゼが、配列番号5526を含むPAMに結合するように構成されている、実施形態1~27又は実施形態121~125のいずれか一項に記載の操作されたヌクレアーゼシステム。
127.
a)当該エンドヌクレアーゼが、配列番号3569に対して少なくとも70%、80%、又は90%同一の配列を含み、
b)当該ガイドRNA構造が、配列番号5475又は配列番号5511に対して少なくとも70%、80%、又は90%同一の配列を含み、かつ
c)当該エンドヌクレアーゼが、配列番号5526を含むPAMへと結合するように構成されている、
実施形態1~27又は実施形態121~126のいずれか一項に記載の操作されたヌクレアーゼシステム。
128.当該配列同一性が、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はSmith-Waterman相同性検索アルゴリズムによって決定される、請求項1~127のいずれか一項に記載の操作されたヌクレアーゼシステム。
129.当該配列同一性が、3のワード長(W)、10の期待値(E)のパラメータ、及び11の存在、1の拡張でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、並びに条件付き組成スコアマトリックス調整を用いて、当該BLASTP相同性検索アルゴリズムによって決定される、実施形態15に記載の操作されたヌクレアーゼシステム。
130.操作されたガイドリボ核酸ポリヌクレオチドであって、
a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含む、DNA標的化セグメントと、
b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的ストレッチを含む、タンパク質結合セグメントであって、
当該ヌクレオチドの2つの相補的なストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、
当該操作されたガイドリボ核酸ポリヌクレオチドは、配列番号1827~3637のいずれか1つに対して少なくとも75%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼと複合体を形成し、かつ当該標的DNA分子の当該標的配列に当該複合体を標的化するように構成される、タンパク質結合セグメントと、
を含む、操作されたガイドリボ核酸ポリヌクレオチド。
131.当該DNA標的化セグメントが、当該ヌクレオチドの2つの相補的なストレッチの両方の5’側に位置する、実施形態17に記載の操作されたガイドリボ核酸ポリヌクレオチド。
132.
a)当該タンパク質結合セグメントが、配列番号5476~5479又は配列番号5476~5489からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
b)当該タンパク質結合セグメントが、(配列番号5490~5491又は配列番号5490~5494)及び配列番号5538からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
c)当該タンパク質結合セグメントが、配列番号5498~5499からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
d)当該タンパク質結合セグメントが、配列番号5495~5497及び配列番号5500~5502からなる群から選択される配列に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
e)当該タンパク質結合セグメントが、配列番号5503に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
f)当該タンパク質結合セグメントが、配列番号5504に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
g)当該タンパク質結合セグメントが、配列番号5505に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
h)タンパク質結合セグメントが、配列番号5506に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
i)タンパク質結合セグメントが、配列番号5507に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
j)当該タンパク質結合セグメントが、配列番号5508に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
k)当該タンパク質結合セグメントが、配列番号5509に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、
l)当該タンパク質結合セグメントが、配列番号5510に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含み、又は
m)当該タンパク質結合セグメントが、配列番号5511に対して、少なくとも70%、少なくとも80%、又は少なくとも90%の同一性を有する配列を含む、
実施形態17~18のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチド。
133.
a)当該ガイドリボ核酸ポリヌクレオチドは、ステム及びループを含むヘアピンを含むRNA配列を含み、当該ステムが、少なくとも10、少なくとも12、又は少なくとも14塩基対のリボヌクレオチドと、ループの4塩基対以内の非対称バルジと、を含み、
b)当該ガイドリボ核酸ポリヌクレオチドが、少なくとも8、少なくとも10、又は少なくとも12塩基対のリボヌクレオチドを含むヘアピンを含むと予測される、tracrリボ核酸配列を含み、
c)当該ガイドリボ核酸ポリヌクレオチドが、ガイドリボ核酸配列の少なくとも8ヌクレオチド及びtracrリボ核酸配列の少なくとも8ヌクレオチドを含む中断されていない塩基対領域を有するヘアピンを含むと予測されるガイドリボ核酸配列を含み、当該tracrリボ核酸配列が、5’から3’に向かって、第1のヘアピン及び第2のヘアピンを含み、当該第1のヘアピンが、当該第2のヘアピンよりも長いステムを有し、又は
d)当該ガイドリボ核酸ポリヌクレオチドが、5塩基対未満のリボヌクレオチドを含む少なくとも2つのヘアピンを含むと予測される、tracrリボ核酸配列を含む、
実施形態17~132のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチド。
134.実施形態17~133のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチドをコードする、デオキシリボ核酸ポリヌクレオチド。
135.生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸は、RuvC_IIIドメイン及びHNHドメインを含むクラス2タイプIICasエンドヌクレアーゼをコードし、当該エンドヌクレアーゼは、未培養微生物に由来する、核酸。
136.生物における発現のために最適化された操作核酸配列を含む核酸であって、当該核酸は、配列番号1827~3637のいずれか1つに対して少なくとも70%の配列同一性を有するRuvC_IIIドメインを含むエンドヌクレアーゼをコードする、核酸。
137.当該エンドヌクレアーゼが、配列番号3638~5460のいずれか1つに対して少なくとも70%又は少なくとも80%の配列同一性を有するHNHドメインを含む、実施形態135~20のいずれか一項に記載の核酸。
138.当該エンドヌクレアーゼが、配列番号5572~5591、又はそれに対して少なくとも70%の配列同一性を有するそのバリアントを含む、実施形態135~137のいずれか一項に記載の核酸。
139.当該エンドヌクレアーゼが、当該エンドヌクレアーゼのN末端又はC末端に近接する1つ以上の核局在化配列(NLS)をコードする配列を含む、実施形態135~138のいずれか一項に記載の核酸。
140.当該NLSが、配列番号5597~5612から選択される配列を含む、実施形態21に記載の核酸。
141.当該生物が、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである、実施形態135~22のいずれか一項に記載の核酸。
142.当該生物が、大腸菌(E.coli)であり、
a)当該核酸配列が、配列番号5572~5575からなる群から選択される配列に対して、少なくとも70%、80%又は90%の同一性を有し、
b)当該核酸配列が、配列番号5576~5577からなる群から選択される配列に対して、少なくとも70%、80%又は90%の同一性を有し、
c)当該核酸配列が、配列番号5578~5580からなる群から選択される配列に対して、少なくとも70%、80%又は90%の同一性を有し、
d)当該核酸配列が、配列番号5581に対して、少なくとも70%、80%、又は90%の同一性を有し、
e)当該核酸配列が、配列番号5582に対して、少なくとも70%、80%、又は90%の同一性を有し、
f)当該核酸配列が、配列番号5583に対して、少なくとも70%、80%、又は90%の同一性を有し、
g)当該核酸配列が、配列番号5584に対して、少なくとも70%、80%、又は90%の同一性を有し、
h)当該核酸配列が、配列番号5585に対して、少なくとも70%、80%、又は90%の同一性を有し、
i)当該核酸配列が、配列番号5586に対して、少なくとも70%、80%、又は90%の同一性を有し、又は
j)当該核酸配列が、配列番号5587に対して、少なくとも70%、80%、又は90%の同一性を有する、
実施形態23に記載の核酸。
143.当該生物が、ヒトであり、
a)当該核酸配列が、配列番号5588又は配列番号5589に対して、少なくとも70%、80%、又は90%の同一性を有し、又は
b)当該核酸配列が、配列番号5590又は配列番号5591に対して、少なくとも70%、80%、又は90%の同一性を有する、実施形態23に記載の核酸。
144.RuvC_IIIドメイン及びHNHドメインを含むクラス2タイプIICasエンドヌクレアーゼをコードする核酸配列を含むベクターであって、当該エンドヌクレアーゼが、未培養微生物に由来する、ベクター。
145.実施形態135~143のいずれかの核酸を含む、ベクター。
146.当該エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造をコードする核酸を更に含み、
a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたガイドリボ核酸配列、及び
b)当該エンドヌクレアーゼへと結合するように構成されたtracrリボ核酸配列と、
を含む、実施形態144~24のいずれか一項に記載のベクター。
147.ベクターが、プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、又はレンチウイルスである、実施形態144~25のいずれか一項に記載のベクター。
148.実施形態144~26のいずれか一項に記載のベクターを含む、細胞。
149.実施形態146に記載の当該細胞を培養することを含む、エンドヌクレアーゼを製造する方法。
150.二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、
(a)当該二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス2タイプIICasエンドヌクレアーゼと、当該エンドヌクレアーゼ及び当該二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において、接触させることと、
(b)当該二本鎖デオキシリボ核酸ポリヌクレオチドが、プロトスペーサー隣接モチーフ(PAM)を含み、
(c)当該PAMが、配列番号5512~5526又は配列番号5527~5537からなる群から選択される配列を含む、方法。
151.当該二本鎖デオキシリボ核酸ポリヌクレオチドが、当該操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖と、当該PAMを含む第2の鎖と、を含む、実施形態28に記載の方法。
152.当該PAMが、当該操作されたガイドリボ核酸構造の当該配列に相補的な当該配列の3’末端に直接隣接している、実施形態30に記載の方法。
153.当該クラス2タイプIICasエンドヌクレアーゼが、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない、実施形態28~31のいずれか一項に記載の方法。
154.当該クラス2タイプIICasエンドヌクレアーゼが、未培養微生物に由来する、実施形態28~32のいずれか一項に記載の方法。
155.当該二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、実施形態28~154のいずれか一項に記載の方法。
156.
a)当該PAMが、配列番号5512~5515及び配列番号5527~5530からなる群から選択される配列を含み、
b)当該PAMが、配列番号5516又は配列番号5531を含み、
c)当該PAMが、配列番号5539を含み、
d)当該PAMが、配列番号5517又は配列番号5518を含み、
e)当該PAMが、配列番号5519を含み、
f)当該PAMが、配列番号5520又は配列番号5535を含み、
g)当該PAMが、配列番号5521又は配列番号5536を含み、
h)当該PAMが、配列番号5522を含み、
i)当該PAMが、配列番号5523又は配列番号5537を含み、
j)当該PAMが、配列番号5524を含み、
k)当該PAMが、配列番号5525を含み、
l)当該PAMが、配列番号5526を含む、
実施形態28~33のいずれか一項に記載の方法。
157.標的核酸遺伝子座を修飾する方法であって、当該方法が、当該標的核酸遺伝子座へと、実施形態1~16のいずれか一項に記載の当該操作されたヌクレアーゼシステムを送達することを含み、ここで、当該エンドヌクレアーゼは、当該操作されたガイドリボ核酸構造と複合体を形成するように構成され、当該複合体は、当該複合体が当該標的核酸遺伝子座へと結合する際に当該複合体が当該標的核酸遺伝子座を修飾するように構成される、方法。
158.当該標的核酸遺伝子座を修飾することが、当該標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む、実施形態34に記載の方法。
159.当該標的核酸遺伝子座が、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む、実施形態34~35のいずれか一項に記載の方法。
160.当該標的核酸が、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含む、実施形態36に記載の方法。
161.当該標的核酸遺伝子座が、インビトロである、実施形態34~37のいずれか一項に記載の方法。
162.当該標的核酸遺伝子座が、細胞内にある、実施形態34~37のいずれか一項に記載の方法。
163.当該細胞が、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である、実施形態39に記載の方法。
164.当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座に送達することが、実施形態135~22のいずれかに記載の核酸、又は実施形態142~25のいずれかに記載のベクターを送達することを含む、実施形態39~40のいずれか一項に記載の方法。
165.当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、当該エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、実施形態39~40のいずれか一項に記載の方法。
166.当該核酸が、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームが動作可能に連結されているプロモーターを含む、実施形態41に記載の方法。
167.当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、当該エンドヌクレアーゼをコードする当該オープンリーディングフレームを含有する、キャップmRNAを送達することを含む、実施形態39~40のいずれか一項に記載の方法。
168.当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、翻訳されたポリペプチドを送達することを含む、実施形態39~40のいずれか一項に記載の方法。
169.当該操作されたヌクレアーゼシステムを当該標的核酸遺伝子座へと送達することが、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された当該操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む、請求項39~40のいずれか一項に記載の方法。
170.当該エンドヌクレアーゼが、当該標的遺伝子座で、又は当該標的遺伝子座に近接して、一本鎖切断又は二本鎖切断を誘導する、実施形態34~46のいずれか一項に記載の方法。
本発明の好ましい実施形態を本明細書に示し説明してきたが、そのような実施形態が例としてのみ提供されることは当業者には明らかであろう。本発明は、本明細書内で提供される特定の例によって限定されることを意図しない。本発明を前述の明細書を参照して説明してきたが、本明細書の実施形態の説明及び例示は、限定的な意味で解釈されることを意味しない。当業者には、本発明から逸脱することなく、多数のバリエーション、変更、及び置換が思い浮かぶであろう。更に、本発明の全ての態様は、様々な条件及び変数に依存する本明細書に記載の特定の描写、構成、又は相対的な割合に限定されないことを理解されたい。本明細書に記載の本発明の実施形態に対する様々な代替形態が、本発明を実施する際に採用され得ることを理解するべきである。したがって、本発明は、任意のそのような代替形態、修正形態、変形形態、又は均等物もまた包含すると考えられる。以下の特許請求の範囲が本発明の範囲を定義し、これらの特許請求の範囲内の方法及び構造並びにそれらの均等物がそれによって包含されることが意図される。

Claims (104)

  1. 操作されたヌクレアーゼシステムであって、
    (a)配列番号5718~5846又は配列番号6257のいずれか1つに対して少なくとも75%の配列同一性を有する配列を含むエンドヌクレアーゼ、並びに
    (b)前記エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
    (i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
    (ii)前記エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造
    を含む、操作されたヌクレアーゼシステム。
  2. 操作されたヌクレアーゼシステムであって、
    (a)配列番号5847~5861又は配列番号6258~6278を含むプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されたエンドヌクレアーゼであって、前記エンドヌクレアーゼがクラス2タイプIICasエンドヌクレアーゼである、エンドヌクレアーゼ、並びに
    (b)前記エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造であって、
    (i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
    (ii)前記エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含む、操作されたガイドリボ核酸構造
    を含む、操作されたヌクレアーゼシステム。
  3. 前記エンドヌクレアーゼが、未培養微生物に由来する、請求項1又は2に記載の操作されたヌクレアーゼシステム。
  4. 前記エンドヌクレアーゼが、異なるPAM配列に結合するように操作されていない、請求項1~3のいずれか一項に記載の操作されたヌクレアーゼシステム。
  5. 前記エンドヌクレアーゼが、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない、請求項1~4のいずれか一項に記載の操作されたヌクレアーゼシステム。
  6. 前記エンドヌクレアーゼが、Cas9エンドヌクレアーゼに対して80%未満の同一性を有する、請求項1~5のいずれか一項に記載の操作されたヌクレアーゼシステム。
  7. 前記リボ核酸配列が、(a)配列番号5886~5887、5891、5893、若しくは5894のいずれか1つ、又は(b)配列番号5862~5885、5888~5890、5892、5895~5896、若しくは6279~6301のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、請求項1~6のいずれか一項に記載の操作されたヌクレアーゼシステム。
  8. 操作されたヌクレアーゼシステムであって、
    (a)操作されたガイドリボ核酸構造であって、
    (i)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
    (ii)エンドヌクレアーゼに結合するように構成されたリボ核酸配列を含み、
    ここで、前記リボ核酸配列が、(a)配列番号5886~5887、5891、5893、若しくは5894のいずれか1つ、又は(b)配列番号5862~5885、5888~5890、5892、5895~5896又は6279~6301のいずれか1つの非縮重ヌクレオチドに対して少なくとも80%の配列同一性を有する配列を含む、操作されたガイドリボ核酸構造、並びに
    (b)前記操作されたガイドリボ核酸に結合するように構成されたクラス2タイプIICasエンドヌクレアーゼ
    を含む、操作されたヌクレアーゼシステム。
  9. 前記エンドヌクレアーゼが、配列番号5847~5861又は配列番号6258~6278を含む群から選択されるプロトスペーサー隣接モチーフ(PAM)配列に結合するように構成されている、請求項8に記載の操作されたヌクレアーゼシステム。
  10. 前記ガイドリボ核酸配列が、15~24ヌクレオチド長又は19~24ヌクレオチド長である、請求項8~9のいずれか一項に記載の操作されたヌクレアーゼシステム。
  11. 前記エンドヌクレアーゼが、前記エンドヌクレアーゼのN末端又はC末端に近接した1つ以上の核局在化配列(NLS)を含む、請求項1~10のいずれか一項に記載の操作されたヌクレアーゼシステム。
  12. 前記NLSが、配列番号5597~5612から選択される配列を含む、請求項1~11のいずれか一項に記載の操作されたヌクレアーゼシステム。
  13. 5’から3’の順に、前記標的デオキシリボ核酸配列に対して5’である少なくとも20ヌクレオチドの配列を含む第1のホモロジーアーム、少なくとも10ヌクレオチドの合成DNA配列、及び前記標的配列に対して3’である少なくとも20ヌクレオチドの配列を含む第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型を更に含む、請求項1~12のいずれか一項に記載の操作されたヌクレアーゼシステム。
  14. 前記第1のホモロジーアーム又は前記第2のホモロジーアームが、少なくとも40、80、120、150、200、300、500、又は1,000ヌクレオチドの配列を含む、請求項13に記載の操作されたヌクレアーゼシステム。
  15. 前記配列同一性が、Smith-Waterman相同性検索アルゴリズムのパラメータを用いて、BLASTP、CLUSTALW、MUSCLE、MAFFT、又はCLUSTALWによって決定される、請求項1~14のいずれか一項に記載の操作されたヌクレアーゼシステム。
  16. 前記配列同一性が、3のワード長(W)、10の期待値(E)のパラメータ、及び11の存在、1の伸長でのBLOSUM62スコアリングマトリックス設定ギャップコストを用いて、並びに条件付き組成スコアマトリックス調整を用いて、前記BLASTP相同性検索アルゴリズムによって決定される、請求項15に記載の操作されたヌクレアーゼシステム。
  17. 操作されたガイドリボ核酸ポリヌクレオチドであって、
    (a)標的DNA分子中の標的配列に相補的であるヌクレオチド配列を含む、DNA標的化セグメント、及び
    (b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的ストレッチを含む、タンパク質結合セグメントを含み、
    ここで、前記ヌクレオチドの2つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、
    前記操作されたガイドリボ核酸ポリヌクレオチドは、配列番号5718~5846又は配列番号6257のいずれか1つに対して少なくとも75%の配列同一性を有する配列を含むエンドヌクレアーゼと複合体を形成し、かつ前記複合体を前記標的DNA分子の前記標的配列へと標的化するように構成される、
    操作されたガイドリボ核酸ポリヌクレオチド。
  18. 前記DNA標的化セグメントが、前記ヌクレオチドの2つの相補的なストレッチの両方の5’に位置する、請求項17に記載の操作されたガイドリボ核酸ポリヌクレオチド。
  19. 請求項17~18のいずれか一項に記載の操作されたガイドリボ核酸ポリヌクレオチド又は構造をコードする、デオキシリボ核酸ポリヌクレオチド。
  20. 生物における発現のために最適化された、操作された核酸配列を含む核酸であって、前記核酸が、配列番号5718~5846又は配列番号6257のいずれか1つに対して少なくとも75%の配列同一性を有する配列を含むエンドヌクレアーゼをコードする、核酸。
  21. 前記エンドヌクレアーゼが、前記エンドヌクレアーゼのN末端又はC末端に近接する1つ以上の核局在化配列(NLS)をコードする配列を含む、請求項20に記載の核酸。
  22. 前記NLSが、配列番号5597~5612から選択される配列を含む、請求項21に記載の核酸。
  23. 前記生物が、原核生物、細菌、真核生物、真菌、植物、哺乳動物、げっ歯類、又はヒトである、請求項20~22のいずれか一項に記載の核酸。
  24. 請求項20~23のいずれか一項に記載の核酸を含む、ベクター。
  25. (a)標的デオキシリボ核酸配列にハイブリダイズするように構成されたリボ核酸配列、及び
    (b)前記エンドヌクレアーゼに結合するように構成されたリボ核酸配列
    を含む、前記エンドヌクレアーゼと複合体を形成するように構成された操作されたガイドリボ核酸構造をコードする核酸を更に含む、請求項24に記載のベクター。
  26. プラスミド、ミニサークル、CELiD、アデノ随伴ウイルス(AAV)由来ビリオン、又はレンチウイルスである、請求項24~25のいずれか一項に記載のベクター。
  27. 請求項24~26のいずれか一項に記載のベクターを含む、細胞。
  28. 請求項27に記載の細胞を培養することを含む、エンドヌクレアーゼを製造する方法。
  29. 二本鎖デオキシリボ核酸ポリヌクレオチドを結合、切断、マーキング、又は修飾するための方法であって、
    前記二本鎖デオキシリボ核酸ポリヌクレオチドを、クラス2タイプIICasエンドヌクレアーゼと、前記エンドヌクレアーゼ及び前記二本鎖デオキシリボ核酸ポリヌクレオチドへと結合するように構成された操作されたガイドリボ核酸構造との複合体において接触させることを含み、
    ここで、前記二本鎖デオキシリボ核酸ポリヌクレオチドは、プロトスペーサー隣接モチーフ(PAM)を含み、並びに
    前記PAMは、配列番号5847~5861又は配列番号6258~6278からなる群から選択される配列を含む、
    方法。
  30. 前記二本鎖デオキシリボ核酸ポリヌクレオチドが、前記操作されたガイドリボ核酸構造の配列に相補的な配列を含む第1の鎖、及び前記PAMを含む第2の鎖を含む、請求項29に記載の方法。
  31. 前記PAMが、前記操作されたガイドリボ核酸構造の前記配列に相補的な前記配列の3’末端に直接隣接している、請求項30に記載の方法。
  32. 前記クラス2タイプIICasエンドヌクレアーゼが、Cas9エンドヌクレアーゼ、Cas14エンドヌクレアーゼ、Cas12aエンドヌクレアーゼ、Cas12bエンドヌクレアーゼ、Cas12cエンドヌクレアーゼ、Cas12dエンドヌクレアーゼ、Cas12eエンドヌクレアーゼ、Cas13aエンドヌクレアーゼ、Cas13bエンドヌクレアーゼ、Cas13cエンドヌクレアーゼ、又はCas13dエンドヌクレアーゼではない、請求項29~31のいずれか一項に記載の方法。
  33. 前記二本鎖デオキシリボ核酸ポリヌクレオチドが、真核生物、植物、真菌、哺乳動物、げっ歯類、又はヒトの二本鎖デオキシリボ核酸ポリヌクレオチドである、請求項29~32のいずれか一項に記載の方法。
  34. 標的核酸遺伝子座を修飾する方法であって、前記方法は、前記標的核酸遺伝子座へと、請求項1~16のいずれか一項に記載の前記操作されたヌクレアーゼシステムを送達することを含み、ここで、前記エンドヌクレアーゼは、前記操作されたガイドリボ核酸構造と複合体を形成するように構成され、前記複合体は、前記複合体が前記標的核酸遺伝子座へと結合する際に前記複合体が前記標的核酸遺伝子座を修飾するように構成される、方法。
  35. 前記標的核酸遺伝子座を修飾することが、前記標的核酸遺伝子座を結合、ニック形成、切断、又はマーキングすることを含む、請求項34に記載の方法。
  36. 前記標的核酸遺伝子座が、デオキシリボ核酸(DNA)又はリボ核酸(RNA)を含む、請求項34~35のいずれか一項に記載の方法。
  37. 前記標的核酸が、ゲノムDNA、ウイルスDNA、ウイルスRNA、又は細菌DNAを含む、請求項36に記載の方法。
  38. 前記標的核酸遺伝子座がインビトロである、請求項34~37のいずれか一項に記載の方法。
  39. 前記標的核酸遺伝子座が細胞内にある、請求項34~37のいずれか一項に記載の方法。
  40. 前記細胞が、原核細胞、細菌細胞、真核細胞、真菌細胞、植物細胞、動物細胞、哺乳動物細胞、げっ歯類細胞、霊長類細胞、又はヒト細胞である、請求項39に記載の方法。
  41. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、請求項20~23のいずれか一項に記載の核酸、又は請求項24~26のいずれか一項に記載のベクターを送達することを含む、請求項34~40のいずれか一項に記載の方法。
  42. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、前記エンドヌクレアーゼをコードするオープンリーディングフレームを含む核酸を送達することを含む、請求項34~40のいずれか一項に記載の方法。
  43. 前記核酸が、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームが動作可能に連結されたプロモーターを含む、請求項41に記載の方法。
  44. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、前記エンドヌクレアーゼをコードする前記オープンリーディングフレームを含有する、キャップmRNAを送達することを含む、請求項34~41のいずれか一項に記載の方法。
  45. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、翻訳されたポリペプチドを送達することを含む、請求項34~41のいずれか一項に記載の方法。
  46. 前記操作されたヌクレアーゼシステムを前記標的核酸遺伝子座へと送達することが、リボ核酸(RNA)pol IIIプロモーターへと動作可能に連結された前記操作されたガイドリボ核酸構造をコードするデオキシリボ核酸(DNA)を送達することを含む、請求項34~41のいずれか一項に記載の方法。
  47. 前記エンドヌクレアーゼが、前記標的遺伝子座で、又は前記標的遺伝子座に近接して、一本鎖分解(break)又は二本鎖分解を誘導する、請求項34~46のいずれか一項に記載の方法。
  48. 細胞内のTRAC遺伝子座を編集する方法であって、前記細胞に、
    (a)RNAガイドエンドヌクレアーゼ、及び
    (b)操作されたガイドRNAであって、前記操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、前記TRAC遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNA
    を接触させることを含み、
    ここで、前記操作されたガイドRNAは、配列番号5950~5958又は配列番号5959~5965のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含む、
    方法。
  49. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項48に記載の方法。
  50. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含む、RuvCIIIドメインを含む、請求項48又は請求項49に記載の方法。
  51. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項50に記載の方法。
  52. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項48~51のいずれか一項に記載の方法。
  53. 前記操作されたガイドRNAが、配列番号5950~5958のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号421に対して少なくとも75%の同一性を有する配列を含む、請求項48~52のいずれか一項に記載の方法。
  54. 前記操作されたガイドRNAが、配列番号5959~5965のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項48~52のいずれか一項に記載の方法。
  55. 前記操作されたガイドRNAが、配列番号5953~5957のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項48~52のいずれか一項に記載の方法。
  56. 前記操作されたガイドRNAが、配列番号5960~5961又は配列番号5963~5964のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項48~52のいずれか一項に記載の方法。
  57. 細胞内のTRBC遺伝子座を編集する方法であって、前記細胞に、
    (a)RNAガイドエンドヌクレアーゼ、及び
    (b)操作されたガイドRNAであって、前記操作されたガイドRNAは前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAは、前記TRBC遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNA
    を接触させることを含み、
    ここで、前記操作されたガイドRNAは、配列番号5966~6004又は配列番号6005~6025のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含む、
    方法。
  58. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項57に記載の方法。
  59. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含む、RuvCIIIドメインを含む、請求項57又は請求項58に記載の方法。
  60. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項59に記載の方法。
  61. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項57~60のいずれか一項に記載の方法。
  62. 前記操作されたガイドRNAが、配列番号5966~6004のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号421に対して少なくとも75%の同一性を有する配列を含む、請求項57~61のいずれか一項に記載の方法。
  63. 前記操作されたガイドRNAが、配列番号6005~6025のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項57~61のいずれか一項に記載の方法。
  64. 前記操作されたガイドRNAが、配列番号5970、5971、5983、又は5984のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項57~61のいずれか一項に記載の方法。
  65. 前記操作されたガイドRNAが、配列番号6006、6010、6011、又は6012のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項57~61のいずれか一項に記載の方法。
  66. 細胞内のGR(NR3C1)遺伝子座を編集する方法であって、前記細胞に、
    (a)RNAガイドエンドヌクレアーゼ、及び
    (b)操作されたガイドRNAであって、前記操作されたガイドRNAは前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAは、前記GR(NR3C1)遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNA
    を接触させることを含み、
    ここで、前記操作されたガイドRNAは、配列番号6026~6090又は配列番号6091~6121のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含む、
    方法。
  67. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項66に記載の方法。
  68. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含むRuvCIIIドメインを含む、請求項66又は請求項67に記載の方法。
  69. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項68に記載の方法。
  70. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項66~69のいずれか一項に記載の方法。
  71. 前記操作されたガイドRNAが、配列番号6026~6090のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号421に対して少なくとも75%の同一性を有する配列を含む、請求項66~70のいずれか一項に記載の方法。
  72. 前記操作されたガイドRNAが、配列番号6091~6121のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項66~70のいずれか一項に記載の方法。
  73. 前記操作されたガイドRNAが、配列番号6027~6028、6029、6038、6043、6049、6076、6080、6081、又は6086のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項66~70のいずれか一項に記載の方法。
  74. 前記操作されたガイドRNAが、配列番号6092、6115、又は6119のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項66~70のいずれか一項に記載の方法。
  75. 細胞内のAAVS1遺伝子座を編集する方法であって、前記細胞に、
    (a)RNAガイドエンドヌクレアーゼ、及び
    (b)操作されたガイドRNAであって、前記操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、前記AAVS1遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNA
    を接触させることを含み、
    ここで、前記操作されたガイドRNAは、配列番号6122~6152のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含む、
    方法。
  76. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項75に記載の方法。
  77. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含むRuvCIIIドメインを含む、請求項75又は請求項76に記載の方法。
  78. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項68に記載の方法。
  79. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項75~78のいずれか一項に記載の方法。
  80. 前記操作されたガイドRNAが、配列番号6122、6125~6126、6128、6131、6133、6136、6141、6143、又は6148のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項75~79のいずれか一項に記載の方法。
  81. 細胞内のTIGIT遺伝子座を編集する方法であって、前記細胞に、
    (a)RNAガイドエンドヌクレアーゼ、及び
    (b)操作されたガイドRNAであって、前記操作されたガイドRNAが前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAが、前記TIGIT遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNA
    を接触させることを含み、
    ここで、前記操作されたガイドRNAは、配列番号6153~6181のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含む、
    方法。
  82. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項81に記載の方法。
  83. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項81又は請求項82に記載の方法。
  84. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含むRuvCIIIドメインを含む、請求項81~83のいずれか一項に記載の方法。
  85. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項84に記載の方法。
  86. 前記操作されたガイドRNAが、配列番号66155、6159、616、又は6172のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項81~85のいずれか一項に記載の方法。
  87. 細胞内のCD38遺伝子座を編集する方法であって、前記細胞に、
    (a)RNAガイドエンドヌクレアーゼ、及び
    (b)操作されたガイドRNAであって、前記操作されたガイドRNAは前記エンドヌクレアーゼと複合体を形成するように構成され、前記操作されたガイドRNAは、前記CD38遺伝子座の領域にハイブリダイズするように構成されたスペーサー配列を含む、操作されたガイドRNAと、
    を接触させることを含み、
    ここで、前記操作されたガイドRNAは、配列番号6182~6248又は配列番号6249~6256のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含む、
    方法。
  88. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項87に記載の方法。
  89. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含むRuvCIIIドメインを含む、請求項87又は請求項88に記載の方法。
  90. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項89に記載の方法。
  91. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項87~90のいずれか一項に記載の方法。
  92. 前記操作されたガイドRNAが、配列番号6182~6248のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号421に対して少なくとも75%の同一性を有する配列を含む、請求項87~91のいずれか一項に記載の方法。
  93. 前記操作されたガイドRNAが、配列番号6249~6256のいずれか1つの少なくとも18個の連続するヌクレオチドに対して少なくとも85%の同一性を有する標的配列を含み、前記エンドヌクレアーゼが、配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項87~91のいずれか一項に記載の方法。
  94. 前記操作されたガイドRNAが、配列番号6182~6183、6189、6191、6208、6210、6211、又は6215のいずれか1つの少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項87~91のいずれか一項に記載の方法。
  95. 前記操作されたガイドRNAが、配列番号6251の少なくとも18個の連続するヌクレオチドに対して、少なくとも85%の同一性を有する標的配列を含む、請求項87~91のいずれか一項に記載の方法。
  96. 前記細胞が、末梢血単核細胞、T細胞、NK細胞、造血幹細胞(HSCT)、又はB細胞である、請求項48~95のいずれか一項に記載の方法。
  97. 操作されたガイドリボ核酸ポリヌクレオチドであって、
    (a)標的DNA分子中の標的配列に対して相補的であるヌクレオチド配列を含む、DNA標的化セグメント、及び
    (b)ハイブリダイズして二本鎖RNA(dsRNA)二重鎖を形成するヌクレオチドの2つの相補的ストレッチを含む、タンパク質結合セグメント
    を含み、
    ここで、前記ヌクレオチドの2つの相補的ストレッチは、介在するヌクレオチドを用いて互いに共有結合しており、
    前記操作されたガイドリボ核酸ポリヌクレオチドは、クラス2タイプIICasエンドヌクレアーゼと複合体を形成し、かつ前記複合体を前記標的DNA分子の前記標的配列へと標的化するように構成され、前記DNA標的化セグメントは、配列番号5950~5965、5966~6025、6026~6121、6122~6152、6153~6181、又は6182~6256のいずれか1つに対して少なくとも85%の同一性を有する配列を含む、
    操作されたガイドリボ核酸ポリヌクレオチド。
  98. 前記タンパク質結合セグメントが、配列番号5466又は配列番号6304のいずれか1つに対して少なくとも85%の同一性を有する配列を含む、請求項97に記載の操作されたガイドリボ核酸ポリヌクレオチド。
  99. 編集された免疫細胞を生成するためのシステムであって、
    (a)RNAガイドエンドヌクレアーゼと、
    (b)前記RNAガイドエンドヌクレアーゼに結合するように構成された、請求項97に記載の操作されたガイドリボ核酸ポリヌクレオチドと、
    (c)キメラ抗原受容体(CAR)をコードする配列に隣接する第1のホモロジーアーム及び第2のホモロジーアームを含む、一本鎖又は二本鎖DNA修復鋳型と、
    を含む、システム。
  100. 前記細胞が、末梢血単核細胞、T細胞、NK細胞、造血幹細胞(HSCT)、又はB細胞である、請求項99に記載のシステム。
  101. 前記RNAガイドエンドヌクレアーゼが、クラスIIタイプIICasエンドヌクレアーゼである、請求項99又は100に記載のシステム。
  102. 前記RNAガイドエンドヌクレアーゼが、配列番号2242又は配列番号2244に対して少なくとも75%の同一性を有する配列を含むRuvCIIIドメインを含む、請求項99~101のいずれか一項に記載の方法。
  103. 前記RNAガイドエンドヌクレアーゼが、HNHドメインを更に含む、請求項102に記載の方法。
  104. 前記RNAガイドエンドヌクレアーゼが、配列番号421又は配列番号423に対して少なくとも75%の同一性を有する配列を含む、請求項99~103のいずれか一項に記載の方法。
JP2022567462A 2020-05-08 2021-05-06 Ruvcドメインを有する酵素 Pending JP2023533417A (ja)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063022320P 2020-05-08 2020-05-08
US63/022,320 2020-05-08
US202063032464P 2020-05-29 2020-05-29
US63/032,464 2020-05-29
US202063116155P 2020-11-19 2020-11-19
US63/116,155 2020-11-19
US202163180570P 2021-04-27 2021-04-27
US63/180,570 2021-04-27
PCT/US2021/031136 WO2021226363A1 (en) 2020-05-08 2021-05-06 Enzymes with ruvc domains

Publications (2)

Publication Number Publication Date
JP2023533417A true JP2023533417A (ja) 2023-08-03
JPWO2021226363A5 JPWO2021226363A5 (ja) 2024-03-14

Family

ID=78468763

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022567462A Pending JP2023533417A (ja) 2020-05-08 2021-05-06 Ruvcドメインを有する酵素

Country Status (9)

Country Link
EP (1) EP4146800A1 (ja)
JP (1) JP2023533417A (ja)
KR (1) KR20230021657A (ja)
CN (1) CN116096892A (ja)
AU (1) AU2021267379A1 (ja)
CA (1) CA3177828A1 (ja)
GB (1) GB2612458A (ja)
MX (1) MX2022014067A (ja)
WO (1) WO2021226363A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102647766B1 (ko) 2020-03-06 2024-03-13 메타지노미, 인크. 클래스 ii, 타입 v crispr 시스템
CA3177051A1 (en) 2020-03-31 2021-10-07 Metagenomi, Inc. Class ii, type ii crispr systems
JP2024504981A (ja) * 2021-01-22 2024-02-02 メタゲノミ,インク. 新規の操作されたヌクレアーゼおよびキメラヌクレアーゼ
WO2023118349A1 (en) * 2021-12-21 2023-06-29 Alia Therapeutics Srl Type ii cas proteins and applications thereof
WO2023137451A1 (en) * 2022-01-14 2023-07-20 Arbor Biotechnologies, Inc. Compositions comprising an rna guide targeting cd38 and uses thereof
WO2023194359A1 (en) * 2022-04-04 2023-10-12 Alia Therapeutics Srl Compositions and methods for treatment of usher syndrome type 2a
WO2024056880A2 (en) * 2022-09-16 2024-03-21 Alia Therapeutics Srl Enqp type ii cas proteins and applications thereof

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3058584A1 (en) * 2017-03-30 2018-10-04 Kyoto University Method for inducing exon skipping by genome editing
US9982279B1 (en) * 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases

Also Published As

Publication number Publication date
CN116096892A (zh) 2023-05-09
CA3177828A1 (en) 2021-11-11
MX2022014067A (es) 2023-02-22
KR20230021657A (ko) 2023-02-14
GB2612458A (en) 2023-05-03
WO2021226363A1 (en) 2021-11-11
EP4146800A1 (en) 2023-03-15
GB202217378D0 (en) 2023-01-04
AU2021267379A1 (en) 2022-12-08

Similar Documents

Publication Publication Date Title
AU2020223370B2 (en) Enzymes with RuvC domains
US10913941B2 (en) Enzymes with RuvC domains
JP2023533417A (ja) Ruvcドメインを有する酵素
WO2021178934A1 (en) Class ii, type v crispr systems
KR20240055073A (ko) 클래스 ii, v형 crispr 시스템
US20220298494A1 (en) Enzymes with ruvc domains
WO2021202559A1 (en) Class ii, type ii crispr systems
US20220220460A1 (en) Enzymes with ruvc domains
KR20240049306A (ko) Ruvc 도메인을 갖는 효소
EP4165177A1 (en) Enzymes with ruvc domains
US20240110167A1 (en) Enzymes with ruvc domains
GB2617659A (en) Enzymes with RUVC domains
WO2023039377A1 (en) Class ii, type v crispr systems

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230427

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230524

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240417