JP2023552374A - 操作されたクラス2 v型crisprシステム - Google Patents

操作されたクラス2 v型crisprシステム Download PDF

Info

Publication number
JP2023552374A
JP2023552374A JP2023533837A JP2023533837A JP2023552374A JP 2023552374 A JP2023552374 A JP 2023552374A JP 2023533837 A JP2023533837 A JP 2023533837A JP 2023533837 A JP2023533837 A JP 2023533837A JP 2023552374 A JP2023552374 A JP 2023552374A
Authority
JP
Japan
Prior art keywords
seq
grna
sequence
class
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023533837A
Other languages
English (en)
Inventor
ヒギンズ,ショーン
コリン,イザベル
デニー,サラ
ティ スタール,ブレット
オークス,ベンジャミン
サイドア,アンガス
マキジャ,スラジ
ビジャヤクマール,ガヤトリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Scribe Therapeutics Inc
Original Assignee
Scribe Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Scribe Therapeutics Inc filed Critical Scribe Therapeutics Inc
Publication of JP2023552374A publication Critical patent/JP2023552374A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/50Methods for regulating/modulating their activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Virology (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Saccharide Compounds (AREA)

Abstract

本明細書において、標的核酸の編集に有用な操作されたクラス2、V型ヌクレアーゼ及びガイドRNAが提供される。核酸を改変するために、そのようなバリアントを作製及び使用する方法も提供される。

Description

関連出願に対する相互参照
本出願は、2020年12月3日に出願された米国仮特許出願第63/121,196号、2021年3月17日に出願された同第63/162,346号、及び2021年6月9日に出願された同第63/208,855号の優先権を主張し、これらの各々の内容は、その全体が参照により本明細書に援用される。
配列表の参照による援用
本明細書とともに電子的に提出されたテキストファイルの内容は、その全体が参照により本明細書に援用される:配列表のコンピュータ可読形式のコピー(ファイル名:SCRB_031_03WO_SEQLIST_ST25、記録日:2021年12月1日、ファイルサイズ:5.61メガバイト)。
細菌及び古細菌のCRISPR-Casシステムは、ファージ及びウイルスに対する獲得免疫の形態を付与する。過去10年間にわたる集中的な研究により、これらのシステムの生化学が明らかになった。CRISPR-Casシステムは、外来DNA又はRNAの獲得、標的化、及び切断に関与するCasタンパク質と、Casタンパク質をそれらの標的に誘導する短いスペーサー配列に隣接する直列反復を含むCRISPRアレイと、からなる。クラス2 CRISPR-Casは、RNAに結合した単一のCasタンパク質が標的配列への結合及びその切断に関与する合理化されたバージョンである。これらの最小システムのプログラム可能な性質は、ゲノム操作の分野に大変革をもたらす多用途技術としてのそれらの使用を容易にした。
今日まで、広く使用されてきたクラス2 CRISPR/Casシステムはごく少数しか発見されていない。これらのうち、V型は、Cas9によって認識される3’PAM配列とは異なる5’PAM配列を認識し、5、7、又は10ntの5’オーバーハングを有する標的核酸において互い違いの切断を形成する、RuvC様エンドヌクレアーゼ(RuvC)ドメインを利用するという点で独特である(Yang et al.,PAM-dependent target DNA recognition and cleavage by C2c1 CRISPR-Cas endonuclease.Cell 167:1814(2016))。しかしながら、V型の野生型Cas及びガイド配列は、低い編集効率を有する。したがって、当該技術分野では、様々な治療用途、診断用途、及び研究用途における利用のために、最適化された、かつ/又は以前の世代のシステムを上回る改善を提供する、更なるクラス2、V型CRISPR/Casシステム(例えば、Casタンパク質とガイドRNAとの組み合わせ)が必要とされている。
本開示は、真核細胞において遺伝子の標的核酸を改変するために使用される、ガイドリボ核酸(guide ribonucleic acid、gRNA)、操作されたクラス2、V型CRISPRタンパク質、並びに操作されたクラス2、V型CRISPRタンパク質及びガイドリボ核酸(gRNA)のシステムに関する。いくつかの実施形態では、本開示は、参照CasXのドメインに対して1つ以上の改変を含み、配列番号2の参照CasXタンパク質と比較して1つ以上の改善された特徴を示す、操作されたクラス2、V型タンパク質を提供する。他の実施形態では、本開示は、CasX491(配列番号336)又はCasX515(配列番号416)などのCasXバリアントタンパク質の操作された配列バリアントを提供し、クラス2、V型タンパク質は、CasXバリアントのドメインに対して少なくとも1つの改変を含み、CasXバリアントタンパク質と比較して1つ以上の改善された特徴を示す。いくつかの実施形態では、クラス2、V型バリアントは、ガイドリボ核酸(gRNA)と複合体を形成することができ、複合体は、標的核酸に結合及び切断することができ、標的核酸は、非標的鎖及び標的鎖を含む。
いくつかの実施形態では、本開示は、クラス2、V型バリアントタンパク質に結合することができる、シングルガイド組成物を含むガイドリボ核酸(gRNA)を提供し、gRNAは、配列番号2238又は配列番号2239のgRNAと比較して、ある領域に少なくとも1つの改変を含む。いくつかの実施形態では、gRNAの足場の改変領域は、(a)伸長ステムループと、(b)足場ステムループと、(c)三重鎖と、(d)シュードノットと、を含む。場合によっては、バリアントgRNAの足場伸長ステムは、バブルに対する改変を更に含む。他の場合では、gRNAの足場は、三重鎖ループ領域に対する改変を更に含む。他の場合には、バリアントgRNAの足場は、ヘアピン配列を含む伸長ステム中に異種RNAを更に含む。
いくつかの実施形態では、本開示は、本明細書に記載の実施形態のいずれかの操作されたクラス2、V型タンパク質及びgRNAバリアントを含む遺伝子編集ペアを提供し、遺伝子編集ペアが、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質、及び配列番号4又は配列番号5のgRNAを含む遺伝子編集ペアと比較して、少なくとも1つの改善された特徴を示す。特定の実施形態では、操作されたクラス2、V型タンパク質は、表3に示される配列番号247~592及び1147~1231の配列からなる群から選択される配列、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を含み、gRNAは、表2に示される配列番号2101~2332及び2353~2398の配列からなる群から選択される配列、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列である。特定の実施形態では、操作されたクラス2、V型タンパク質は、配列番号270~592及び1147~1231の配列からなる群から選択される配列、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を含み、gRNAは、配列番号2238~2332及び2353~2398の配列からなる群から選択される配列、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列である。特定の実施形態では、操作されたクラス2、V型タンパク質は、配列番号415~592及び1147~1231の配列からなる群から選択される配列、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を含み、gRNAは、配列番号2281~2332及び2353~2398の配列からなる群から選択される配列、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列である。
いくつかの実施形態では、本開示は、本明細書に記載の操作されたクラス2、V型バリアントタンパク質、gRNAバリアント、及び遺伝子編集ペアをコードするポリヌクレオチド及びベクターを提供する。いくつかの実施形態では、ベクターは、アデノ随伴ウイルス(Adeno-Associated Viral、AAV)ベクターなどのウイルスベクターである。他の実施形態では、ベクターは、遺伝子編集ペアのRNPを含むXDPと呼ばれるCasX送達粒子である。
いくつかの実施形態では、本開示は、本明細書に記載のポリヌクレオチド、ベクター、操作されたクラス2、V型タンパク質及びgRNAを含む細胞を提供する。他の実施形態では、本開示は、本明細書に記載の編集の実施形態の方法によって編集された標的核酸を含む細胞を提供する。
いくつかの実施形態では、本開示は、本明細書に記載のポリヌクレオチド、ベクター、操作されたクラス2、V型タンパク質、gRNA、及び遺伝子編集ペアを含むキットを提供する。
いくつかの実施形態では、本開示は、標的核酸を編集する方法を提供し、標的核酸を、本明細書に記載のクラス2、V型タンパク質及びgRNAバリアントと接触させることを含み、接触させることが、標的核酸の編集又は改変をもたらす。
いくつかの実施形態では、本開示は、細胞集団における標的核酸を編集する、方法を提供し、細胞を、本明細書に記載の遺伝子編集ペアのうちの1つ以上と接触させることを含み、接触させることが、細胞集団における標的核酸の編集又は修飾をもたらす。
他の実施形態では、本開示は、治療を必要とする対象の治療方法を提供し、本明細書に記載の実施形態のいずれかの遺伝子編集ペア、又は遺伝子編集ペアを含む若しくはコードするベクターの投与を含む。
別の態様では、医薬品として使用するための、遺伝子編集ペア、遺伝子編集ペアを含む組成物、又は遺伝子編集ペアを含む若しくはコードするベクターが本明細書に提供される。
別の態様では、治療方法で使用するための、遺伝子編集ペア、遺伝子編集ペアを含む組成物、又は遺伝子編集ペアを含む若しくはコードするベクターが本明細書に提供され、本方法は、標的核酸を編集又は修飾することを含み、任意選択的に、編集が、遺伝子のアレルに変異を有する対象において行われ、変異が、対象において疾患又は障害を引き起こし、好ましくは、編集が、変異を遺伝子の野生型アレルに変化させるか、又は対象において疾患若しくは障害を引き起こす遺伝子のアレルをノックダウン若しくはノックアウトする。
参照による援用
本明細書で言及される全ての刊行物、特許、及び特許出願は、各個々の刊行物、特許、又は特許出願が、参照により援用されることが具体的かつ個別に示されているかのように、参照により本明細書に援用される。CasXバリアント及びgRNAバリアント、並びにそれらを送達する方法を開示する国際公開第2020/247882号、国際公開第2020/247883号、及び国際公開第2021/113772号の内容は、その全体が参照により本明細書に援用される。
添付の特許請求の範囲に本発明の新規特徴を詳細に示す。本発明の原理を利用する例示的な実施形態について示す以下の詳細な説明、並びに添付の図面を参照することによって、本発明の特徴及び利点がより良く理解されるであろう。
実施例8に記載されるように、sgRNA174(配列番号2238)並びにCasXバリアント119、457、488、及び491によって形成されたRNPの活性画分を定量化するためのアッセイの結果のグラフである。sgRNA及びCasXバリアントに対応する配列を、それぞれ表2及び表3に提供する。等モル量のRNP及び標的を共インキュベートし、切断された標的の量を、示された時点で決定した。3回の独立した反復の平均値及び標準偏差を、各時点について示す。組み合わせた複製物の二相適合を示す。「2」は、配列番号2の参照CasXタンパク質を指す。 実施例8に記載されるように、CasX2(配列番号2の参照CasXタンパク質)及び改変sgRNAによって形成されたRNPの活性画分の定量化を示す。等モル量のRNP及び標的を共インキュベートし、切断された標的の量を、示された時点で決定した。3回の独立した反復の平均値及び標準偏差を、各時点について示す。組み合わせた複製物の二相適合を示す。 実施例8に記載されるように、ガイド制限条件下でCasX491及び改変sgRNAによって形成されたRNPの活性画分の定量化を示す。等モル量のRNP及び標的を共インキュベートし、切断された標的の量を、示された時点で決定した。データの二相適合を示す。 実施例8に記載されるように、sgRNA174及びCasXバリアントによって形成されたRNPの切断速度の定量化を示す。標的DNAを、20倍過剰の示されたRNPとインキュベートし、切断された標的の量を、示された時点で決定した。単一の反復が示される488及び491を除いて、3回の独立した反復の平均値及び標準偏差を、各時点について示す。組み合わせた反復の単相適合を示す。 実施例8に記載されるように、CasX2及びsgRNAバリアントによって形成されたRNPの切断速度の定量化を示す。標的DNAを、20倍過剰の示されたRNPとインキュベートし、切断された標的の量を、示された時点で決定した。3回の独立した反復の平均値及び標準偏差を、各時点について示す。組み合わせた反復の単相適合を示す。 実施例8に記載されるように、CasX2及びsgRNAバリアントによって形成されたRNPの初速度の定量化を示す。先の切断実験の最初の2つの時点を線形モデルに適合して、切断初速度を決定した。 実施例8に記載されるように、CasX491及びsgRNAバリアントによって形成されたRNPの切断速度の定量化を示す。標的DNAを、20倍過剰の示されたRNPと10℃でインキュベートし、切断された標的の量を、示された時点で決定した。時点の単相適合を示す。 実施例8に記載されるように、等モル量の示されたRNP及び相補標的を使用して、gRNA 2と複合体化した参照CasX 2のRNPと比較した、gRNAバリアント174と複合体化したCasXバリアント515及び526のRNPのコンピテント画分の定量化を示す。各時間経過又は組み合わせた複製のセットについての二相適合を示す。 実施例8に記載されるように、20倍過剰の示されたRNPを使用して、gRNA 2と複合体化した参照CasX 2のRNPと比較した、gRNAバリアント174と複合体化したCasXバリアント515及び526のRNPの切断速度の定量化を示す。 実施例5に記載されるように、TTC PAMに対するCasXバリアントの切断速度の定量化を示す。同一のスペーサー及び示されたPAM配列を有する標的DNA基質を、20倍過剰の示されたRNPと37℃でインキュベートし、切断された標的の量を、示された時点で決定した。単一反復の単相適合を示す。 実施例5に記載されるように、CTC PAMに対するCasXバリアントの切断速度の定量化を示す。同一のスペーサー及び示されたPAM配列を有する標的DNA基質を、20倍過剰の示されたRNPと37℃でインキュベートし、切断された標的の量を、示された時点で決定した。単一反復の単相適合を示す。 実施例5に記載されるように、GTC PAMに対するCasXバリアントの切断速度の定量化を示す。同一のスペーサー及び示されたPAM配列を有する標的DNA基質を、20倍過剰の示されたRNPと37℃でインキュベートし、切断された標的の量を、示された時点で決定した。単一反復の単相適合を示す。 実施例5に記載されるように、ATC PAMに対するCasXバリアントの切断速度の定量化を示す。同一のスペーサー及び示されたPAM配列を有する標的DNA基質を、20倍過剰の示されたRNPと37℃でインキュベートし、切断された標的の量を、示された時点で決定した。単一反復の単相適合を示す。 実施例5に記載されるように、NTC PAMに対するCasXバリアント491及びガイド174のRNPの切断速度の定量化を示す。時点を、2分間にわたって取得し、切断された画分を各標的及び時点についてグラフ化したが、明確にするために、時間経過の最初の2分間のみを示す。 実施例5に記載されるように、NTT PAMに対するCasXバリアント491及びガイド174のRNPの切断速度の定量化を示す。時点を、10分間にわたって取得し、切断された画分を、各標的及び時点についてグラフ化した。 実施例9に記載されるように、18、19、又は20ヌクレオチド長のスペーサーを使用して、sgRNA174及びCasXバリアント515によって形成されたRNPによる切断の定量化を示す。標的DNAを、20倍過剰の示されたRNPとインキュベートし、切断された標的の量を、示された時点で決定した。3回の独立した反復の平均値及び標準偏差を、各時点について示す。組み合わせた反復の単相適合を示す。 実施例9に記載されるように、18、19、又は20ヌクレオチド長のスペーサーを使用して、sgRNA174及びCasXバリアント526によって形成されたRNPによる切断の定量化を示す。標的DNAを、20倍過剰の示されたRNPとインキュベートし、切断された標的の量を、示された時点で決定した。3回の独立した反復の平均値及び標準偏差を、各時点について示す。組み合わせた反復の単相適合を示す。 アデノ随伴ウイルス(AAV)におけるパッケージングのためのCasXタンパク質及び足場DNA配列の例を示す概略図である。CasXをコードするDNA及びそのプロモーター、並びに足場をコードするDNA及びそのプロモーターから構成される、AAV逆位末端反復(inverted terminal repeat、ITR)間のDNAセグメントは、AAV産生中にAAVカプシド内にパッケージングされる。 実施例21に記載されるように、Ai9-tdtomatoトランスジェニックマウスから単離されたマウス神経前駆細胞(mouse neural progenitor cell、mNPC)におけるgRNA足場229~237を足場174と比較する編集アッセイの結果を示す図である。細胞を、CasX491、足場、及びmRHOを標的化するスペーサー11.30(5’AAGGGGCUCCGCACCACGCC3’、配列番号17)をコードする示された用量のp59プラスミドでヌクレオフェクトした。mRHO遺伝子座での編集を、トランスフェクションの5日後にNGSによって評価し、足場230、231、234、及び235を有する構築物による編集が、両方の用量で足場174を有する構築物と比較して、より大きな編集を実証したことを示す。 実施例21に記載されるように、mNPC細胞においてgRNA足場229~237と足場174を比較する編集アッセイの結果を示す。細胞を、tdTomato蛍光タンパクの発現を防止する反復エレメントを標的化する、CasX491、足場、及びスペーサー12.7(5’CUGCAUUCUAGUUGUGGUUU 3’、配列番号1146)をコードする示された用量のp59プラスミドでヌクレオフェクトした。トランスフェクションの5日後、編集を、FACSによって評価して、tdTomato陽性細胞の割合を定量化した。足場231~235をヌクレオフェクトした細胞は、足場174を有する構築物と比較して、高用量では約35%より大きい編集を示し、低用量では約25%より大きい編集を示した。 網羅的変異進化(Deep Mutational Evolution、DME)を使用して本開示のCasXタンパク質及びガイドRNAバリアントを作製する例示的な方法を示す図である。いくつかの例示的な実施形態では、DMEは、生体分子及びその組み合わせ/複数におけるほぼ全ての可能な変異、挿入、及び欠失を構築及び試験し、生体分子の適合性ランドスケープ及び所望の結果に向けた配列空間における経路の、ほぼ包括的で偏りのない評価を提供する。本明細書に記載されるように、DMEは、CasXタンパク質及びガイドRNAの両方に適用することができる。 実施例13に記載されるように、2つのステムループ、シュードノット、及び三重鎖を含むDeltaproteobacteria CasXタンパク質: sgRNA RNP複合体(PDB ID:6YN2)のCryoEM構造を示す。 ツールRNAPDBee2.0(rnapdbee.cs.put.poznan.pl/、ツール3DNAS/DSSR、及びVARNA可視化ツールを使用)を使用して、(A)に示される構造から同定された配列番号4のsgRNAの二次構造を示す。RNA領域が示されている。PDB結晶構造ファイルにおいて明らかでなかった残基は、プレーンテキスト文字(すなわち、丸で囲まれていない)によって示され、残基番号付けに含まれていない。 実施例13に記載されるように、足場ライブラリを設計するために使用したガイドRNAの領域及びドメインの概略図である。 実施例13に記載されるように、示された偏りのない変異(二重変異及び単一変異)並びに標的化変異(三重鎖、足場ステムバブル、シュードノット、並びに伸長ステム及びループに対する)の両方を有する足場ライブラリの相対分布及び設計の円グラフである。 実施例13に記載されるように、交互の三重鎖形成塩基対を三重鎖に特異的に組み込むように設計された三重鎖変異誘発の概略図である。実線は、三重鎖におけるワトソン-クリック対を示す。第3鎖のヌクレオチドは、二重鎖のプリンとの非正準相互作用を表す点線として示されている。ライブラリにおいて、示された5つの位置の各々は、全ての可能な三重鎖モチーフ(G: GC、T: AT、G: GC)=243配列で置換された。ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCANNNAUCAAAG(配列番号1022)の配列。 実施例13に記載されるように、各スクリーニングにおける参照ガイド足場174及び175の濃縮値の結果を伴う棒グラフである。 実施例13に記載されるように、ガイド足場174及び175についての変異体ライブラリの2つの独立したスクリーニングの各々において測定された、各測定された単一ヌクレオチド置換、欠失、又は挿入についてのlog濃縮値を示す散布図である。 実施例13に記載されるように、配列にわたる足場における特定の変異可能領域を示す、ガイド足場174及び175における単一変異体についてのヒートマップである。黄色の影は、参照足場と同様の濃縮を有する値を反映する。赤色の影は、参照足場と比較した濃縮(したがって、活性)の増加を示す。青色の影は、野生型足場と比較した活性の喪失を示す。白色は、欠損データ(又は野生型配列をもたらす置換)を示す。 実施例13に記載されるように、参照ガイド足場174及び175上の単一ヌクレオチド変異のlog濃縮を比較する散布図である。174及び175の間で類似した位置への変異のみが示されている。結果は、全体として、ガイド足場174が175よりも変化に対して耐性があることを示唆している。 実施例13に記載されるように、各新しいシュードノットが塩基対の同じ組成を有するが、ステム内で異なる順序であるように、シュードノット対がシャフルされた足場のセットについての平均(及び95%信頼区間)log濃縮値を示す棒グラフである。各バーは、示されたG: A(又はA: G)対の位置(右の図を参照)を有する足場のセットを表す。291個のシュードノットステムを試験した。バーの上の数字は、各位置でG: A(又はA: G)対を有するステムの数を示す。 図55及び図56のシュードノット配列(5’から3’へ与えられている)の概略図であり、2つの鎖配列は下線によって分離されている。 実施例13に記載されるように、シュードノットステム領域の予測された二次構造の安定性によって分けた、足場についての平均(及び95%信頼区間)log濃縮値を示す棒グラフである。非常に安定なステム(例えば、ΔG<-7kcal/mol)を有する足場は、平均して高い濃縮値を有したが、不安定化されたステム(ΔG≧-5kcal/mol)を有する足場は、平均して低い濃縮値を有した。 実施例13に記載されるように、足場175における位置7及び29の全ての二重変異体のヒートマップである。シュードノット配列は、右側に、5’から3’へ与えられている。 Rho遺伝子座のP23部位を標的化する(CasX491を有する)11.1スペーサーを有する174と比較した、操作されたガイド235を使用したARPE-19ヌクレオフェクト細胞における編集結果を示し、実施例21に記載されるように、変異体RHOレポーター遺伝子におけるオフターゲット切断(非標的化スペーサーによる)を伴わずにWT外因性RHOでのオンターゲット活性が増加した、235バリアントによる活性の改善を実証する。 実施例21に記載されるように、1000ngの各プラスミドでヌクレオフェクトされたARPE-1細胞におけるベンチマークp59.491.174.11.1レベル(値1.0に設定)に対して正規化されたp59.491.235.11.1の編集レベルの倍率変化を示す棒グラフである。 実施例17に記載されるように、カスタムHEK293細胞株PASS_V1.01におけるCasヌクレアーゼ2、119、491、515、527、528、529、530、及び531を比較する編集アッセイの結果を示す。細胞を、示されたCasタンパク質をコードする2μgのp67プラスミドでリポフェクトした。5日後、細胞のゲノムDNAを抽出した。PCR増幅及び次世代配列決定を実施して、カスタム設計されたオンターゲット編集部位で編集された細胞の画分を単離及び定量化した。各試料について、以下のPAM配列からなる標的部位(個々の点)で編集を評価した:48個のTTC、14個のATC、22個のCTC、11個のGTCの個々の部位、及び編集の割合(%)を、ビヒクル対照に対して正規化した。任意のヌクレアーゼでリポフェクトされた細胞は、Cas528を除く野生型ヌクレアーゼCas2のものよりも高い、TTC PAM標的部位(水平バー)での平均編集を示した。また、4つの異なるPAM配列に対する任意の所与のヌクレアーゼの相対優先度が、バイオリンプロットで表されている。特に、Casヌクレアーゼ527、528、及び529は、野生型ヌクレアーゼCas2のものとは実質的に異なるPAM優先度を示す。 実施例18に記載されるように、カスタムHEK293細胞株PASS_V1.01において、改良型Casヌクレアーゼ491と改良型ヌクレアーゼ532及び533を比較する編集アッセイの結果を示す。細胞を、示されたCasタンパク質及びピューロマイシン耐性遺伝子をコードする2μgのp67プラスミドで二連でリポフェクトし、ピューロマイシン選択下で増殖させた。3日後、細胞のゲノムDNAを抽出した。PCR増幅及び次世代配列決定を実施して、カスタム設計されたオンターゲット編集部位で編集された細胞の画分を単離及び定量化した。各試料について、以下のPAM配列からなる標的部位で編集を評価した:48個のTTC、14個のATC、22個のCTC、11個のGTCの個々の部位、及び編集の割合を、ビヒクル対照に対して正規化した。CasX532又は533でリポフェクトされた細胞は、TTC PAM標的部位におけるPAM配列の各々で、CasX533を除いて、Cas491よりも高い平均編集を示した。エラーバーは、n=2の生物学的試料についての平均値の標準誤差を表す。 実施例14に記載されるように、CasXタンパク質515及び足場174によって標的化された場合、異なるスペーサーに対するCcdB選択の選択的ストリンジェンシーを決定するための生存アッセイのグラフである。 実施例14に記載されるように、3つのスペーサーの平均として、TTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、3つのスペーサーの平均として、TTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、3つのスペーサーの平均として、TTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、3つのスペーサーの平均として、TTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、3つのスペーサーの平均として、TTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生化学的切断を実証する(biological replicates)の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生化学的切断を実証する(biological replicates)の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生化学的切断を実証する(biological replicates)の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生化学的切断を実証する(biological replicates)の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生化学的切断を実証する(biological replicates)の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、CTC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、ATC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、ATC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、ATC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、ATC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 実施例14に記載されるように、単一のスペーサーにおける3つの生物学的反復の平均として、ATC PAM標的部位における各変異体についての中立的な又は改善された生化学的切断を実証するCasX515のバリアントのヒートマップである。図は、CasX515配列の全長にわたる結果を示す。 スペーサー15.3について、実施例15に記載されるように、Jurkat細胞においてRNPを用いて標的核酸を編集する能力に対するスペーサー長の効果を示すグラフである。 スペーサー15.5について、実施例15に記載されるように、Jurkat細胞においてRNPを用いて標的核酸を編集する能力に対するスペーサー長の効果を示すグラフである。 実施例16に記載されるように、複製試料についての4つの異なるPAM配列(TTC、ATC、CTC、及びGTC)における選択CasXバリアントタンパク質及びそれらの編集効率の棒グラフである。データを、編集の割合(%)+/-標準偏差として示す。 実施例19に記載されるように、48個の異なるTTC PAM標的部位における選択CasXヌクレアーゼのCasX491と比較した平均編集効率を示す棒グラフである。2つの実験の平均の伝搬標準誤差をエラーバーとしてプロットした。アスタリスクは、CasX527及びCasX491の間の有意差を示す(p=0.0000635、Welchの両側t検定による)。 実施例19に記載されるように、標的DNA PAM配列、PAM相互作用ループ、NTSBドメイン、及びアミノ酸位置26の物理的位置を示す、相同的な参照CasX1(配列番号1:タンパク質データバンク識別番号:6NY2)の公開されたCryoEM構造に基づく図である。 実施例19に記載される、選択CasXバリアントタンパク質及び48個のTTC PAM標的部位におけるそれらの編集効率のバイオリンプロットである。 実施例19に記載されるように、選択されたCasXバリアントタンパク質及び48個のTTC PAM標的部位におけるCasX491と比較したそれらの編集効率の棒グラフである。データは、平均の相対編集効率として提示され、CasX491編集が1.0に等しい。灰色の破線は、CasX119の編集効率を示す。複製試料について、誤差は、+/-伝搬SEMである。 実施例20に記載されるように、CasX491と比較した平均編集効率並びに選択CasXヌクレアーゼの平均特異度(average specificity ratio)を示す棒グラフである。 実施例21に記載されるように、試験した変異の組み合わせと、得られたCasXバリアントの活性及び特異性の両方に対するそれらの効果との間の定性的関係を示すフローチャートである。 実施例21に記載されるように、MOIの範囲にわたってmNPCにおける内因性マウスRhoエキソン1遺伝子座でgRNA足場235と足場174、及びガイド11.30と11.31とを比較するAAV媒介性編集アッセイの結果を示す。 実施例21に記載されるように、5.0e+5MOIで感染させた細胞における、スペーサー11.30を有するガイド174(1.0に設定)と比較した足場235の編集レベルの倍率変化としての編集結果を示す。 gRNAバリアント235に組み込まれたgRNAバリアント175における伸長ステムループにおいてなされた改変を示す概略図である。sgRNA175の伸長ステムループ:配列番号1285、sgRNA325の伸長ステムループ:配列番号1286。 gRNAバリアント235の概略図であり、gRNAバリアント174及び175と比較して、三重鎖、足場ステムバブル、及び伸長ステムループにおける改変を示している。シュードノット及び三重鎖ループ:配列番号1287、足場ステム及び伸長ステム:配列番号1288。 実施例23に記載されるように、MS2ヘアピン内の塩基の位置を示す概略図である。図中のMS2配列:配列番号1289。 実施例23に記載されるように、gRNA足場188及び251が塩基バリアントとして機能する、示された足場バリアントとともにパッケージングされたXDPについて、tdTomato蛍光によって測定されたtdTomato遺伝子座での編集の割合(%)のグラフである。2つのMS2バージョン(MS2 353及びMS2 WT)を使用した。 実施例23に記載されるように、示されたgRNA足場バリアントとともにパッケージングされたXDPについて、力価と比較した(足場188及び251は基本対照として機能する)、NPCにおけるtdTomato遺伝子座での編集についての、NanoSightを使用して決定されたEC50値の改善を示す。2つのMS2バージョン、MS2 353及びMS2野生型(wild type、WT)を使用した。 実施例23に記載されるように、示されたgRNA足場バリアントとともにパッケージングされたXDPについての、MS2ヘアピン親和性(K)とEC50との間の相関を示す。 実施例23に記載されるように、示されたgRNA足場バリアントとともにパッケージングされたXDPについての、MS2ヘアピン親和性(K)と力価との間の相関を示す。
本発明の好ましい実施形態が本明細書に示され、説明されてきたが、かかる実施形態は、単なる例として提供されることが当業者には明らかであろう。当業者であれば、本発明から逸脱することなく、多数の変形、変更、及び置換を想起するであろう。本明細書に記載の本発明の実施形態に対する様々な代替物が、本発明を実施する際に用いられ得ることが理解されるべきである。以下の特許請求の範囲が本発明の範囲を定義し、これらの特許請求の範囲内の方法及び構造並びにそれらの均等物がそれによって包含されることが意図される。
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。本明細書に記載されているものと同様又は同等の任意の方法及び材料を本実施形態の実施又は試験において使用することができるが、好適な方法及び材料を以下に記載する。矛盾する場合、定義を含む本特許明細書が優先される。加えて、材料、方法、及び実施例は、例示にすぎず、限定することを意図するものではない。当業者であれば、本発明から逸脱することなく、多数の変形、変更、及び置換を想起するであろう。
定義
「ポリヌクレオチド」及び「核酸」という用語は、本明細書において互換的に使用され、リボヌクレオチド又はデオキシリボヌクレオチドのいずれかである、任意の長さのヌクレオチドのポリマー形態を指す。したがって、「ポリヌクレオチド」及び「核酸」という用語は、一本鎖DNA、二本鎖DNA、多重鎖DNA、一本鎖RNA、二本鎖RNA、多重鎖RNA、ゲノムDNA、cDNA、DNA-RNAハイブリッド、並びにプリン及びピリミジン塩基又は他の天然の、化学的若しくは生化学的に改変された、非天然の、若しくは誘導体化されたヌクレオチド塩基を含むポリマーを包含する。
「ハイブリダイズ可能」又は「相補的」は、互換的に使用され、核酸(例えば、RNA、DNA)が、温度及び溶液のイオン強度の適切なインビトロ及び/又はインビボ条件下で、配列特異的な逆平行様式で、別の核酸に非共有結合する(すなわち、ワトソン-クリック塩基対及び/又はG/U塩基対を形成する)、「アニールする」又は「ハイブリダイズする」(すなわち、核酸が相補的な核酸に特異的に結合する)ことを可能にするヌクレオチドの配列を含むことを意味する。ポリヌクレオチドの配列は、特異的にハイブリダイズ可能であるために、その標的核酸の配列と100%相補的である必要はないことが理解される。それは、少なくとも約70%、少なくとも約80%、又は少なくとも約90%、又は少なくとも約95%の配列同一性を有し、それでもなお標的核酸配列にハイブリダイズすることができる。更に、ポリヌクレオチドは、介在又は隣接するセグメントがハイブリダイゼーション事象に関与することなく、1つ以上のセグメントにわたってハイブリダイズすることができる(例えば、ループ構造又はヘアピン構造、「バルジ」、「バブル」など)。
本開示の目的のための「遺伝子」は、遺伝子産物(例えば、タンパク質、RNA)をコードするDNA領域、並びにかかる調節配列がコード配列及び/又は転写配列に隣接しているか否かにかかわらず、遺伝子産物の産生を調節する全てのDNA領域を含む。したがって、遺伝子は、アクセサリエレメントを含み得、これには、プロモーター配列、ターミネーター、翻訳調節配列(例えば、リボソーム結合部位及び内部リボソーム進入部位)、エンハンサー、サイレンサー、インスレーター、境界エレメント、複製起点、マトリックス付着部位、及び遺伝子座制御領域が含まれるが、必ずしもこれらに限定されない。コード配列は、転写又は転写及び翻訳の際に遺伝子産物をコードする。本開示のコード配列は、オープンリーディングフレームの断片を含んでもよく、全長を含む必要はない。遺伝子は、転写される鎖並びにアンチコドンを含む相補鎖の両方を含み得る。
「下流」という用語は、参照ヌクレオチド配列の3’側に位置するヌクレオチド配列を指す。特定の実施形態では、下流ヌクレオチド配列は、転写の開始点に続く配列に関する。例えば、遺伝子の翻訳開始コドンは、転写開始部位の下流に位置する。
「上流」という用語は、参照ヌクレオチド配列の5’側に位置するヌクレオチド配列を指す。特定の実施形態では、上流ヌクレオチド配列は、コード領域又は転写開始点の5’側に位置する配列に関する。例えば、ほとんどのプロモーターは、転写開始部位の上流に位置する。
ポリヌクレオチド又はアミノ酸配列に関して「に隣接する」という用語は、ポリヌクレオチド又はポリペプチドにおいて互いに隣にある又は隣接する配列を指す。当業者は、2つの配列が互いに隣接していると考えることができ、それでも限定された量の介在配列、例えば、1、2、3、4、5、6、7、8、9、又は10個のヌクレオチド又はアミノ酸を包含することを理解するであろう。
「アクセサリエレメント」という用語は、本明細書において「アクセサリ配列」という用語と互換的に使用され、とりわけ、ポリアデニル化シグナル(ポリ(A)シグナル)、エンハンサーエレメント、イントロン、転写後調節エレメント(posttranscriptional regulatory element、PTRE)、核局在化シグナル(nuclear localization signal、NLS)、デアミナーゼ、DNAグリコシラーゼ阻害剤、更なるプロモーター、CRISPR媒介性相同組換え修復を刺激する因子(例えば、シス又はトランス)、転写のアクチベーター又はリプレッサー、自己切断配列、及び融合ドメイン(例えば、CRISPRタンパク質に融合した融合ドメイン)を含むことが意図される。適切な1つ又は複数のアクセサリエレメントの選択は、発現されるコードされた成分(例えば、タンパク質若しくはRNA)に依存するか、又は核酸が異なるポリメラーゼを必要とする複数の成分を含むか若しくは融合タンパク質として発現するように意図されていないかに依存することが理解される。
「プロモーター」という用語は、転写開始部位、並びにポリメラーゼの結合及び転写を容易にするための更なる配列を含むDNA配列を指す。例示的な真核生物プロモーターとしては、TATAボックス及び/又はB認識エレメント(B recognition element、BRE)などのエレメントが挙げられ、関連する転写可能なポリヌクレオチド配列及び/又は遺伝子(若しくは導入遺伝子)の転写及び発現を補助又は促進する。プロモーターは、合成的に産生され得るか、又は既知の若しくは天然に存在するプロモーター配列若しくは別のプロモーター配列に由来し得る。プロモーターは、転写される遺伝子に対して近位又は遠位であり得る。プロモーターはまた、特定の特性を付与するための2つ以上の異種配列の組み合わせを含むキメラプロモーターを含み得る。本開示のプロモーターは、組成が類似しているが、既知の又は本明細書に提供される他のプロモーター配列と同一ではないプロモーター配列のバリアントを含み得る。プロモーターは、プロモーター(例えば、構成的、発生的、組織特異的、誘導性など)に作動可能に連結された関連するコード配列若しくは転写可能配列又は遺伝子の発現パターンに関する基準に従って分類され得る。プロモーターはまた、その強度に従って分類され得る。プロモーターの文脈で使用される場合、「強度」は、プロモーターによって制御される遺伝子の転写速度を指す。「強い」プロモーターは、転写速度が高いことを意味し、「弱い」プロモーターは、転写速度が比較的低いことを意味する。
本開示のプロモーターは、ポリメラーゼII(Polymerase II、Pol II)プロモーターであり得る。ポリメラーゼIIは、全てのタンパク質コード及び多くの非コード遺伝子を転写する。代表的なPol IIプロモーターは、転写開始部位を取り囲む約100塩基対の配列であるコアプロモーターを含み、Pol IIポリメラーゼ及び関連する一般的な転写因子のための結合プラットフォームとして機能する。プロモーターは、1つ以上のコアプロモーターエレメント(例えば、TATAボックス、BRE、イニシエーター(Initiator、INR)、モチーフ10エレメント(motif ten element、MTE)、下流コアプロモーターエレメント(downstream core promoter element、DPE)、下流コアエレメント(downstream core element、DCE))を含み得るが、これらのエレメントを欠くコアプロモーターは、当該技術分野で既知である。
本開示のプロモーターは、ポリメラーゼIII(Polymerase III、Pol III)プロモーターであり得る。Pol IIIは、DNAを転写して、5SrRNA、tRNA、及び他の低分子RNAなどの低分子リボソームRNAを合成する。代表的なPol IIIプロモーターは、転写を支持するために内部制御配列(遺伝子の転写された部分内の配列)を使用するが、TATAボックスなどの上流エレメントも使用されることもある。全てのPol IIIプロモーターは、本開示の範囲内として想定される。
「エンハンサー」という用語は、転写因子と呼ばれる特定のタンパク質が結合した場合に、関連する遺伝子の発現を調節する、調節DNA配列を指す。エンハンサーは、遺伝子のイントロン、又は遺伝子のコード配列の5’若しくは3’に位置し得る。エンハンサーは、遺伝子の近位(すなわち、プロモーターの数十若しくは数百塩基対(base pair、bp)内)にあってもよく、又は遺伝子の遠位(すなわち、プロモーターから数千bp、数十万bp、若しくは更に数百万bp離れている)に位置してもよい。単一の遺伝子は、2つ以上のエンハンサーによって調節されてもよく、これらの全ては、本開示の範囲内であると想定される。
本明細書で使用される場合、「転写後調節エレメント(post-transcriptional regulatory element、PRE)」(例えば、肝炎PRE)とは、転写された場合、それに作動可能に連結された関連遺伝子の発現を増強又は促進する転写後活性を示し得る三次構造を生成するDNA配列を指す。
本明細書で使用される場合、「転写後調節エレメント(PTRE)」(例えば、肝炎PTRE)とは、転写された場合、それに作動可能に連結された関連遺伝子の発現を増強又は促進する転写後活性を示し得る三次構造を生成するDNA配列をいう。
本明細書で使用される場合、「組換え」とは、特定の核酸(DNA又はRNA)が、クローニングステップ、制限ステップ、及び/又は連結ステップの様々な組み合わせの産物であり、その結果、天然のシステムで見出される内因性核酸から識別可能な構造的なコード配列又は非コード配列を有する構築物が得られることを意味する。一般に、構造コード配列をコードするDNA配列は、cDNA断片と短いオリゴヌクレオチドリンカー、又は一連の合成オリゴヌクレオチドから組み立てることができ、細胞又は無細胞転写及び翻訳システムに含まれる組換え転写単位から発現され得る合成核酸を提供する。かかる配列は、典型的には、真核生物遺伝子に存在する内部非翻訳配列又はイントロンによって中断されないオープンリーディングフレームの形態で提供され得る。関連配列を含むゲノムDNAはまた、組換え遺伝子又は転写単位の形成において使用され得る。非翻訳DNAの配列は、オープンリーディングフレームから5’又は3’に存在し得、ここで、かかる配列は、コード領域の操作又は発現を妨害せず、実際に、様々な機構によって所望の産物の産生を調節するように作用し得る(上記の「エンハンサー」及び「プロモーター」を参照)。
「組換えポリヌクレオチド」又は「組換え核酸」という用語は、天然に存在しないもの、例えば、ヒトの介入を介して、そうでなければ分離された配列の2つのセグメントの人工的な組み合わせによって作製されるものを指す。この人工的な組み合わせは、多くの場合、化学合成手段、又は核酸の単離されたセグメントの人工的操作(例えば、遺伝子操作技術)のいずれかによって達成される。これは、典型的には、配列認識部位を導入又は除去しながら、コドンを、同じアミノ酸又は保存的アミノ酸をコードする縮重コドン(redundant codon)で置換するように行うことができる。代替的には、所望の機能の核酸セグメントを一緒に連結して、所望の機能の組み合わせを生成するように行われる。この人工的な組み合わせは、多くの場合、化学合成手段、又は核酸の単離されたセグメントの人工的操作(例えば、遺伝子操作技術)のいずれかによって達成される。
同様に、「組換えポリペプチド」又は「組換えタンパク質」という用語は、天然に存在しないポリペプチド又はタンパク質、例えば、ヒトの介入を介して、そうでなければ分離されたアミノ配列の2つのセグメントの人工的な組み合わせによって作製されるものを指す。したがって、例えば、異種アミノ酸配列を含むタンパク質は組換え体である。
本明細書で使用される場合、「接触する」という用語は、2つ以上の実体間に物理的接続を確立することを意味する。例えば、標的核酸をガイド核酸と接触させることは、標的核酸及びガイド核酸が、物理的接続を共有するようになされることを意味する(例えば、それらの配列が配列類似性を共有する場合、ハイブリダイズすることができる)。
「解離定数」又は「K」は、互換的に使用され、リガンド「L」とタンパク質「P」との間の親和性を意味する(すなわち、リガンドが特定のタンパク質にどの程度強く結合するかである)。解離定数は、式K=[L][P]/[LP]を用いて計算することができ、式中、[P]、[L]、及び[LP]は、それぞれ、タンパク質、リガンド、及び複合体のモル濃度を表す。
本開示は、標的核酸配列を編集するために有用なシステム及び方法を提供する。本明細書で使用される場合、「編集」は、「改変」と互換的に使用され、切断、ニッキング、欠失、ノックイン、ノックアウトなどを含むが、これらに限定されない。
「切断」とは、標的核酸分子(例えば、RNA、DNA)の共有結合骨格の破壊を意味する。切断は、様々な方法によって開始することができ、ホスホジエステル結合の酵素的又は化学的加水分解を含むが、これらに限定されない。一本鎖切断及び二本鎖切断の両方が可能であり、二本鎖切断は、2つの別個の一本鎖切断事象の結果として生じ得る。
「ノックアウト」という用語は、遺伝子又は遺伝子の発現の排除を指す。例えば、遺伝子は、リーディングフレームの破壊をもたらすヌクレオチド配列の欠失又は付加のいずれかによってノックアウトされ得る。別の例として、遺伝子は、遺伝子の一部を無関係な配列で置換することによってノックアウトされ得る。本明細書で使用される「ノックダウン」という用語は、遺伝子又はその遺伝子産物の発現の低減を指す。遺伝子ノックダウンの結果として、タンパク質活性若しくは機能が減弱され得るか、又はタンパク質レベルが低減若しくは排除され得る。
本明細書で使用される場合、「相同組換え修復」(homology-directed repair、HDR)とは、細胞における二本鎖切断の修復中に起こるDNA修復の形態を指す。このプロセスは、ヌクレオチド配列の相同性を必要とし、ドナー鋳型を使用して標的DNAを修復又はノックアウトし、ドナーから標的への遺伝情報の伝達をもたらす。相同組換え修復は、ドナー鋳型が標的DNA配列と異なり、ドナー鋳型の配列の一部又は全部が標的DNAに組み込まれる場合、挿入、欠失、又は変異による標的配列の配列の改変をもたらすことができる。
本明細書で使用される場合、「非相同末端結合」(non-homologous end joining、NHEJ)は、(修復を誘導するために相同配列を必要とする相同組換え修復とは対照的に)相同鋳型を必要とせずに、切断末端を互いに直接ライゲーションすることによる、DNAにおける二本鎖切断の修復を指す。NHEJは、多くの場合、二本鎖切断部位付近のヌクレオチド配列の喪失(欠失)をもたらす。
本明細書で使用される場合、「マイクロホモロジー媒介末端結合」(micro-homology mediated end joining、MMEJ)は、(修復を誘導するために相同配列を必要とする相同組換え修復とは対照的に)相同鋳型を必要とせずに、切断部位に隣接する欠失と常に関連する、変異原性DSB修復機構を指す。MMEJは、多くの場合、二本鎖切断部位付近のヌクレオチド配列の喪失(欠失)をもたらす。ポリヌクレオチド又はポリペプチドは、別のポリヌクレオチド又はポリペプチドと特定のパーセント「配列類似性」又は「配列同一性」を有し、これは、2つの配列を比較した場合(整列させた場合)、同じ相対位置にある同じ塩基又はアミノ酸の割合を意味する。配列類似性(パーセント類似性、パーセント同一性、又は相同性とも称される)は、いくつかの異なる様式で決定することができる。配列類似性を決定するために、配列は、ncbi.nlm.nih.gov/BLASTのワールドワイドウェブ上で利用可能なBLASTを含む、当該技術分野で既知の方法及びコンピュータプログラムを使用して整列させることができる。核酸内の核酸配列の特定のストレッチ間のパーセント相補性は、任意の便利な方法を使用して決定することができる。例示的な方法としては、BLASTプログラム(基本的局所整列検索ツール)及びPowerBLASTプログラム(Altschul et al.,J.Mol.Biol.,1990,215,403-410、Zhang and Madden,Genome Res.,1997,7,649-656)が挙げられる(又はGapプログラム(Wisconsin Sequence Analysis Package,Version 8 for Unix,Genetics Computer Group,University Research Park,Madison Wis.)を使用することによって、例えば、Smith and Watermanのアルゴリズム(Adv.Appl.Math.,1981,2,482-489)を使用するデフォルト設定を使用して)。
「ポリペプチド」及び「タンパク質」という用語は、本明細書で互換的に使用され、任意の長さのアミノ酸のポリマー形態を指し、これは、コードアミノ酸及び非コードアミノ酸、化学的又は生化学的に改変又は誘導体化されたアミノ酸、並びに改変されたペプチド骨格を有するポリペプチドを含み得る。この用語は、融合タンパク質(異種アミノ酸配列を有する融合タンパク質を含むが、これに限定されない)を含む。
「ベクター」又は「発現ベクター」は、プラスミド、ファージ、ウイルス、又はコスミドなどのレプリコンであり、これに別のDNAセグメント(すなわち、「インサート」)を結合させて、細胞において結合されたセグメントの複製又は発現をもたらすことができる。
本明細書で使用される「天然に存在する」又は「未改変」又は「野生型」という用語は、核酸、ポリペプチド、細胞、又は生物に適用される場合、天然に見出される核酸、ポリペプチド、細胞、又は生物を指す。
本明細書で使用される場合、「変異」とは、野生型若しくは参照アミノ酸配列と比較して、又は野生型若しくは参照ヌクレオチド配列と比較して、1つ以上のアミノ酸又はヌクレオチドの挿入、欠失、置換、重複、又は逆位を指す。
本明細書で使用される場合、「単離された」という用語は、ポリヌクレオチド、ポリペプチド、又は細胞が天然に存在する環境とは異なる環境にあるポリヌクレオチド、ポリペプチド、又は細胞を表すことを意味する。単離された遺伝子改変宿主細胞は、遺伝子改変宿主細胞の混合集団中に存在してもよい。
本明細書で使用される「宿主細胞」とは、真核細胞、原核細胞、又は多細胞生物由来の細胞(例えば、細胞株)を意味し、真核細胞又は原核細胞は、核酸(例えば、発現ベクター)のレシピエントとして使用され、核酸によって遺伝子改変された元の細胞の子孫を含む。単一細胞の子孫は、天然の、偶発的な、又は意図的な変異に起因して、形態において、又はゲノム若しくは全DNAの相補体において、元の親と必ずしも完全に同一でなくてもよいことが理解される。「組換え宿主細胞」(「遺伝子改変宿主細胞」とも称される)は、異種核酸(例えば、発現ベクター)が導入された宿主細胞である。
本明細書で使用される「トロピズム」という用語は、ウイルス様粒子(XDP、本明細書ではXDPと称されることもある)の特定の細胞型若しくは組織型への優先的な侵入、及び/又は特定の細胞型若しくは組織型への侵入を促進する細胞表面との優先的な相互作用、続いて、任意選択的に及び好ましくは、XDPによって細胞に運ばれる配列の発現(例えば、転写及び任意選択的に翻訳)を指す。
本明細書で使用される「シュードタイプ」又は「シュードタイピング」という用語は、好ましい特徴を有する別のウイルスのエンベロープタンパク質で置換されたウイルスエンベロープタンパク質を指す。例えば、HIVは、水疱性口内炎ウイルスGタンパク質(vesicular stomatitis virus G-protein、VSV-G)エンベロープタンパク質(とりわけ、本明細書において以下に記載される)でシュードタイプ化され得、これは、HIVエンベロープタンパク質がウイルスを主にCD4+提示細胞に標的化するので、HIVがより広い範囲の細胞に感染することを可能にする。
本明細書で使用される「トロピズム因子」という用語は、特定の細胞型又は組織型に対するトロピズムを提供する、XDPの表面に組み込まれた成分を指す。トロピズム因子の非限定的な例としては、糖タンパク質、抗体断片(例えば、scFv、ナノボディ、直鎖状抗体など)、受容体、及び標的細胞マーカーに対するリガンドが挙げられる。
「標的細胞マーカー」は、標的細胞によって発現される分子を指し、細胞表面受容体、サイトカイン受容体、抗原、腫瘍関連抗原、糖タンパク質、オリゴヌクレオチド、酵素基質、抗原決定基、又は結合部位(抗体断片若しくは糖タンパク質トロピズム因子のリガンドとして機能し得る標的組織若しくは細胞の表面に存在し得る)が含まれるが、これらに限定されない。
「保存的アミノ酸置換」という用語は、タンパク質における、類似の側鎖を有するアミノ酸残基の互換性を指す。例えば、脂肪族側鎖を有するアミノ酸の群は、グリシン、アラニン、バリン、ロイシン、及びイソロイシンからなり、脂肪族ヒドロキシル側鎖を有するアミノ酸の群は、セリン及びスレオニンからなり、アミド含有側鎖を有するアミノ酸の群は、アスパラギン及びグルタミンからなり、芳香族側鎖を有するアミノ酸群は、フェニルアラニン、チロシン、及びトリプトファンからなり、塩基性側鎖を有するアミノ酸の群は、リジン、アルギニン、及びヒスチジンからなり、硫黄含有側鎖を有するアミノ酸の群は、システイン及びメチオニンからなる。例示的な保存的アミノ酸置換群は、バリン-ロイシン-イソロイシン、フェニルアラニン-チロシン、リジン-アルギニン、アラニン-バリン、及びアスパラギン-グルタミンである。
本明細書で使用される「抗体」という用語は、様々な抗体構造を包含し、モノクローナル抗体、ポリクローナル抗体、多重特異性抗体(例えば、二重特異性抗体)、ナノボディ、単一ドメイン抗体(例えば、VHH抗体)、及び抗体断片(それらが所望の抗原結合活性又は免疫学的活性を示す限り)が含まれるが、これらに限定されない。抗体は、IgD、IgG、IgA、IgM、及びIgEなどのいくつかのタイプの分子を含む分子の大きなファミリーを表す。
「抗体断片」は、インタクトな抗体の一部を含み、かつインタクトな抗体が結合する抗原に結合する、インタクトな抗体以外の分子を指す。抗体断片の例としては、Fv、Fab、Fab’、Fab’-SH、F(ab’)2、ダイアボディ、単鎖ダイアボディ、直鎖状抗体、単一ドメイン抗体、単一ドメインラクダ抗体、単鎖可変断片(scFv)抗体分子、及び多重特異性抗体(抗体断片から形成される)が挙げられるが、これらに限定されない。
本明細書で使用される場合、「治療」又は「治療すること」は、本明細書で互換的に使用され、治療的利益及び/又は予防的利益を含むがこれらに限定されない有益な結果若しくは所望の結果を得るためのアプローチを指す。治療的利益とは、治療される基礎となる障害又は疾患の根絶又は改善を意味する。治療的利益はまた、対象が依然として基礎疾患に罹患している可能性があるにもかかわらず、対象において改善が観察されるような、基礎疾患に関連する1つ以上の症状の根絶若しくは改善、あるいは1つ以上の臨床パラメータの改善により達成することができる。
「治療有効量」及び「治療有効用量」という用語は、本明細書で使用される場合、対象(例えば、ヒト又は実験動物)に単回用量又は反復用量で投与した場合、疾患状態又は病状の任意の症状、態様、測定されたパラメータ、又は特徴に対して任意の検出可能な有益な効果を有することができる、単独での又は組成物の一部としての薬物又は生物製剤の量を指す。かかる効果は、有益であるために絶対的である必要はない。
本明細書で使用される場合、「投与すること」は、化合物(例えば、本開示の組成物)又は組成物(例えば、薬学的組成物)の投与量を対象に与える方法を意味する。
「対象」は、哺乳動物である。哺乳動物としては、家畜、非ヒト霊長類、ヒト、イヌ、ウサギ、マウス、ラット、及び他のげっ歯類が挙げられるが、これらに限定されない。
本明細書で言及される全ての刊行物、特許、及び特許出願は、各個々の刊行物、特許、又は特許出願が、参照により援用されることが具体的かつ個別に示されているかのように、参照により本明細書に援用される。
I.一般的な方法
本発明の実施は、別段の指示がない限り、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノミクス、及び組換えDNAの先行技術を使用し、これらは、標準的な教科書であるMolecular Cloning:A Laboratory Manual,3rd Ed.(Sambrook et al.,Harbor Laboratory Press 2001);Short Protocols in Molecular Biology,4th Ed.(Ausubel et al.eds.,John Wiley & Sons 1999);Protein Methods(Bollag et al.,John Wiley & Sons 1996);Nonviral Vectors for Gene Therapy(Wagner et al.eds.,Academic Press 1999);Viral Vectors(Kaplift & Loewy eds.,Academic Press 1995)、Immunology Methods Manual (I.Lefkovits ed.,Academic Press 1997);及びCell and Tissue Culture:Laboratory Procedures in Biotechnology(Doyle & Griffiths,John Wiley & Sons 1998)に見出すことができる(それらの開示は、参照により本明細書に援用される)。
値の範囲が提供される場合、終点が含まれること、及びその範囲の上限と下限との間の各介在値が、文脈が別途明確に指示しない限り、下限の単位の10分の1まで、その記載された範囲内の任意の他の記載された値又は介在値が包含されることが理解される。これらのより小さい範囲の上限及び下限は、独立して、より小さい範囲に含まれてもよく、また、記載された範囲内の任意の具体的に除外された限界に従って包含される。記載された範囲が限界の一方又は両方を含む場合、それらの含まれる限界のいずれか又は両方を除外する範囲も含まれる。
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、本発明が属する技術分野の当業者によって一般的に理解されているものと同じ意味を有する。本明細書で言及される全ての刊行物は、刊行物が引用される方法及び/又は材料を開示及び記載するために、参照により本明細書に援用される。
本明細書及び添付の特許請求の範囲で使用される場合、単数形である「a」、「an」及び「the」には、文脈上明らかに別段の指示がない限り、その複数の指示対象が含まれることに留意されたい。
明確にするために、別個の実施形態の文脈で説明される本開示の特定の特徴は、単一の実施形態で組み合わせて提供されてもよいことが理解されるであろう。他の場合では、簡潔にするために、単一の実施形態の文脈で説明される本開示の様々な特徴は、別個に又は任意の好適な部分的な組み合わせで提供されてもよい。本開示に関連する実施形態の全ての組み合わせは、本開示によって具体的に包含され、あたかもありとあらゆる組み合わせが個別にかつ明示的に開示されているかのように本明細書に開示されることが意図される。加えて、様々な実施形態及びその要素の全ての部分的な組み合わせもまた、本開示によって具体的に包含され、ありとあらゆるかかる部分的な組み合わせが本明細書に個別にかつ明示的に開示されているかのように本明細書に開示される。
II.遺伝子編集及び遺伝子編集ペアのためのシステム
第1の態様では、本開示は、システムを提供し、遺伝子の標的核酸(コード領域及び非コード領域を含む)を改変又は編集するのに使用するためのクラス2、V型CRISPRヌクレアーゼタンパク質と、1つ以上のガイド核酸(例えば、gRNA)と、を含む。一般に、遺伝子の任意の部分は、本明細書に提供されるプログラム可能なシステム及び方法を使用して標的化され得る。本明細書で使用される場合、遺伝子編集ペアとしての本開示のCRISPRヌクレアーゼタンパク質及び1つ以上のgRNA、並びにCRISPRヌクレアーゼタンパク質及びgRNAをコードする核酸、並びに本開示の核酸又はCRISPRヌクレアーゼタンパク質及び1つ以上のgRNAを含むベクターを含むシステムなどの「システム」は、用語「組成物」と互換的に使用される。
いくつかの実施形態では、本開示は、対象において、インビトロ、エクスビボ、又はインビボのいずれかで、真核細胞における遺伝子の標的核酸を改変するように特別に設計されたシステムを提供する。一般に、遺伝子の任意の部分は、本明細書に提供されるプログラム可能なシステム及び方法を使用して標的化され得る。いくつかの実施形態では、CRISPRヌクレアーゼは、クラス2、V型ヌクレアーゼである。クラス2 V型CRISPR-Casヌクレアーゼのメンバーには相違点があるが、それらは、それらをCas9システムと区別するいくつかの共通の特徴を共有する。まず、V型ヌクレアーゼは、RuvCドメインを含むがHNHドメインを含まないRNA誘導型の単一エフェクターを有し、非標的鎖上の標的領域の5’上流のTCモチーフのPAMを認識する。これは、標的配列の3’側でG-リッチPAMに依存するCas9システムとは異なる。V型ヌクレアーゼは、PAMに近い近位部位に平滑末端を生成するCas9とは異なり、PAM配列に対して遠位にずれた二本鎖切断を生成する。加えて、V型ヌクレアーゼは、シスで結合する標的dsDNA又はssDNAによって活性化された場合、トランスでssDNAを分解する。いくつかの実施形態では、本開示は、Cas12a、Cas12b、Cas12c、Cas12d(CasY)、Cas12j、Cas12k、C2c4、C2c8、C2c5、C2c10、C2c9、CasZ、及びCasXからなる群から選択されるクラス2、V型ヌクレアーゼを提供する。いくつかの実施形態では、本開示は、1つ以上のCasXバリアントタンパク質及び1つ以上のガイド核酸(gRNA)バリアントをCasX: gRNAシステムとして含むシステムを提供する。
本明細書で遺伝子編集ペアと称される、クラス2、V型タンパク質及びgRNAバリアントを含むシステムが本明細書に提供される。いくつかの実施形態では、クラス2、V型バリアントは、CasXバリアント(例えば、限定されないが、配列番号416の配列)である。CasXバリアントタンパク質及びCasXバリアントという用語は、本明細書において互換的に使用される。いくつかの実施形態では、gRNAは、別のgRNAのバリアント(例えば、限定されないが、配列番号2238及び2239の配列)である。gRNA及びCasXタンパク質は、非共有結合性相互作用を介して一緒に結合して、遺伝子編集ペア複合体(本明細書においてリボ核タンパク質(ribonucleoprotein、RNP)複合体と称される)を形成することができる。いくつかの実施形態では、予め複合体化されたCasX: gRNA RNPの使用は、標的核酸の編集のための細胞又は標的核酸へのシステム成分の送達において利点を付与する。RNPにおいて、gRNAは、標的核酸配列の配列に相補的であるヌクレオチド配列を有する標的化配列(又は「スペーサー」)を含むことによって、RNP複合体に標的特異性を提供することができる。RNPにおいて、予め複合体化されたCasX: gRNAのCasXタンパク質は、特異的活性を提供し、gRNAとのその会合によって、改変される標的核酸配列内の標的部位に誘導される(例えば、標的部位で更に安定化される)。RNP複合体のCasXバリアントタンパク質は、CasXタンパク質による標的配列の結合、切断、又はニッキングなどの複合体の部位特異的活性を提供する。本明細書において、本明細書に記載の実施形態のCasXバリアントタンパク質、gRNAバリアント、及びCasXバリアントとgRNAバリアントとの任意の組み合わせのCasX: gRNA遺伝子編集ペア、並びにCasX: gRNAを含む送達様式、を含むシステム及び細胞が提供される。これらの成分の各々及び遺伝子の標的核酸の編集におけるそれらの使用は、以下で本明細書に記載される。
いくつかの実施形態では、本開示は、表3のCasXバリアントタンパク質(配列番号247~592及び1147~1231、又はそれと少なくとも約85%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列のうちのいずれか1つから選択されるCasXバリアントタンパク質を含む遺伝子編集ペアのシステムを提供し、一方、gRNAは、本明細書に記載されるgRNAバリアント(例えば、表2に示される配列番号2101~2332及び2353~2398)、又はそれと少なくとも60%、若しくは少なくとも70%、少なくとも約80%、若しくは少なくとも約90%、若しくは少なくとも約95%の配列同一性を有する配列バリアントであり、gRNAが、標的核酸に相補的な標的化配列を含む。いくつかの実施形態では、本開示は、表3のCasXバリアントタンパク質(配列番号270~592及び1147~1231)のうちのいずれか1つから選択されるCasXバリアントタンパク質を含む遺伝子編集ペアのシステムを提供し、一方、gRNAは、本明細書に記載されるgRNAバリアント(例えば、配列番号2238~2332及び2353~2398)であり、gRNAが、標的核酸に相補的な標的化配列を含む。いくつかの実施形態では、本開示は、表3のCasXバリアントタンパク質(配列番号415~592及び1147~1231)のうちのいずれか1つから選択されるCasXバリアントタンパク質を含む遺伝子編集ペアのシステムを提供し、一方、gRNAは、本明細書に記載されるgRNAバリアント(例えば、配列番号2281~2332及び2353~2398)であり、gRNAが、標的核酸に相補的な標的化配列を含む。他の実施形態では、本開示は、CasXバリアントタンパク質、標的化配列を有する本明細書に記載される第1のgRNAバリアント(例えば、表2に示される配列番号2101~2332又は2353~2398)、及び第2のgRNAバリアントを含む遺伝子編集ペアのシステムを提供し、第2のgRNAバリアントが、第1のgRNAの標的化配列と比較して、標的核酸の異なる部分又は重複する部分に相補的な標的化配列を有する。他の実施形態では、本開示は、CasXバリアントタンパク質、標的化配列を有する本明細書に記載される第1のgRNAバリアント(例えば、配列番号2101~2332又は2353~2398)、及び第2のgRNAバリアントを含む遺伝子編集ペアのシステムを提供し、第2のgRNAバリアントが、第1のgRNAの標的化配列と比較して、標的核酸の異なる部分又は重複する部分に相補的な標的化配列を有する。他の実施形態では、本開示は、CasXバリアントタンパク質、標的化配列を有する本明細書に記載される第1のgRNAバリアント(例えば、配列番号2281~2332又は2353~2398)、及び第2のgRNAバリアントを含む遺伝子編集ペアのシステムを提供し、第2のgRNAバリアントが、第1のgRNAの標的化配列と比較して、標的核酸の異なる部分又は重複する部分に相補的な標的化配列を有する。本開示のCasX: gRNA遺伝子編集ペアのいくつかの実施形態では、CasXバリアントタンパク質は、表3のCasXバリアントタンパク質515、528、529、534~539、668、672、及び678(配列番号416、428、434~439、567、570、及び576)からなる群から選択され、sgRNAバリアントは、表2のgRNAバリアント229~237(配列番号2286~2294)からなる群から選択される。特定の実施形態では、遺伝子編集ペアは、CasXバリアントタンパク質668(配列番号567)、672(配列番号570)、又は676(配列番号574)のうちのいずれか1つから選択されるCasXバリアントタンパク質と、gRNAバリアント235(配列番号2292)と、を含む。
いくつかの実施形態では、遺伝子編集ペアは、一緒に会合してリボ核タンパク質複合体(RNP)を形成することができる。他の実施形態では、遺伝子編集ペアは、リボ核タンパク質複合体(RNP)中で一緒に会合している。いくつかの実施形態では、遺伝子編集ペアのRNPは、コード配列、コード配列の相補体、非コード配列、及び調節エレメントを含む標的核酸の二本鎖に結合し、切断することができる。いくつかの実施形態では、遺伝子編集ペアのRNPは、標的核酸に結合し、標的核酸において1つ以上の一本鎖ニックを生成することができる。いくつかの実施形態では、遺伝子編集ペアのRNPは、標的核酸に結合することができるが、標的核酸を切断することはできない。
いくつかの実施形態では、バリアント遺伝子編集ペアは、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質と、配列番号5又は配列番号4の参照gRNAと、を含む参照遺伝子編集ペアと比較して、1つ以上の改善された特徴を有する。他の実施形態では、CasXバリアント及びgRNAバリアントのバリアント遺伝子編集ペアは、そのバリアントが由来したCasXバリアント(例えば、CasX515、配列番号416)と、そのバリアントが由来したgRNAバリアント(例えば、gRNA足場174(配列番号2238)又は175(配列番号2239))と、を含む遺伝子編集ペアと比較して、1つ以上の改善された特徴を有する。前述の実施形態では、1つ以上の改善された特徴は、遺伝子編集ペア並びに参照CasX及び参照gRNAについて同等の条件下でインビトロアッセイにおいてアッセイすることができる。本明細書に記載されるように、例示的な改善された特徴としては、いくつかの実施形態では、CasX: gRNA RNP複合体の安定性、CasXとgRNAとの間の結合親和性の増加、RNP複合体形成の動態の改善、より高い割合の切断コンピテントRNP、標的核酸に対するRNP結合親和性の増加、標的核酸の巻き戻し、編集活性の増加、編集効率の増加、標的核酸に対する編集特異性の増加、オフターゲット編集若しくは切断の減少、ヌクレアーゼの活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、DNAの非標的鎖の結合の増加、又はヌクレアーゼ活性に対する耐性の増加を挙げることができる。前述の実施形態では、改善は、参照CasXタンパク質及び参照gRNAペアの特徴、又は遺伝子編集ペアが由来したCasXバリアント及びgRNAバリアントの特徴と比較して、少なくとも約2倍、少なくとも約5倍、少なくとも約10倍、少なくとも約50倍、少なくとも約100倍、少なくとも約500倍、少なくとも約1000倍、少なくとも約5000倍、少なくとも約10,000倍、又は少なくとも約100,000倍である。他の場合では、改善された特徴のうちの1つ以上は、参照遺伝子編集ペア、又は遺伝子編集ペアが由来したCasXバリアント及びgRNAバリアントの特徴と比較して、約1.1~100,00倍、約1.1~10,00倍、約1.1~1,000倍、約1.1~500倍、約1.1~100倍、約1.1~50倍、約1.1~20倍、約10~100,00倍、約10~10,00倍、約10~1,000倍、約10~500倍、約10~100倍、約10~50倍、約10~20倍、約2~70倍、約2~50倍、約2~30倍、約2~20倍、約2~10倍、約5~50倍、約5~30倍、約5~10倍、約100~100,00倍、約100~10,00倍、約100~1,000倍、約100~500倍、約500~100,00倍、約500~10,00倍、約500~1,000倍、約500~750倍、約1,000~100,00倍、約10,000~100,00倍、約20~500倍、約20~250倍、約20~200倍、約20~100倍、約20~50倍、約50~10,000倍、約50~1,000倍、約50~500倍、約50~200倍、又は約50~100倍改善され得る。他の場合では、改善された特徴のうちの1つ以上は、参照遺伝子編集ペア、又は遺伝子編集ペアが由来したCasXバリアント及びgRNAバリアントの特徴と比較して、約1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、40倍、45倍、50倍、55倍、60倍、70倍、80倍、90倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍、180倍、190倍、200倍、210倍、220倍、230倍、240倍、250倍、260倍、270倍、280倍、290倍、300倍、310倍、320倍、330倍、340倍、350倍、360倍、370倍、380倍、390倍、400倍、425倍、450倍、475倍、若しくは500倍、又はそれ以上改善され得る。
いくつかの実施形態では、遺伝子編集ペアが、本明細書に記載されるCasXバリアントタンパク質及びgRNAバリアントの両方を含み、遺伝子編集ペアの1つ以上の特徴は、CasXタンパク質又はgRNA単独を変化させることによって達成され得るものを超えて改善されている。いくつかの実施形態では、CasXバリアントタンパク質及びgRNAバリアントは、相加的に作用して、遺伝子編集ペアの1つ以上の特徴を改善する。いくつかの実施形態では、CasXバリアントタンパク質及びgRNAバリアントは、相乗的に作用して、遺伝子編集ペアの1つ以上の特徴を改善する。前述の実施形態では、改善は、参照CasXタンパク質及び参照gRNAペアの特徴、又は遺伝子編集ペアが由来したCasXバリアント及びgRNAバリアントの特徴と比較して、少なくとも約2倍、少なくとも約5倍、少なくとも約10倍、少なくとも約50倍、少なくとも約100倍、少なくとも約500倍、少なくとも約1000倍、少なくとも約5000倍、少なくとも約10,000倍、又は少なくとも約100,000倍である。
いくつかの実施形態では、本開示は、疾患を有する対象の治療のための医薬品として使用するための、本明細書に開示される実施形態のいずれかの遺伝子編集ペアの組成物を提供する。
他の実施形態では、本開示のシステムは、1つ以上のCasXバリアントタンパク質と、1つ以上のガイド核酸(gRNA)と、遺伝子の一部をコードする核酸を含む1つ以上のドナー鋳型核酸と、を含み、ドナー鋳型核酸が、変異を修正するための野生型配列を含むか、又は遺伝子をノックダウン若しくはノックアウトするための野生型ゲノム核酸配列と比較して、1つ以上のヌクレオチドの欠失、挿入、若しくは変異を含む。
他の実施形態では、本開示は、CasXバリアント、gRNAバリアント、並びに任意選択的にCasX:gRNAシステムの産生及び/又は送達のためのドナー鋳型をコードする若しくは含むベクターを提供する。また、遺伝子編集方法及び治療方法を含む、CasXバリアントタンパク質及びgRNAバリアントを作製する方法、並びにCasXバリアント及びgRNAバリアントを使用する方法も本明細書に提供される。CasX: gRNAシステムのCasXバリアントタンパク質及びgRNAバリアント成分、及びそれらの特徴、並びに送達様式及びシステムを使用する方法が、以下でより詳細に記載される。
CasX: gRNAシステムのドナー鋳型は、標的遺伝子における変異を修正するために利用されるか、ゲノムにおいて異なる遺伝子座で導入遺伝子を挿入する(「ノックイン」する)ために利用されるか、又は異常である遺伝子産物(例えば、遺伝子産物の発現を減少させる若しくはタンパク質を機能不全にする1つ以上の変異を含む)の発現を破壊する(「ノックダウン」若しくは「ノックアウト」する)ために利用されるかに応じて設計される。いくつかの実施形態では、ドナー鋳型は、一本鎖DNA鋳型又は一本鎖RNA鋳型である。他の実施形態では、ドナー鋳型は、二本鎖DNA鋳型である。いくつかの実施形態では、標的核酸の編集において利用されるCasX:gRNAシステムは、欠陥タンパク質を修正するための修正野生型配列の挿入のための、標的核酸における遺伝子のオープンリーディングフレームの全て又は少なくとも一部を有するドナー鋳型を含む。他の場合では、ドナー鋳型は、遺伝子産物の発現のためにゲノムにおける異なる遺伝子座に挿入するための野生型遺伝子の全部又は一部を含む。更に他の場合では、遺伝子の一部は、標的核酸における変異の上流(’5)に挿入され得、ドナー鋳型遺伝子部分は、遺伝子のC末端又は変異を有する配列の3’末端まで広がり、標的核酸へのその挿入の際に、機能的遺伝子産物の発現をもたらす。
いくつかの実施形態では、ドナー鋳型配列は、標的核酸の切断部位に対して5’側及び3’側の2つの相同領域(すなわち、相同アーム)に隣接する非相同配列を含み、標的領域での、相同組換え修復(HDR)又は相同性非依存性標的化組み込み(homology-independent targeted integration、HITI)によって媒介され得る非相同配列の挿入を容易にする。HITIによって挿入される外因性ドナー鋳型は、任意の長さ、例えば、10~50ヌクレオチド長の比較的短い配列、又は約50~1000ヌクレオチド長のより長い配列であり得る。相同性の欠如は、例えば、20~50%以下の配列同一性を有すること、及び/又は低い厳密性での特異的なハイブリダイゼーションを欠くことであり得る。他の場合では、相同性の欠如は、5、6、7、8、又は9bp以下の同一性を有するという基準を更に含み得る。このような場合、相同アームの使用は、ヌクレアーゼによって導入される切断部位での非相同配列の挿入を容易にする。いくつかの実施形態では、ドナー鋳型ポリヌクレオチドは、少なくとも約10、少なくとも約50、少なくとも約100、又は少なくとも約200、又は少なくとも約300、又は少なくとも約400、又は少なくとも約500、又は少なくとも約600、又は少なくとも約700、又は少なくとも約800、又は少なくとも約900、又は少なくとも約1000、又は少なくとも約10,000、又は少なくとも約15,000ヌクレオチドを含む。他の実施形態では、ドナー鋳型は、少なくとも約10~約15,000ヌクレオチド、又は少なくとも約100~約10,000ヌクレオチド、又は少なくとも約400~約8,000ヌクレオチド、又は少なくとも約600~約5000ヌクレオチド、又は少なくとも約1000~約2000ヌクレオチドを含む。ドナー鋳型配列は、ゲノム配列と比較して、特定の配列例えば、制限部位、ヌクレオチド多型、選択マーカー(例えば、薬剤耐性遺伝子、蛍光タンパク質、酵素など)などの差異を含み得、これらは、切断部位でのドナー核酸の挿入の成功を評価するために使用され得るか、又は場合によっては、他の目的のために(例えば、標的ゲノム遺伝子座における発現を示すために)使用され得る。代替的に、これらの配列の差異は、マーカー配列の除去のために後で活性化され得る、隣接する組換え配列(例えば、FLP配列、loxP配列など)を含み得る。
III.遺伝子編集のためのシステムのガイド核酸
別の態様では、本開示は、特別に設計されたガイドリボ核酸(gRNA)に関し、遺伝子の標的核酸配列に相補的な(したがって、それとハイブリダイズすることができる)標的化配列(本明細書においてスペーサーとも称される)を含み、これは、CRISPRヌクレアーゼと複合体化した場合、細胞における標的核酸のゲノム編集において有用である。いくつかの実施形態では、複数のgRNAが、標的核酸の改変のためにシステムにおいて送達されることが想定される。例えば、遺伝子内の2つの異なる部位又は重複する部位で結合及び切断するために、各々がCRISPRヌクレアーゼと複合体化する場合、標的核酸配列の異なる領域又は重複する領域に対する標的化配列を有する一対のgRNAを使用することができ、次いで、遺伝子は、非相同末端結合(NHEJ)、相同組換え修復(HDR)、相同性非依存性標的化組み込み(HITI)、マイクロホモロジー媒介末端結合(MMEJ)、一本鎖アニーリング(single strand annealing、SSA)、又は塩基除去修復(base excision repair、BER)によって編集される。
いくつかの実施形態では、本開示は、システムにおいて利用されるgRNAを提供し、これは、真核細胞における遺伝子のゲノム編集において有用性を有する。特定の実施形態では、システムのgRNAは、以下でより詳細に記載される、CRISPRヌクレアーゼとの複合体(リボ核タンパク質(RNP)複合体)を形成することができる。
a.参照gRNA及びgRNAバリアント
本明細書で使用される場合、「参照gRNA」は、天然に存在するgRNAの野生型配列を含むCRISPRガイド核酸を指す。いくつかの実施形態では、本開示の参照gRNAは、参照gRNAと比較して、特性が強化された又は変化した1つ以上のガイド核酸バリアント(本明細書において「gRNAバリアント」と称される)を生成するために、1つ以上の変異誘発方法、例えば、実施例において本明細書に記載の変異誘発方法(例えば、実施例13、並びに国際出願PCT/US20/36506号及び国際公開第2020247883(A2)号(参照により本明細書に組み込まれる))に供され得、変異誘発方法としては、網羅的変異進化(Deep Mutational Evolution、DME)、網羅的変異スキャニング(deep mutational scanning、DMS)、エラープローンPCR、カセット変異誘発、ランダム変異誘発、付着伸長PCR(staggered extension PCR)、遺伝子シャフリング、又はドメインスワッピングが挙げられる。gRNAバリアントはまた、例えば、5’末端若しくは3’末端のいずれかに融合された又は内部に挿入された、1つ以上の外因性配列を含むバリアントも含む。参照gRNA又はそれが由来するバリアントの活性は、それに対してgRNAバリアントの活性が比較されるベンチマークとして使用されてもよく、それによって、gRNAバリアントの機能又は他の特徴の改善が測定される。他の実施形態では、参照gRNA又はgRNAバリアントは、gRNAバリアント(例えば、合理的に設計されたバリアント)を産生するために、1つ以上の意図的な特異的に標的化された変異に供され得る。
本開示のgRNAは、2つのセグメントである標的化配列及びタンパク質結合セグメントを含む。gRNAの標的化セグメントは、以下でより詳細に記載される標的核酸配列(例えば、標的ssRNA、標的ssDNA、二本鎖標的DNAの鎖など)内の特定の配列(標的部位)に相補的である(したがって、それとハイブリダイズする)ヌクレオチド配列(互換的に、ガイド配列、スペーサー、ターゲッター、又は標的化配列と称される)を含む。gRNAの標的化配列は、標的核酸配列(コード配列、コード配列の相補体、非コード配列を含む)及び調節エレメントに結合することができる。タンパク質結合セグメント(又は「アクチベーター」若しくは「タンパク質結合配列」)は、RNPを形成する複合体として、CasXタンパク質と相互作用(例えば、結合)する(以下でより詳細に記載される)。代替的には、タンパク質結合セグメントは、本明細書で「足場(scaffold)」と呼ばれ、これは、いくつかの領域から構成される(以下でより詳細に記載される)。
デュアルガイドRNA(dgRNA)の場合、ターゲッター部分及びアクチベーター部分は各々、二重鎖形成セグメントを有し、ターゲッターの二重鎖形成セグメント及びアクチベーターの二重鎖形成セグメントは、互いに相補性を有し、互いにハイブリダイズして二本鎖の二重鎖(gRNAについてはdsRNA二重鎖)を形成する。gRNAがgRNAである場合、「ターゲッター」又は「ターゲッターRNA」という用語は、本明細書において、CasXデュアルガイドRNAの(したがって、「アクチベーター」及び「ターゲッター」が、例えば、介在ヌクレオチドによって一緒に連結されている場合、CasXシングルガイドRNAの)crRNA様分子(crRNA:「CRISPR RNA」)を指すために使用される。crRNAは、tracrRNAとアニーリングする5’領域、続いて、標的化配列のヌクレオチドを有する。したがって、例えば、ガイドRNA(dgRNA又はsgRNA)は、ガイド配列と、crRNAの二重鎖形成セグメント(crRNAリピートとも称され得る)と、を含む。対応するtracrRNA様分子(アクチベーター)はまた、ガイドRNAのタンパク質結合セグメントのdsRNA二重鎖の他の半分を形成するヌクレオチドの二重鎖形成ストレッチも含む。したがって、ターゲッター及びアクチベーターは、対応する対としてハイブリダイズして、デュアルガイドRNA(本明細書において「二種分子gRNA」、「dgRNA」、「二重分子ガイドRNA」、又は「2分子ガイドRNA」と称される)を形成する。CasXタンパク質による標的核酸配列(例えば、ゲノムDNA)の部位特異的結合及び/又は切断は、gRNAの標的化配列と標的核酸配列との間の塩基対形成の相補性によって決定される1つ以上の位置(例えば、標的核酸の配列)で起こり得る。したがって、例えば、本開示のgRNAは、TC PAMモチーフ又はPAM配列(ATC、CTC、GTC、若しくはTTCなどに相補的な配列に隣接する標的核酸に相補的な配列を有し、したがって、標的核酸とハイブリダイズすることができる。ガイド配列の標的化配列は標的核酸配列の配列とハイブリダイズするので、PAM配列の位置が考慮される限り、特定の標的核酸配列とハイブリダイズするように、使用者によってターゲッターが改変され得る。したがって、場合によっては、ターゲッターの配列は、天然に存在しない配列に相補的であり得る。他の場合では、ターゲッターの配列は、編集される遺伝子に対する相補体に由来する天然に存在する配列であり得る。他の実施形態では、gRNAのアクチベーター及びターゲッターは、(互いにハイブリダイズするのではなく)互いに共有結合しており、単一分子(本明細書において、「単一分子gRNA」、「シングルガイドRNA」、「単一分子ガイドRNA」、「1分子ガイドRNA」、又は「sgRNA」と称される)を含む。いくつかの実施形態では、sgRNAは、「アクチベーター」又は「ターゲッター」を含み、したがって、それぞれ「アクチベーターRNA」及び「ターゲッターRNA」であり得る。いくつかの実施形態では、gRNAは、リボ核酸分子(「gRNA」)であり、他の実施形態では、gRNAは、キメラであり、DNA及びRNAの両方を含む。本明細書で使用される場合、gRNAという用語は、天然に存在する分子、並びに配列バリアントを(例えば、天然に存在しない改変されたヌクレオチド)包含する。
まとめると、本開示の構築されたgRNAは、4つの別個の領域又はドメイン、すなわち、RNA三重鎖、足場ステム、伸長ステム、及び標的化配列(本開示の実施形態では標的核酸に特異的であり、gRNAの3’末端に位置する)を含む。RNA三重鎖、足場ステム、及び伸長ステムは、合わせて、gRNAの「足場」(gRNA足場)と称される。本開示のgRNA足場は、RNA、又はRNA及びDNAを含み得る。gRNA足場は、ウラシル(U)を含むことができ、1つ以上のウラシルが、チミン(T)によって置き換えられ得る。
b.RNA三重鎖
本明細書に提供されるガイドRNAのいくつかの実施形態では、gRNAが、RNA三重鎖を含み、RNA三重鎖が、場合によっては、2つの介在ステムループ(足場ステムループ及び伸長ステムループ)の後にAAAGで終わるUUU-N(約4~15)-UUUステムループ(配列番号241)の配列を含み、三重鎖を越えて二重鎖シュードノットへと伸長してもよいシュードノットを形成する。三重鎖のUU-UUU-AAA配列は、標的化配列と、足場ステムと、伸長ステムとの間のネクサスとして形成される。例示的なgRNAでは、UUU-ループ-UUU領域が最初にコードされ、次いで、足場ステムループがコードされ、次いで、テトラループによって連結された伸長ステムループがコードされ、次いで、AAAGが三重鎖を閉じてから標的化配列になる。
c.足場ステムループ
本開示のgRNAのいくつかの実施形態では、三重鎖領域の後に足場ステムループが続く。足場ステムループは、RNPが形成される場合、CasXタンパク質(例えば、参照又はCasXバリアントタンパク質)が結合するgRNAの領域である。いくつかの実施形態では、足場ステムループは、かなり短く安定なステムループであり、gRNAの全体的な安定性を増加させる。場合によっては、足場ステムループは、多くの変化を許容せず、何らかの形態のRNAバブルを必要とする。いくつかの実施形態では、足場ステムは、gRNAの機能に必要である。これは、おそらく、重要なステムループであるCas9ガイドのネクサスステムに類似しているが、gRNAの足場ステムは、いくつかの実施形態では、必要なバルジ(RNAバブル)を有し、これは、CRISPR/Casシステムで見出される多くの他のステムループとは異なる。いくつかの実施形態では、このバルジの存在は、異なるCasXタンパク質と相互作用するgRNAにわたって保存されている。gRNAの足場ステムループ配列の例示的な配列は、配列CCAGCGACUAUGUCGUAUGG(配列番号242)を含む。
d.伸長ステムループ
本開示のgRNAのいくつかの実施形態では、足場ステムループの後に伸長ステムループが続く。いくつかの実施形態では、伸長ステムは、主にCasXタンパク質が結合していない合成tracrRNA及びcrRNA融合体を含む。いくつかの実施形態では、伸長ステムループは、高度に可鍛性であり得る。いくつかの実施形態では、シングルガイドgRNAは、伸長ステムループ中のtracrRNAとcrRNAとの間にGAAAテトラループリンカー又はGAGAAAリンカーを用いて作製される。場合によっては、sgRNAのターゲッター及びアクチベーターは、介在ヌクレオチドによって互いに連結され、リンカーは、3~20ヌクレオチドの長さを有し得る。本開示のsgRNAのいくつかの実施形態では、伸長ステムは、リボ核タンパク質複合体中のCasXタンパク質の外側に位置する大きな32bpのループである。参照gRNAの伸長ステムループ配列の例示的な配列は、配列GCGCUUAUUUAUCGGAGAGAAAUCCGAUAAAUAAGAAGC(配列番号15)を含む。
e. 標的化配列
本開示のgRNAのいくつかの実施形態では、伸長ステムループの後に、三重鎖の一部を形成する領域が続き、次いで、gRNAの3’末端に標的化配列(又は「スペーサー」)が続く。標的化配列は、CasXリボ核タンパク質ホロ複合体を、改変される遺伝子の標的核酸配列の特定の領域に標的化する。したがって、例えば、本開示のgRNA標的化配列は、TC PAMモチーフ又はPAM配列TTC、ATC、GTC、若しくはCTCのうちのいずれか1つが、標的配列に相補的な非標的鎖配列に対して1ヌクレオチド5’側に位置する場合、RNPの成分として、真核細胞の標的核酸(例えば、真核生物の染色体、染色体配列など)における遺伝子の一部に相補的な(したがって、それにハイブリダイズすることができる)配列を有する。gRNAの標的化配列は、PAM配列の位置が考慮される限り、gRNAが任意の所望の標的核酸配列の所望の配列を標的化することができるように改変することができる。いくつかの実施形態では、gRNA足場は、標的配列の5’側にあり、標的化配列が、gRNAの3’末端にある。いくつかの実施形態では、RNPのヌクレアーゼによって認識されるPAMモチーフ配列は、TCである。他の実施形態では、RNPのヌクレアーゼによって認識されるPAM配列は、NTC(すなわち、ATC、CTC、GTC、又はTTC)である。
いくつかの実施形態では、本開示は、gRNAを提供し、gRNAの標的化配列は、改変される遺伝子の標的核酸配列に相補的である。いくつかの実施形態では、gRNAの標的化配列は、遺伝子の標的核酸配列に相補的であり、変異を含む配列を本開示のCasX: gRNAシステムで編集する目的で、野生型遺伝子配列と比較して1つ以上の変異を含む。このような場合、CasX: gRNAシステムによってもたらされる改変は、変異を修正若しくは補償することができるか、又は変異遺伝子産物の発現をノックダウン若しくはノックアウトすることができる。他の実施形態では、gRNAの標的化配列は、遺伝子をノックダウン又はノックアウトするために、本開示のCasX: gRNAシステムで変異を導入する配列を編集する目的で、野生型遺伝子の標的核酸配列に相補的である。いくつかの実施形態では、gRNAの標的化配列は、標的核酸の遺伝子のエキソンに特異的であるように設計される。他の実施形態では、gRNAの標的化配列は、標的核酸の遺伝子のイントロンに特異的であるように設計される。他の実施形態では、gRNAの標的化配列は、標的核酸の遺伝子のイントロン-エキソン接合部に特異的であるように設計される。いくつかの実施形態では、gRNAの標的化配列は、遺伝子の調節エレメントに特異的であるように設計される。いくつかの実施形態では、gRNAの標的化配列は、遺伝子における1つ以上の一塩基多型(single nucleotide polymorphism、SNP)を含む配列に相補的であるように設計される。コード配列内又は非コード配列内にあるSNPは、両方とも本開示の範囲内である。他の実施形態では、gRNAの標的化配列は、標的核酸の遺伝子の遺伝子間領域の配列に相補的であるように設計される。
いくつかの実施形態では、標的化配列は、遺伝子産物の発現を調節する調節エレメントに特異的であるように設計される。かかる調節エレメントとしては、プロモーター領域、エンハンサー領域、遺伝子間領域、5’非翻訳領域(5’ untranslated region、5’UTR)、3’非翻訳領域(3’ untranslated region、3’UTR)、保存されたエレメント、及びシス調節エレメントを含む領域が挙げられるが、これらに限定されない。プロモーター領域は、コード配列の開始点から5kb以内のヌクレオチドを包含することが意図され、又は遺伝子エンハンサーエレメント若しくは保存されたエレメントの場合、標的核酸の遺伝子のコード配列から数千bp、数十万bp、又は更に数百万bp離れていてもよい。前述において、標的は、遺伝子産物が細胞において発現されない又はより低いレベルで発現されるように、標的のコード遺伝子がノックアウト又はノックダウンされることが意図される標的である。
いくつかの実施形態では、gRNAの標的化配列は、14~35個の連続したヌクレオチドを有する。いくつかの実施形態では、gRNAの標的化配列は、10~30個の連続したヌクレオチドを有する。いくつかの実施形態では、標的化配列は、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、又は30個の連続したヌクレオチドを有する。他の実施形態では、gRNAの標的化配列は、20個の連続したヌクレオチドからなる。いくつかの実施形態では、標的化配列は、19個の連続したヌクレオチドからなる。いくつかの実施形態では、標的化配列は、18個の連続したヌクレオチドからなる。いくつかの実施形態では、標的化配列は、17個の連続したヌクレオチドからなる。いくつかの実施形態では、標的化配列は、16個の連続したヌクレオチドからなる。いくつかの実施形態では、標的化配列は、15個の連続したヌクレオチドからなる。いくつかの実施形態では、標的化配列は、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、又は30個の連続したヌクレオチドを有し、標的化配列は、標的核酸配列に対して0~5、0~4、0~3、又は0~2個のミスマッチを含むことができ、標的化配列を含むgRNAを含むRNPが標的核酸に対して相補的な結合を形成することができるように十分な結合特異性を保持することができる。
いくつかの実施形態では、CasX: gRNAシステムは、第1のgRNAを含み、第2(及び任意選択的に、第3、第4、第5、又はそれ以上)のgRNAを更に含み、第2のgRNA又は追加のgRNAが、第1のgRNAの標的化配列と比較して、標的核酸配列の異なる部分又は重複する部分に相補的な標的化配列を有し、その結果、標的核酸において複数の点が標的化され、例えば、CasXによって標的核酸において複数の切断が導入される。そのような場合、第2の又は追加のgRNAは、CasXタンパク質の追加のコピーと複合体化されることが理解されるであろう。gRNAの標的化配列の選択によって、変異を囲む標的核酸配列の規定された領域を、本明細書に記載のCasX: gRNAシステムを使用して改変又は編集することができ、例えば、変異反復が生じる場合、又は場合によっては、変異を含むエキソンの除去がそれでも機能的な遺伝子産物の発現をもたらす場合、ドナー鋳型の挿入又は切断部位間のDNAの切除を容易にすることが含まれる。
f.gRNA足場
標的化配列領域を除いて、gRNAの残りの領域は、本明細書において足場と称される。いくつかの実施形態では、gRNA足場は、参照gRNAとして以下に記載される天然に存在する配列に由来する。他の実施形態では、gRNA足場は、他のgRNAバリアントのバリアントであり、変異、挿入、欠失、又はドメイン置換が導入されて、gRNAに望ましい特性を付与する。
いくつかの実施形態では、参照gRNAは、Deltaproteobacteriaから単離又は誘導された配列を含む。いくつかの実施形態では、配列はCasX tracrRNA配列である。Deltaproteobacteriaから単離又は誘導された例示的な参照tracrRNA配列は、ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA(配列番号6)及びACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG(配列番号7)を含み得る。Deltaproteobacteriaから単離又は誘導された例示的なcrRNA配列は、CCGAUAAGUAAAACGCAUCAAAG(配列番号243)の配列を含み得る。
いくつかの実施形態では、参照ガイドRNAは、Planctomycetesから単離又は誘導された配列を含む。いくつかの実施形態では、配列は、tracrRNAである。Planctomycetesから単離又は誘導された例示的な参照tracrRNA配列は、UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(配列番号8)及び
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(配列番号9)を含み得る。Planctomycetesから単離又は誘導された例示的なcrRNA配列は、UCUCCGAUAAAUAAGAAGCAUCAAAG(配列番号244)の配列を含み得る。
いくつかの実施形態では、参照gRNAは、Candidatus Sungbacteriaから単離又は誘導された配列を含む。Candidatus Sungbacteriaから単離又は誘導された例示的なCasX参照tracrRNA配列は、GUUUACACACUCCCUCUCAUAGGGU(配列番号10)、GUUUACACACUCCCUCUCAUGAGGU(配列番号11)、UUUUACAUACCCCCUCUCAUGGGAU(配列番号12)及びGUUUACACACUCCCUCUCAUGGGGG(配列番号13)の配列を含み得る。
表1は、参照gRNA tracr、crの配列及び足場配列を提供する。いくつかの実施形態では、本開示は、gRNAバリアント配列を提供し、gRNAが、表1の配列番号4~16のうちのいずれか1つの配列を有する参照gRNA配列と比較して少なくとも1つのヌクレオチド改変を有する配列を含む足場を有する。ベクターがgRNAの配列をコードするDNAを含むか又はgRNAがRNA及びDNAのキメラである実施形態では、チミン(T)塩基が、本明細書に記載のgRNA配列の実施形態のいずれかのウラシル(U)塩基に置換され得ることが理解されるであろう。
g.gRNAバリアント
別の態様では、本開示は、gRNAバリアントに関し、参照gRNA足場に対して1つ以上の改変を含むか、又は別のgRNAバリアントに由来する。本明細書で使用される場合、「足場」とは、標的化配列を除いて、gRNAの機能に必要なgRNAの全ての部分を指す。
いくつかの実施形態では、gRNAバリアントは、本開示の参照gRNA配列と比較して、1つ以上のヌクレオチド置換、挿入、欠失、又はスワップ若しくは置換された領域を含む。いくつかの実施形態では、変異は、gRNAバリアントを生成するために、参照gRNA足場の任意の領域において生じ得る。いくつかの実施形態では、gRNAバリアント配列の足場は、配列番号4又は配列番号5の配列と少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、又は少なくとも70%、少なくとも80%、少なくとも85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する。他の実施形態では、gRNAバリアントは、本開示のgRNAバリアント配列と比較して、1つ以上のヌクレオチド置換、挿入、欠失、又はスワップ若しくは置換された領域を含む。いくつかの実施形態では、gRNAバリアント配列の足場は、配列番号2238又は配列番号2239の配列と少なくとも50%、少なくとも60%、又は少なくとも70%、少なくとも80%、少なくとも85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する。
いくつかの実施形態では、gRNAバリアントは、参照gRNA足場の1つ以上の領域内に、参照gRNAの特徴を改善する1つ以上のヌクレオチド変化を含む。他の実施形態では、gRNAバリアントは、そのgRNAと比較して特徴を改善する、それが由来するgRNAバリアント足場の1つ以上の領域内に1つ以上のヌクレオチド変化を含む。例示的な領域としては、RNA三重鎖、シュードノット、足場ステムループ、及び伸長ステムループが挙げられる。場合によっては、バリアント足場ステムは、バブルを更に含む。他の場合では、バリアント足場は、三重鎖ループ領域を更に含む。更に他の場合では、バリアント足場は、5’非構造化領域を更に含む。いくつかの実施形態では、gRNAバリアント足場は、配列番号14と少なくとも60%の配列同一性、少なくとも70%の配列同一性、少なくとも80%の配列同一性、少なくとも90%の配列同一性、少なくとも95%の配列同一性、又は少なくとも99%の配列同一性を有する足場ステムループを含む。他の実施形態では、gRNAバリアントは、CCAGCGACUAUGUCGUAGUGG(配列番号245)の配列を有する足場ステムループを含む。他の実施形態では、本開示は、配列番号5に対して、C18G置換、G55挿入、U1欠失、並びに改変された伸長ステムループ(元の6ntループ及びループに対して最も近位の(most-loop-proximal)13塩基対(合計32ヌクレオチド)が、Uvsxヘアピン(4ntループ及びループに対して最も近位の5塩基対;合計14ヌクレオチド)に置換され、伸長ステムのループに対して遠位の(loop-distal)塩基が、A99欠失及びG65U置換によって新しいUvsxヘアピンに隣接する完全に塩基対合したステムに変換された)を提供する。前述の実施形態では、gRNA足場は、gRNAバリアント174であり、配列ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAGUGGGUAAAGCUCCCUCUUCGGAGGGAGCAUCAAAG(配列番号2238)を含む。
バリアントgRNAを参照gRNA又は本明細書に記載の新しいgRNAバリアントを生成するために変異誘発されたgRNAバリアントと比較した場合、1つ以上の改善された特徴を有する又1つ以上の新しい機能を追加する全てのgRNAバリアントは、本開示の範囲内であると想定される。かかるgRNAバリアントの代表例は、ガイド235(配列番号2292)であり、その設計は、実施例に記載されている。いくつかの実施形態では、gRNAバリアントは、gRNAバリアントを含むRNPに新たな機能を追加する。いくつかの実施形態では、gRNAバリアントは、以下から選択される改善された特徴を有する:安定性の増加、gRNAの転写の増加、ヌクレアーゼ活性に対する耐性の増加、gRNAのフォールディング率の増加、フォールディング中の副生成物形成の減少、生産的なフォールディングの増加、CasXタンパク質に対する結合親和性の増加、CasXタンパク質と複合体化した場合の標的核酸に対する結合親和性の増加、CasXタンパク質と複合体化した場合の遺伝子編集の増加、CasXタンパク質と複合体化した場合の標的核酸の編集の特異性の増加、CasXタンパク質と複合体化した場合のオフターゲット編集の減少、及びCasXタンパク質と複合体化した場合の標的核酸の編集におけるATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の増加、又はそれらの任意の組み合わせ。場合によっては、gRNAバリアントの改善された特徴のうちの1つ以上は、配列番号4若しくは配列番号5の参照gRNA又はgRNAバリアント174若しくは175と比較して、少なくとも約1.1~約100,000倍増加している。他の場合では、gRNAバリアントの1つ以上の改善された特徴は、配列番号4若しくは配列番号5の参照gRNA又はgRNAバリアント174若しくは175と比較して、少なくとも約1.1倍、少なくとも約10倍、少なくとも約100倍、少なくとも約1000倍、少なくとも約10,000倍、少なくとも約100,000倍、又はそれ以上増加している。他の場合では、gRNAバリアントの改善された特徴のうちの1つ以上は、配列番号4又は配列番号5の参照gRNA又はgRNAバリアント174若しくは175と比較して、約1.1~100,00倍、約1.1~10,00倍、約1.1~1,000倍、約1.1~500倍、約1.1~100倍、約1.1~50倍、約1.1~20倍、約10~100,00倍、約10~10,00倍、約10~1,000倍、約10~500倍、約10~100倍、約10~50倍、約10~20倍、約2~70倍、約2~50倍、約2~30倍、約2~20倍、約2~10倍、約5~50倍、約5~30倍、約5~10倍、約100~100,00倍、約100~10,00倍、約100~1,000倍、約100~500倍、約500~100,00倍、約500~10,00倍、約500~1,000倍、約500~750倍、約1,000~100,00倍、約10,000~100,00倍、約20~500倍、約20~250倍、約20~200倍、約20~100倍、約20~50倍、約50~10,000倍、約50~1,000倍、約50~500倍、約50~200倍、又は約50~100倍増加している。他の場合では、gRNAバリアントの1つ以上の改善された特徴は、配列番号4又は配列番号5の参照gRNA又はgRNAバリアント174若しくは175と比較して、約1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、40倍、45倍、50倍、55倍、60倍、70倍、80倍、90倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍、180倍、190倍、200倍、210倍、220倍、230倍、240倍、250倍、260倍、270倍、280倍、290倍、300倍、310倍、320倍、330倍、340倍、350倍、360倍、370倍、380倍、390倍、400倍、425倍、450倍、475倍、又は500倍増加している。
いくつかの実施形態では、新しいgRNAバリアントは、本開示のgRNAバリアントを生成するために、参照gRNA又はgRNAバリアントを1つ以上の変異誘発方法、例えば、以下の実施例で本明細書に記載される変異誘発方法に供することによって作製することができ、これには、網羅的変異進化(DME)、網羅的変異スキャニング(DMS)、エラープローンPCR、カセット変異誘発、ランダム変異誘発、付着伸長PCR、遺伝子シャフリング、又はドメインスワッピングが含まれ得る。参照gRNAの活性又は変異誘発を受けるgRNAバリアントの活性は、gRNAバリアントの活性に対するベンチマークとして使用することができ、それによって、gRNAバリアントの機能の改善を測定することができる。他の実施形態では、参照gRNA又はgRNAは、gRNAバリアント(例えば、合理的に設計されたバリアント)を産生するために、1つ以上の意図的に標的化された変異、置換、又はドメインスワップに供され得る。かかる方法によって産生される例示的なgRNAバリアントは、実施例に記載されており、gRNA足場の代表的な配列は、表2に提示されている。
いくつかの実施形態では、gRNAバリアントは、参照gRNA又はgRNAバリアント足場配列と比較して1つ以上の改変を含み、1つ以上の改変は、以下から選択される:gRNAの領域における少なくとも1つのヌクレオチド置換、gRNAの領域における少なくとも1つのヌクレオチド欠失、gRNAの領域における少なくとも1つのヌクレオチド挿入、gRNAの領域の全部若しくは一部の置換、gRNAの領域の全部若しくは一部の欠失、又は上記の任意の組み合わせ。場合によっては、改変は、gRNAの1つ以上の領域における1~15個の連続した又は連続していないヌクレオチドの置換である。他の場合では、改変は、gRNAの1つ以上の領域における1~10個の連続した又は連続していないヌクレオチドの欠失である。他の場合では、改変は、gRNAの1つ以上の領域における1~10個の連続した又は連続していないヌクレオチドの挿入である。他の場合では、改変は、足場ステムループ又は伸長ステムループの、近位の5’末端及び3’末端を有する異種RNA源由来のRNAステムループ配列による置換である。場合によっては、本開示のgRNAバリアントは、参照gRNA又はgRNAバリアントと比較して、1つの領域に2つ以上の改変を含む。他の場合では、本開示のgRNAバリアントは、2つ以上の領域に改変を含む。他の場合では、gRNAバリアントは、この段落に記載されている前述の改変の任意の組み合わせを含む。
いくつかの実施形態では、+1ヌクレオチドがGである場合、U6プロモーターからの転写がより効率的であり、開始部位に関してより一貫性があるので、インビボでの発現のために、元のgRNAと比較して、5’GがgRNAバリアント配列に付加される。他の実施形態では、T7ポリメラーゼが+1位のG及び+2位のプリンを強く好むので、インビトロでの転写で生産効率を増加させるために、2つの5’GがgRNAバリアント配列に付加される。場合によっては、5’G塩基が、表1の参照足場に付加される。他の場合では、5’G塩基が、表2のバリアント足場に付加される。
表2は、例示的なgRNAバリアント足場配列を提供する。いくつかの実施形態では、gRNAバリアント足場は、表2に列挙される配列番号2101~2332若しくは2353~2398の配列のうちのいずれか1つ、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の配列同一性を有する配列を含む。いくつかの実施形態では、gRNAバリアント足場は、配列番号2238~2332若しくは2353~2398の配列のうちのいずれか1つ、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の配列同一性を有する配列を含む。いくつかの実施形態では、gRNAバリアント足場は、配列番号2281~2332若しくは2353~2398の配列のうちのいずれか1つ、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の配列同一性を有する配列を含む。ベクターがgRNAの配列をコードするDNAを含むか又はgRNAがRNA及びDNAのキメラである実施形態では、チミン(T)塩基が、本明細書に記載のgRNA配列の実施形態のいずれかのウラシル(U)塩基に置換され得ることが理解されるであろう。
いくつかの実施形態では、sgRNAバリアントは、表2の配列番号2238、配列番号2239、配列番号2240、配列番号2241、配列番号2243、配列番号2256、配列番号2274、配列番号2275、配列番号2279、配列番号2281、配列番号2285、配列番号2289、配列番号2292、又は配列番号2308の配列に対する1つ以上の追加の改変を含む。
本開示のgRNAバリアントのいくつかの実施形態では、gRNAバリアントは、配列番号5の参照ガイド足場と比較して少なくとも1つの改変を含み、少なくとも1つの改変が、以下のうちの1つ以上から選択される:(a)三重鎖ループ内のC18G置換、(b)ステムバブルにおけるG55挿入、(c)U1欠失、(d)(i)6ntループ及びループに対して近位の13塩基対がUvsxヘアピンによって置換されており、(ii)A99の欠失及びG65Uの置換により、ループに対して遠位の塩基が完全に塩基対合している、伸長ステムループの改変。
いくつかの実施形態では、gRNAバリアントは、長い非コードRNA(lncRNA)を有する外因性ステムループを含む。本明細書で使用されるlncRNAは、長さが約200bpよりも長い非コードRNAを指す。いくつかの実施形態では、外因性ステムループの5’末端及び3’末端は、塩基対合している(すなわち、二重鎖RNAの領域を形成するように相互作用する)。いくつかの実施形態では、外因性ステムループの5’末端及び3’末端は、塩基対合しており、外因性ステムループの5’末端と3’末端との間の1つ以上の領域は、塩基対合しておらず、ループを形成する。
いくつかの実施形態では、本開示は、参照gRNAと比較して、ヌクレオチドの改変を有するgRNAバリアントを提供し、(a)gRNAバリアントの1つ以上の領域における1~15個の連続した若しくは連続していないヌクレオチドの置換、(b)gRNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの欠失、(c)gRNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの挿入、(d)足場ステムループ若しくは伸長ステムループの、近位の5’末端及び3’末端を有する異種RNA源由来のRNAステムループ配列による置換、又は(a)~(d)の任意の組み合わせ、を有する。本明細書に記載の置換、挿入及び欠失のうちのいずれかを組み合わせて、本開示のgRNAバリアントを生成することができる。例えば、gRNAバリアントは、参照gRNAと比較して、少なくとも1つの置換及び少なくとも1つの欠失、参照gRNAと比較して、少なくとも1つの置換及び少なくとも1つの挿入、参照gRNAと比較して、少なくとも1つの挿入及び少なくとも1つの欠失、又は参照gRNAと比較して少なくとも1つの置換、1つの挿入、及び1つの欠失、を含み得る。
いくつかの実施形態では、本開示のsgRNAバリアントは、以前に生成されたバリアントの配列に対する1つ以上の改変を含み、以前に生成されたバリアント自体が、改変される配列として機能する。場合によっては、1つ以上の改変が、足場のシュードノット領域に導入される。他の場合では、1つ以上の改変が、足場の三重鎖領域に導入される。他の場合では、1つ以上の改変が足場バブルに導入される。他の場合では、1つ以上の改変が、足場の伸長ステム領域に導入される。更に他の場合では、改変の1つは、前述の領域の2つ以上に導入される。このような改変は、前述の領域における1つ以上のヌクレオチドの挿入、欠失、若しくは置換、又はそれらの任意の組み合わせを含み得る。改変を生成及び評価するための例示的な方法は、実施例15に記載される。
いくつかの実施形態では、sgRNAバリアントは、配列番号2238、配列番号2239、配列番号2240、配列番号2241、配列番号2241、配列番号2274、配列番号2275、配列番号2279、又は配列番号2285、配列番号2289、配列番号2292、又は配列番号2308の配列に対する1つ以上の改変を含む。
例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント174(配列番号2238)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親174と比較して機能的特徴の改善を示す。他の例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント175(配列番号2239)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親175と比較して機能的特徴の改善を示す。例えば、gRNAバリアント175の三重ループに対して改変を有するバリアントは、特にC15又はC17に対する変異は、175足場と比較して高い濃縮を示す。追加的に、G7とA29との間のシュードノットステムにおける予測されるペアのいずれかのメンバーに対する変化は、175足場と比較して、両方とも高度に濃縮され、A29をC又はTに変換して、正準ワトソン-クリック対合(G7: C29)を形成し、その2つ目は、GUゆらぎ対(G7: U29)を形成し、その両方とも、G: A対と比較して、ヘリックスの安定性を増加させることが予想され得る。加えて、ガイド足場175における54位でのCの挿入は、濃縮された改変をもたらす。
いくつかの実施形態では、本開示は、表19の改変からなる群から選択されるgRNA足場バリアント174(配列番号2238)に対する1つ以上の改変を含むgRNAバリアントを提供し、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親174と比較して、機能的特徴の改善を示す。いくつかの実施形態では、改善された機能的特徴は、編集活性の増加、シュードノットステム安定性の増加、三重鎖領域安定性の増加、足場ステム安定性の増加、伸長ステム安定性、オフターゲットフォールディング中間体の減少、及びクラス2、V型CRISPRタンパク質に対する結合親和性の増加からなる群から選択される1つ以上の機能特性である。前述の実施形態では、表16の改変からなる群から選択されるgRNA足場バリアント174に対する1つ以上の改変を含むgRNA(連結された標的化配列を有し、クラス2、V型CRISPRタンパク質と複合体化する)は、インビトロアッセイにおいて、配列番号2238のgRNA足場のスコアと比較して、少なくとも約2.0、少なくとも約2.5、少なくとも約3、又は少なくとも約3.5大きい、改善された濃縮スコア(log)を示す。
いくつかの実施形態では、本開示は、表20の改変からなる群から選択されるgRNA足場バリアント175(配列番号2239)に対する1つ以上の改変を含むgRNAバリアントを提供し、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親175と比較して、機能的特徴の改善を示す。いくつかの実施形態では、改善された機能的特徴は、編集活性の増加、シュードノットステム安定性の増加、三重鎖領域安定性の増加、足場ステム安定性の増加、伸長ステム安定性、オフターゲットフォールディング中間体の減少、及びクラス2、V型CRISPRタンパク質に対する結合親和性の増加からなる群から選択される1つ以上の機能特性である。前述の実施形態では、表16の改変からなる群から選択されるgRNA足場バリアント175に対する1つ以上の改変を含むgRNA(連結された標的化配列を有し、クラス2、V型CRISPRタンパク質と複合体化する)は、インビトロアッセイにおいて、配列番号2239のgRNA足場のスコアと比較して、少なくとも約1.2、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、又は少なくとも約3.5大きい、改善された濃縮スコア(log)を示す。
特定の実施形態では、gRNA足場バリアント174の1つ以上の改変は、ヌクレオチド位置U11、U24、A29、U65、C66、C68、A69、U76、G77、A79、及びA87からなる群から選択される。特定の実施形態では、gRNA足場バリアント174の改変は、U11C、U24C、A29C、U65C、C66G、C68U、69位でのACGGAの挿入、76位でのUCCGUの挿入、G77A、79位でのGAの挿入、A87Gである。別の特定の実施形態では、gRNA足場バリアント175の改変は、ヌクレオチド位置C9、U11、C17、U24、A29、G54、C65、A89、及びA96からなる群から選択される。特定の実施形態では、gRNA足場バリアント174の改変は、C9U、U11C、C17G、U24C、A29C、54位でのGの挿入、65位でのCの挿入、A89G、及びA96Gである。
例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント215(配列番号2275)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親215と比較して機能的特徴の改善を示す。
例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント221(配列番号2281)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親221と比較して機能的特徴の改善を示す。
例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント225(配列番号2285)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親225と比較して機能的特徴の改善を示す。
例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント235(配列番号2292)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親225と比較して機能的特徴の改善を示す。
例示的な実施形態では、gRNAバリアントは、gRNA足場バリアント251(配列番号2308)に対する1つ以上の改変を含み、得られたgRNAバリアントは、同等の条件下でインビトロ又はインビボアッセイにおいて評価した場合、親251と比較して機能的特徴の改善を示す。
前述の実施形態では、改善された機能的特徴は、安定性の増加、gRNAの転写の増加、ヌクレアーゼ活性に対する耐性の増加、gRNAのフォールディング率の増加、フォールディング中の副生成物形成の減少、生産的なフォールディングの増加、CasXタンパク質に対する結合親和性の増加、CasXタンパク質と複合体化した場合の標的核酸に対する結合親和性の増加、CasXタンパク質と複合体化した場合の遺伝子編集の増加、CasXタンパク質と複合体化した場合の編集の特異性の増加、CasXタンパク質と複合体化した場合のオフターゲット編集の減少、及びCasXタンパク質と複合体化した場合の標的核酸の改変におけるATC、CTC、GTC、又はTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の増加のうちの1つ以上を含むが、これらに限定されない。場合によっては、gRNAバリアントの改善された特徴のうちの1つ以上は、それが由来するgRNAと比較して、少なくとも約1.1~約100,000倍改善されている。他の場合では、gRNAバリアントの1つ以上の改善された特徴は、それが由来するgRNAと比較して、少なくとも約1.1倍、少なくとも約10倍、少なくとも約100倍、少なくとも約1000倍、少なくとも約10,000倍、少なくとも約100,000倍、又はそれ以上改善されている。他の場合では、gRNAバリアントの改善された特徴のうちの1つ以上は、それが由来するgRNAと比較して、約1.1~100,00倍、約1.1~10,00倍、約1.1~1,000倍、約1.1~500倍、約1.1~100倍、約1.1~50倍、約1.1~20倍、約10~100,00倍、約10~10,00倍、約10~1,000倍、約10~500倍、約10~100倍、約10~50倍、約10~20倍、約2~70倍、約2~50倍、約2~30倍、約2~20倍、約2~10倍、約5~50倍、約5~30倍、約5~10倍、約100~100,00倍、約100~10,00倍、約100~1,000倍、約100~500倍、約500~100,00倍、約500~10,00倍、約500~1,000倍、約500~750倍、約1,000~100,00倍、約10,000~100,00倍、約20~500倍、約20~250倍、約20~200倍、約20~100倍、約20~50倍、約50~10,000倍、約50~1,000倍、約50~500倍、約50~200倍、又は約50~100倍改善されている。他の場合では、gRNAバリアントの1つ以上の改善された特徴は、それが由来するgRNAと比較して、約1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、40倍、45倍、50倍、55倍、60倍、70倍、80倍、90倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍、180倍、190倍、200倍、210倍、220倍、230倍、240倍、250倍、260倍、270倍、280倍、290倍、300倍、310倍、320倍、330倍、340倍、350倍、360倍、370倍、380倍、390倍、400倍、425倍、450倍、475倍、又は500倍改善されている。
いくつかの実施形態では、gRNAバリアントは、外因性伸長ステムループを含み、参照gRNAとのかかる差異は、以下の通りである。いくつかの実施形態では、外因性伸長ステムループは、本明細書に開示される参照ステムループ領域(例えば、配列番号15)とほとんど又は全く同一性を有しない。いくつかの実施形態では、外因性ステムループは、少なくとも10bp、少なくとも20bp、少なくとも30bp、少なくとも40bp、少なくとも50bp、少なくとも60bp、少なくとも70bp、少なくとも80bp、少なくとも90bp、少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも600bp、少なくとも700bp、少なくとも800bp、少なくとも900bp、少なくとも1,000bp、少なくとも2,000bp、少なくとも3,000bp、少なくとも4,000bp、少なくとも5,000bp、少なくとも6,000bp、少なくとも7,000bp、少なくとも8,000bp、少なくとも9,000bp、少なくとも10,000bp、少なくとも12,000bp、少なくとも15,000bp、又は少なくとも20,000bpである。いくつかの実施形態では、gRNAバリアントは、少なくとも10、少なくとも100、少なくとも500、少なくとも1000、又は少なくとも10,000ヌクレオチドを含む伸長ステムループ領域を含む。いくつかの実施形態では、異種ステムループは、gRNAの安定性を増加させる。いくつかの実施形態では、異種RNAステムループは、タンパク質、RNA構造、DNA配列、又は小分子に結合することができる。いくつかの実施形態では、ステムループを置換する外因性ステムループ領域は、RNAステムループ又はヘアピンを含み、得られるgRNAは、安定性が増加しており、ループの選択に応じて、特定の細胞タンパク質又はRNAと相互作用することができる。かかる外因性伸長ステムループは、例えば、熱安定性RNA、例えば、MS2ヘアピン(ACAUGAGGAUCACCCAUGU(配列番号1137))、Qβヘアピン(UGCAUGUCUAAGACAGCA(配列番号32))、U1ヘアピンII(AAUCCAUUGCACUCCGGAUU(配列番号33))、Uvsx(CCUCUUCGGAGG(配列番号34))、PP7ヘアピン(AGGAGUUUCUAUGGAAACCCU(配列番号35))、ファージ複製ループ(AGGUGGGACGACCUCUCGGUCGUCCUAUCU(配列番号36))、キッシングループ_a(UGCUCGCUCCGUUCGAGCA(配列番号37))、キッシングループ_b1(UGCUCGACGCGUCCUCGAGCA(配列番号38))、キッシングループ_b2(UGCUCGUUUGCGGCUACGAGCA(配列番号39))、G三重鎖M3q(AGGGAGGGAGGGAGAGG(配列番号40))、G四重鎖テロメアバスケット(GGUUAGGGUUAGGGUUAGG(配列番号41))、サルシン-リシンループ(CUGCUCAGUACGAGAGGAACCGCAG(配列番号42))、又はシュードノット(UACACUGGGAUCGCUGAAUUAGAGAUCGGCGUCCUUUCAUUCUAUAUACUUUGGAGUUUUAAAAUGUCUCUAAGUACA(配列番号43))を含み得る。いくつかの実施形態では、前述のヘアピン配列のうちの1つは、ステムループに組み込まれて、対応するリガンドがXDPのGagポリタンパク質に組み込まれる場合、gRNA(及びRNP複合体中の関連するCasX)の出芽XDPへの組み込みを輸送するのを助ける(以下でより詳細に記載される)。
いくつかの実施形態では、gRNAバリアントは、末端融合パートナーを含む。gRNAバリアントという用語は、末端融合又は内部挿入などの外因性配列を含むバリアントを包含する。例示的な末端融合は、自己切断リボザイム又はタンパク質結合モチーフへのgRNAの融合を含み得る。本明細書中で使用される場合、「リボザイム」とは、タンパク質酵素に類似する1つ以上の触媒活性を有するRNA又はそのセグメントを指す。例示的なリボザイムの触媒活性としては、例えば、RNAの切断及び/若しくはライゲーション、DNAの切断及び/若しくはライゲーション、又はペプチド結合形成が挙げられ得る。いくつかの実施形態では、このような融合は、足場のフォールディングを改善するか、又はDNA修復機構を動員するかのいずれかであり得る。例えば、gRNAは、いくつかの実施形態では、δ型肝炎ウイルス(HDV)アンチゲノムリボザイム、HDVゲノムリボザイム、ハチェットリボザイム(メタゲノムデータから)、env25ピストルリボザイム(Aliistipes putredinis由来の代表)、HH15最小ハンマーヘッドリボザイム、タバコ輪斑ウイルス(TRSV)リボザイム、WTウイルスハンマーヘッドリボザイム(及び合理的バリアント)、又はツイステッド・シスター1若しくはRBMX動員モチーフに融合され得る。ハンマーヘッドリボザイムは、RNA分子内の特定の部位で可逆的な切断及びライゲーション反応を触媒するRNAモチーフである。ハンマーヘッドリボザイムには、I型、II型、及びIII型ハンマーヘッドリボザイムが含まれる。HDV、ピストル、及びハチェットリボザイムは、自己切断活性を有する。1つ以上のリボザイムを含むgRNAバリアントは、gRNA参照と比較して拡張されたgRNA機能を可能にし得る。例えば、自己切断リボザイムを含むgRNAは、いくつかの実施形態では、転写され、ポリシストロン性転写物の一部として成熟gRNAへとプロセシングされ得る。このような融合は、gRNAの5’末端又は3’末端のいずれかで起こり得る。いくつかの実施形態では、gRNAバリアントは、5’末端と3’末端の両方に融合を含み、各融合は、独立して、本明細書に記載の通りである。
gRNAバリアントの実施形態では、gRNAバリアントは、gRNAの3’末端に位置し、標的核酸とハイブリダイズすることができるスペーサー(又は標的化配列)領域を更に含み、スペーサーが、少なくとも14~約35ヌクレオチドを含み、標的核酸に相補的である配列を用いて設計される。いくつかの実施形態では、コードされたgRNAバリアントは、標的核酸に相補的な少なくとも10~20ヌクレオチドの標的化配列を含む。いくつかの実施形態では、標的化配列は、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、又は30ヌクレオチドを有する。いくつかの実施形態では、コードされたgRNAバリアントは、20ヌクレオチドを有する標的化配列を含む。いくつかの実施形態では、標的化配列は、25ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、24ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、23ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、22ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、21ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、20ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、19ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、18ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、17ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、16ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、15ヌクレオチドを有する。いくつかの実施形態では、標的化配列は、14ヌクレオチドを有する。
h.クラス2、V型タンパク質との複合体形成
いくつかの実施形態では、発現時に、gRNAバリアントは、表3の配列番号247~592若しくは1147~1231の配列のうちのいずれか1つ、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有する配列を含むCasXバリアントタンパク質を含むクラス2、V型タンパク質とRNPとして複合体化される。いくつかの実施形態では、発現時に、gRNAバリアントは、配列番号270~592若しくは1147~1231の配列のうちのいずれか1つ、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有する配列を含むCasXバリアントタンパク質とRNPとして複合体化される。いくつかの実施形態では、発現時に、gRNAバリアントは、配列番号415~592若しくは1147~1231の配列のうちのいずれか1つ、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約85%、少なくとも約90%、少なくとも約91%、少なくとも約92%、少なくとも約93%、少なくとも約94%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の同一性を有する配列を含むCasXバリアントタンパク質とRNPとして複合体化される。
いくつかの実施形態では、gRNAバリアントは、参照gRNAと比較した場合、CasXバリアントタンパク質と複合体を形成する改善された能力を有し、それによって、実施例に記載されるように、CasXタンパク質と切断コンピテントリボ核タンパク質(RNP)複合体を形成するその能力を改善する。リボ核タンパク質複合体の形成を改善することは、いくつかの実施形態では、機能的なRNPが構築される効率を改善することができる。いくつかの実施形態では、gRNAバリアント及びその標的化配列を含むRNPの90%超、93%超、95%超、96%超、97%超、98%超又は99%超が、標的核酸の遺伝子編集に適格である。
CasXタンパク質と複合体を形成するgRNAバリアントの能力を改善することができる例示的なヌクレオチド変化は、いくつかの実施形態では、足場ステムを熱安定性ステムループで置換することを含み得る。いかなる理論にも束縛されることを望むものではないが、足場ステムを熱安定性ステムループで置換することによって、gRNAバリアントとCasXタンパク質との全体的な結合安定性を増加させることができる。代替的に、又は追加的に、ステムループの大部分を除去することによって、gRNAバリアントのフォールディング動態が変化し、例えば、gRNAバリアントがそれ自体で「もつれ」得る程度を減少させることによって、機能的にフォールディングされたgRNAがより容易にかつ迅速に構造的に構築成され得る。いくつかの実施形態では、足場ステムループ配列の選択は、gRNAのために利用される異なる標的化配列によって変化し得る。いくつかの実施形態では、足場配列は、標的化配列、したがって、標的配列に合わせて調整することができる。実施例のアッセイを含む生化学的アッセイを使用して、RNPを形成するためのgRNAバリアントに対するCasXタンパク質の結合親和性を評価することができる。例えば、当業者は、追加の非標識「コールド競合(cold competitor)」gRNAの濃度の増加に対する応答として、固定化CasXタンパク質に結合している蛍光タグ付きgRNAの量の変化を測定することができる。代替的に、又は追加的に、異なる量の蛍光標識されたgRNAが固定化CasXタンパク質上を流れる際に、蛍光シグナルがどのように変化するのかを監視又は観察することができる。代替的に、RNPを形成する能力は、実施例に記載されるように、規定された標的核酸配列に対するインビトロ切断アッセイを使用して評価され得る。
i.化学的に改変されたgRNA
いくつかの実施形態では、本開示は、化学的に改変されたgRNAを提供する。いくつかの実施形態では、本開示は、ガイドNA機能性を有し、ヌクレアーゼによる切断に対する感受性が低減された、化学的に修飾されたgRNAを提供する。4つの正準リボヌクレオチド(A、C、G、及びU)以外の任意のヌクレオチド又はデオキシヌクレオチドを含むgRNAは、化学的に改変されたgRNAである。場合によっては、化学的に改変されたgRNAは、天然のホスホジエステルヌクレオチド間結合以外の任意の骨格又はヌクレオチド間結合を含む。特定の実施形態では、保持された機能性は、改変されたgRNAが本明細書に記載の実施形態のいずれかのCasXに結合する能力を含む。特定の実施形態では、保持された機能性は、改変されたgRNAが標的核酸配列に結合する能力を含む。特定の実施形態では、保持された機能性は、CasXタンパク質を標的化すること、又は予め複合体化されたRNPが標的核酸配列に結合する能力を含む。特定の実施形態では、保持された機能性は、CasX-gRNAが標的ポリヌクレオチドにニックを入れる能力を含む。特定の実施形態では、保持された機能性は、CasX-gRNAが標的核酸配列を切断する能力を含む。特定の実施形態では、保持された機能性は、本開示の実施形態のCasXキメラタンパク質を有する組換えシステムにおけるgRNAの任意の他の既知の機能である。
いくつかの実施形態では、本開示は、化学的に改変されたgRNAを提供し、2’-O-C1~4アルキル、例えば、2’-O-メチル(2’-OMe)、2’-デオキシ(2’-H)、2’-O-C1-3アルキル-O-C1-3アルキル、例えば、2’-メトキシエチル(「2’-MOE」)、2’-フルオロ(「2’-F」)、2’-アミノ(「2’-NH」)、2’-アラビノシル(「2’-アラビノ」)ヌクレオチド、2’-F-アラビノシル(「2’-F-アラビノ」)ヌクレオチド、2’-ロックド核酸(「LNA」)ヌクレオチド、2’-アンロックド核酸(「ULNA」)ヌクレオチド、L型の糖(「L-糖」)、及び4’-チオリボシルヌクレオチドからなる群から選択されるヌクレオチド糖の改変が、gRNAに組み込まれる。他の実施形態では、ホスホロチオエート「P(S)」(P(S))、ホスホノカルボキシレート(P(CHCOOR)、例えば、ホスホノアセテート「PACE」(P(CHCOO))、チオホスホノカルボキシレート((S)P(CHCOOR)、例えば、チオホスホノアセテート「thioPACE」((S)P(CHCOO))、アルキルホスホネート(P(C1-3アルキル)、例えば、メチルホスホネート-P(CH)、ボラノホスホネート(P(BH))、及びホスホロジチオエート(P(S))からなる群から選択されるヌクレオチド間結合の改変が、ガイドRNAに組み込まれる。
特定の実施形態では、本開示は、化学的に改変されたgRNAを提供し、2-チオウラシル(「2-チオU」)、2-チオシトシン(「2-チオC」)、4-チオウラシル(「4-チオU」)、6-チオグアニン(「6-チオG」)、2-アミノアデニン(「2-アミノA」)、2-アミノプリン、シュードウラシル、ヒポキサンチン、7-デアザグアニン、7-デアザ-8-アザグアニン、7-デアザアデニン、7-デアザ-8-アザアデニン、5-メチルシトシン(「5-メチルC」)、5-メチルウラシル(「5-メチルU」)、5-ヒドロキシメチルシトシン、5-ヒドロキシメチルウラシル、5,6-デヒドロウラシル、5-プロピニルシトシン、5-プロピニルウラシル、5-エチニルシトシン、5-エチニルウラシル、5-アリルウラシル(「5-アリルU」)、5-アリルシトシン(「5-アリルC」)、5-アミノアリルウラシル(「5-アミノアリルU」)、5-アミノアリル-シトシン(「5-アミノアリルC」)、脱塩基ヌクレオチド、Z塩基、P塩基、不定形核酸(「UNA」)、イソグアニン(「isoG」)、イソシトシン(「isoC」)、5-メチル-2-ピリミジン、x(A、G、C、T)、及びy(A、G、C、T)からなる群から選択される核酸塩基(「塩基」)の改変が、gRNAに組み込まれる。
他の実施形態では、本開示は、化学的に改変されたgRNAを提供し、1つ以上の15N、13C、14C、重水素、H、32P、125I、131I原子又はトレーサーとして使用される他の原子若しくは元素を含むヌクレオチドを含む、ヌクレオチド糖、核酸塩基、ホスホジエステル結合、及び/又はヌクレオチドリン酸に1つ以上の同位体改変が導入される。
いくつかの実施形態では、gRNAに組み込まれる「末端」の改変は、PEG(ポリエチレングリコール)、炭化水素リンカー(ヘテロ原子(O,S,N)置換炭化水素スペーサー、ハロ置換炭化水素スペーサー、ケト-、カルボキシル-、アミド-、チオニル-、カルバモイル-、チオノカルバマオイル-含有炭化水素スペーサー)、スペルミンリンカー、リンカーに結合した蛍光色素(例えば、フルオレセイン、ローダミン、シアニン)などの色素、例えば、6-フルオレセイン-ヘキシル、クエンチャー(例えば、ダブシル、BHQ)、並びに他の標識(例えば、ビオチン、ジゴキシゲニン、アクリジン、ストレプトアビジン、アビジン、ペプチド、及び/又はタンパク質))からなる群から選択される。いくつかの実施形態では、「末端」の改変は、デオキシヌクレオチド及び/若しくはリボヌクレオチドのオリゴヌクレオチド、ペプチド、タンパク質、糖、オリゴ糖、ステロイド、脂質、葉酸、ビタミン、並びに/又は他の分子を含む別の分子へのgRNAのコンジュゲーション(若しくはライゲーション)を含む。特定の実施形態では、本開示は、化学的に改変されたgRNAを提供し、「末端」の改変(上記)が、例えば、2-(4-ブチルアミドフルオレセイン)プロパン-1,3-ジオールビス(ホスホジエステル)リンカーなどのリンカーを介してgRNA配列の内部に位置し、リンカーが、ホスホジエステル結合として組み込まれ、gRNAにおける2つのヌクレオチド間のどこにでも組み込まれ得る。
いくつかの実施形態では、本開示は、末端の改変を有する化学的に改変されたgRNAを提供し、末端官能基、例えば、アミン、チオール(又はスルフヒドリル)、ヒドロキシル、カルボキシル、カルボニル、チオニル、チオカルボニル、カルバモイル、チオカルバモイル、ホスホリル、アルケン、アルキン、ハロゲン、又は官能基末端リンカーなどの末端官能基を含み、これらは続いて、蛍光色素、非蛍光標識、タグ(14Cについては、例えば、ビオチン、アビジン、ストレプトアビジン、又は15N、13C、重水素、H、32P、125Iなどの同位体標識を含有する部分)、オリゴヌクレオチド(アプタマーを含むデオキシヌクレオチド及び/又はリボヌクレオチドを含む)、アミノ酸、ペプチド、タンパク質、糖、オリゴ糖、ステロイド、脂質、葉酸、及びビタミンからなる群から選択される所望の部分にコンジュゲートされ得る。コンジュゲーションには、当該技術分野で周知の標準的な化学が使用され、限定されないが、N-ヒドロキシスクシンイミド、イソチオシアネート、DCC(若しくはDCI)を介したカップリング、及び/又は任意の他の標準的な方法(その内容が参照によりその全体が本明細書に援用される”Bioconjugate Techniques”by Greg T.Hermanson, Publisher Eslsevier Science,3rd ed.(2013)に記載されている)が挙げられる。
IV.標的核酸を改変するためのクラス2、V型CRISPRタンパク質
本開示は、真核細胞のゲノム編集において有用であるCRISPRヌクレアーゼを含むシステムを提供する。いくつかの実施形態では、ゲノム編集システムにおいて用いられるCRISPRヌクレアーゼは、クラス2、V型ヌクレアーゼである。クラス2、V型CRISPR-Casシステムのメンバーには相違点があるが、それらは、それらをCas9システムと区別するいくつかの共通の特徴を共有する。まず、クラス2、V型ヌクレアーゼは、単一のRNA誘導RuvCドメイン含有エフェクターを有するが、HNHドメインを有さず、非標的鎖上の標的領域の5’上流のTCモチーフのPAMを認識し、これは、標的配列の3’側でG-リッチPAMに依存するCas9システムとは異なる。V型ヌクレアーゼは、PAMに近い近位部位に平滑末端を生成するCas9とは異なり、PAM配列に対して遠位にずれた二本鎖切断を生成する。加えて、V型ヌクレアーゼは、シスで結合する標的dsDNA又はssDNAによって活性化された場合、トランスでssDNAを分解する。いくつかの実施形態では、本実施形態のV型ヌクレアーゼは、5’-TC PAMモチーフを認識し、RuvCドメインによってのみ切断される付着末端を生成する。いくつかの実施形態では、V型ヌクレアーゼは、Cas12a、Cas12b、Cas12c、Cas12d(CasY)、Cas12j、Cas12k、C2c4、C2c8、C2c5、C2c10、C2c9、CasZ、及びCasXからなる群から選択される。いくつかの実施形態では、本開示は、CasXバリアントタンパク質と、1つ以上のgRNAバリアントとを含むシステム(CasX: gRNAシステム)を提供し、これは、真核細胞において標的核酸配列を改変するように特別に設計されている。
本明細書で使用される「CasXタンパク質」という用語は、タンパク質のファミリーを指し、全ての天然に存在するCasXタンパク質、天然に存在するCasXタンパク質と少なくとも50%の同一性を共有するタンパク質、並びに天然に存在する参照CasXタンパク質又はそれが由来する別のCasXバリアントと比較して1つ以上の改善された特徴を有するCasXバリアントを包含する。
本開示のCasXタンパク質は、以下のドメインのうちの少なくとも1つを含む:非標的鎖結合(NTSB)ドメイン、標的鎖装填(target strand loading、TSL)ドメイン、ヘリックスIドメイン(ヘリックスI-I及びI-IIサブドメインに更に分割される)、ヘリックスIIドメイン、オリゴヌクレオチド結合ドメイン(OBD、OBD-I及びOBD-IIサブドメインに更に分割される)、並びにRuvC DNA切断ドメイン(RuvC-I及びIIサブドメインに更に分割される)。RuvCドメインは、以下でより詳細に記載される触媒的に不活性な(catalytically-dead)CasXバリアントにおいて改変又は欠失され得る。
いくつかの実施形態では、CasXタンパク質は、標的核酸配列内の配列にハイブリダイズする関連するgRNAによって標的化される特定の配列において標的核酸に結合する及び/又はそれを改変する(例えば、ニックを入れる、二本鎖切断を触媒する、メチル化する、脱メチル化するなど)ことができる。
a.参照CasXタンパク質
本開示は、天然に存在するCasXタンパク質(本明細書において「参照CasXタンパク質」と称される)を提供し、これはその後、本開示のCasXバリアントを作製するために改変された。例えば、参照CasXタンパク質は、Deltaproteobacteria、Planctomycetes、又はCandidatus Sungbacteria種などの天然に存在する原核生物から単離することができる。参照CasXタンパク質は、ガイドRNAと相互作用してリボ核タンパク質(RNP)複合体を形成するタンパク質のCasX(互換的に、Cas12eと称される)ファミリーに属するII型CRISPR/Casエンドヌクレアーゼである。
場合によっては、参照CasXタンパク質は、Deltaproteobacterから単離されるか又はそれに由来し、以下の配列を有する:
1 MEKRINKIRK KLSADNATKP VSRSGPMKTL LVRVMTDDLK KRLEKRRKKP EVMPQVISNN
61 AANNLRMLLD DYTKMKEAIL QVYWQEFKDD HVGLMCKFAQ PASKKIDQNK LKPEMDEKGN
121 LTTAGFACSQ CGQPLFVYKL EQVSEKGKAY TNYFGRCNVA EHEKLILLAQ LKPEKDSDEA
181 VTYSLGKFGQ RALDFYSIHV TKESTHPVKP LAQIAGNRYA SGPVGKALSD ACMGTIASFL
241 SKYQDIIIEH QKVVKGNQKR LESLRELAGK ENLEYPSVTL PPQPHTKEGV DAYNEVIARV
301 RMWVNLNLWQ KLKLSRDDAK PLLRLKGFPS FPVVERRENE VDWWNTINEV KKLIDAKRDM
361 GRVFWSGVTA EKRNTILEGY NYLPNENDHK KREGSLENPK KPAKRQFGDL LLYLEKKYAG
421 DWGKVFDEAW ERIDKKIAGL TSHIEREEAR NAEDAQSKAV LTDWLRAKAS FVLERLKEMD
481 EKEFYACEIQ LQKWYGDLRG NPFAVEAENR VVDISGFSIG SDGHSIQYRN LLAWKYLENG
541 KREFYLLMNY GKKGRIRFTD GTDIKKSGKW QGLLYGGGKA KVIDLTFDPD DEQLIILPLA
601 FGTRQGREFI WNDLLSLETG LIKLANGRVI EKTIYNKKIG RDEPALFVAL TFERREVVDP
661 SNIKPVNLIG VDRGENIPAV IALTDPEGCP LPEFKDSSGG PTDILRIGEG YKEKQRAIQA
721 AKEVEQRRAG GYSRKFASKS RNLADDMVRN SARDLFYHAV THDAVLVFEN LSRGFGRQGK
781 RTFMTERQYT KMEDWLTAKL AYEGLTSKTY LSKTLAQYTS KTCSNCGFTI TTADYDGMLV
841 RLKKTSDGWA TTLNNKELKA EGQITYYNRY KRQTVEKELS AELDRLSEES GNNDISKWTK
901 GRRDEALFLL KKRFSHRPVQ EQFVCLDCGH EVHADEQAAL NIARSWLFLN SNSTEFKSYK
961 SGKQPFVGAW QAFYKRRLKE VWKPNA(配列番号1)。
場合によっては、参照CasXタンパク質は、Planctomycetesから単離されるか又はそれに由来し、以下の配列を有する:
1 MQEIKRINKI RRRLVKDSNT KKAGKTGPMK TLLVRVMTPD LRERLENLRK KPENIPQPIS
61 NTSRANLNKL LTDYTEMKKA ILHVYWEEFQ KDPVGLMSRV AQPAPKNIDQ RKLIPVKDGN
121 ERLTSSGFAC SQCCQPLYVY KLEQVNDKGK PHTNYFGRCN VSEHERLILL SPHKPEANDE
181 LVTYSLGKFG QRALDFYSIH VTRESNHPVK PLEQIGGNSC ASGPVGKALS DACMGAVASF
241 LTKYQDIILE HQKVIKKNEK RLANLKDIAS ANGLAFPKIT LPPQPHTKEG IEAYNNVVAQ
301 IVIWVNLNLW QKLKIGRDEA KPLQRLKGFP SFPLVERQAN EVDWWDMVCN VKKLINEKKE
361 DGKVFWQNLA GYKRQEALLP YLSSEEDRKK GKKFARYQFG DLLLHLEKKH GEDWGKVYDE
421 AWERIDKKVE GLSKHIKLEE ERRSEDAQSK AALTDWLRAK ASFVIEGLKE ADKDEFCRCE
481 LKLQKWYGDL RGKPFAIEAE NSILDISGFS KQYNCAFIWQ KDGVKKLNLY LIINYFKGGK
541 LRFKKIKPEA FEANRFYTVI NKKSGEIVPM EVNFNFDDPN LIILPLAFGK RQGREFIWND
601 LLSLETGSLK LANGRVIEKT LYNRRTRQDE PALFVALTFE RREVLDSSNI KPMNLIGIDR
661 GENIPAVIAL TDPEGCPLSR FKDSLGNPTH ILRIGESYKE KQRTIQAAKE VEQRRAGGYS
721 RKYASKAKNL ADDMVRNTAR DLLYYAVTQD AMLIFENLSR GFGRQGKRTF MAERQYTRME
781 DWLTAKLAYE GLPSKTYLSK TLAQYTSKTC SNCGFTITSA DYDRVLEKLK KTATGWMTTI
841 NGKELKVEGQ ITYYNRYKRQ NVVKDLSVEL DRLSEESVNN DISSWTKGRS GEALSLLKKR
901 FSHRPVQEKF VCLNCGFETH ADEQAALNIA RSWLFLRSQE YKKYQTNKTT GNTDKRAFVE
961 TWQSFYRKKL KEVWKPAV(配列番号2)。
場合によっては、参照CasXタンパクは、Candidatus Sungbacteriaから単離されるか又はそれに由来し、以下の配列を有する:
1 MDNANKPSTK SLVNTTRISD HFGVTPGQVT RVFSFGIIPT KRQYAIIERW FAAVEAARER
61 LYGMLYAHFQ ENPPAYLKEK FSYETFFKGR PVLNGLRDID PTIMTSAVFT ALRHKAEGAM
121 AAFHTNHRRL FEEARKKMRE YAECLKANEA LLRGAADIDW DKIVNALRTR LNTCLAPEYD
181 AVIADFGALC AFRALIAETN ALKGAYNHAL NQMLPALVKV DEPEEAEESP RLRFFNGRIN
241 DLPKFPVAER ETPPDTETII RQLEDMARVI PDTAEILGYI HRIRHKAARR KPGSAVPLPQ
301 RVALYCAIRM ERNPEEDPST VAGHFLGEID RVCEKRRQGL VRTPFDSQIR ARYMDIISFR
361 ATLAHPDRWT EIQFLRSNAA SRRVRAETIS APFEGFSWTS NRTNPAPQYG MALAKDANAP
421 ADAPELCICL SPSSAAFSVR EKGGDLIYMR PTGGRRGKDN PGKEITWVPG SFDEYPASGV
481 ALKLRLYFGR SQARRMLTNK TWGLLSDNPR VFAANAELVG KKRNPQDRWK LFFHMVISGP
541 PPVEYLDFSS DVRSRARTVI GINRGEVNPL AYAVVSVEDG QVLEEGLLGK KEYIDQLIET
601 RRRISEYQSR EQTPPRDLRQ RVRHLQDTVL GSARAKIHSL IAFWKGILAI ERLDDQFHGR
661 EQKIIPKKTY LANKTGFMNA LSFSGAVRVD KKGNPWGGMI EIYPGGISRT CTQCGTVWLA
721 RRPKNPGHRD AMVVIPDIVD DAAATGFDNV DCDAGTVDYG ELFTLSREWV RLTPRYSRVM
781 RGTLGDLERA IRQGDDRKSR QMLELALEPQ PQWGQFFCHR CGFNGQSDVL AATNLARRAI
841 SLIRRLPDTD TPPTP(配列番号3)。
b.クラス2、V型CasXバリアントタンパク質
本開示は、参照CasXタンパク質のクラス2、V型、CasXバリアント又は他のCasXバリアントに由来するバリアントを提供し(例えば、図44を参照)(本明細書において互換的に「クラス2、V型CasXバリアント」、「CasXバリアント」、又は「CasXバリアントタンパク質」と称される)、クラス2、V型CasXバリアントは、参照CasXタンパク質と比較して少なくとも1つのドメインに少なくとも1つの改変を含むか(配列番号1~3の配列を含むが、これらに限定されない)、又は別のCasXバリアントと比較して少なくとも1つの改変を含む。CasXタンパク質の改善された特徴をもたらす参照CasXタンパク質又は別のCasXバリアントタンパク質のアミノ酸配列における任意の変化は、本開示のCasXバリアントタンパク質とみなされる。例えば、CasXバリアントは、参照CasXタンパク質配列と比較して、1つ以上のアミノ酸置換、挿入、欠失、若しくはスワップされたドメイン、又はそれらの任意の組み合わせを含み得る。
本開示のCasXバリアントは、配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質、又はそれが由来するバリアント(例えば、CasX491(配列番号336)若しくはCasX515(配列番号416)と比較して、1つ以上の改善された特徴を有する。CasXバリアントの実施形態の例示的な改善された特徴としては、バリアントのフォールディングの改善、gRNAに対する結合親和性の増加、標的核酸に対する結合親和性の増加、標的核酸の編集及び/又は結合においてより広範囲のPAM配列を利用する能力の改善、標的DNAの巻き戻しの改善、編集活性の増加、編集効率の改善、標的核酸に対する編集特異性の改善、オフターゲット編集若しくは切断の減少、効率的に編集され得る真核生物ゲノムの割合の増加、ヌクレアーゼの活性の増加、二本鎖切断のための標的鎖装填(target strand loading)の増加、一本鎖ニッキングのための標的鎖装填の減少、DNAの非標的鎖の結合の増加、タンパク質安定性の改善、タンパク質: gRNA(RNP)複合体の安定性の改善、並びに改善された融合体特徴が挙げられるが、これらに限定されない。前述の実施形態では、CasXバリアントの改善された特徴のうちの1つ以上は、同等の様式でアッセイした場合、配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質、又はCasX491(配列番号336)若しくはCasX515(配列番号416)と比較して、少なくとも約1.1~約100,000倍改善されている。他の実施形態では、改善は、同等の様式でアッセイした場合、配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質、又はCasX491若しくはCasX515と比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約5倍、少なくとも約10倍、少なくとも約50倍、少なくとも約100倍、少なくとも約500倍、少なくとも約1000倍、少なくとも約5000倍、少なくとも約10,000倍、又は少なくとも約100,000倍である。他の場合では、CasXバリアント及びgRNAバリアントのRNPの1つ以上の改善された特徴は、配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質及び表1のgRNAのRNP、又はCasX491若しくはCasX515とgRNA174のRNPと比較して、少なくとも約1.1、少なくとも約10、少なくとも約100、少なくとも約1000、少なくとも約10,000、少なくとも約100,000倍、又はそれ以上改善されている。他の場合では、CasXバリアント及びgRNAバリアントのRNPの改善された特徴のうちの1つ以上は、同等の様式でアッセイした場合、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質及び表1のgRNA、又はCasX491若しくはCasX515とgRNA174のRNPと比較して、約1.1~100,00倍、約1.1~10,00倍、約1.1~1,000倍、約1.1~500倍、約1.1~100倍、約1.1~50倍、約1.1~20倍、約10~100,00倍、約10~10,00倍、約10~1,000倍、約10~500倍、約10~100倍、約10~50倍、約10~20倍、約2~70倍、約2~50倍、約2~30倍、約2~20倍、約2~10倍、約5~50倍、約5~30倍、約5~10倍、約100~100,00倍、約100~10,00倍、約100~1,000倍、約100~500倍、約500~100,00倍、約500~10,00倍、約500~1,000倍、約500~750倍、約1,000~100,00倍、約10,000~100,00倍、約20~500倍、約20~250倍、約20~200倍、約20~100倍、約20~50倍、約50~10,000倍、約50~1,000倍、約50~500倍、約50~200倍、又は約50~100倍改善されている。他の場合では、CasXバリアント及びgRNAバリアントのRNPの1つ以上の改善された特徴は、同等の様式でアッセイした場合、配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質及び表1のgRNAのRNP、又はCasX491若しくはCasX515とgRNA174のRNPと比較して、約1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、25倍、30倍、40倍、45倍、50倍、55倍、60倍、70倍、80倍、90倍、100倍、110倍、120倍、130倍、140倍、150倍、160倍、170倍、180倍、190倍、200倍、210倍、220倍、230倍、240倍、250倍、260倍、270倍、280倍、290倍、300倍、310倍、320倍、330倍、340倍、350倍、360倍、370倍、380倍、390倍、400倍、425倍、450倍、475倍、又は500倍改善されている。
いくつかの実施形態では、CasXバリアントの改変は、参照CasXの1つ以上のアミノ酸における変異である。他の実施形態では、改変は、異なるCasXタンパク質由来のドメインの一部又は全部の挿入又は置換を含む。特定の実施形態では、配列番号415~592及び1147~1231のCasXバリアントは、本明細書に記載の選択ドメインにおける個々の改変に加えて、配列番号1のNTSB及びヘリックス1Bドメインを有するが、他のドメインは、配列番号2に由来する。変異は、参照CasXタンパク質又はCasXバリアントの任意の1つ以上のドメインに導入され得、例えば、参照CasXタンパク質又はそれが由来するCasXバリアントの任意のドメインにおける1つ以上のドメインの一部若しくは全部の欠失、又は1つ以上のアミノ酸の置換、欠失、若しくは挿入を含み得る。CasXタンパク質のドメインは、非標的鎖結合(NTSB)ドメイン、標的鎖装填(TSL)ドメイン、ヘリックスIドメイン、ヘリックスIIドメイン、オリゴヌクレオチド結合ドメイン(OBD)、及びRuvC DNA切断ドメインを含む。理論又は機構に束縛されるものではないが、CasXにおけるNTSBドメインは、非標的核酸鎖への結合を可能にし、非標的鎖及び標的鎖の巻き戻しを助けることができる。NTSBドメインは、巻き戻された状態の非標的核酸鎖の巻き戻し又は捕捉に関与すると推定される。例示的なNTSBドメインは、配列番号1のアミノ酸100~190又は配列番号2のアミノ酸102~191を含む。いくつかの実施形態では、参照CasXタンパク質のNTSBドメインは、4本鎖のβシートを含む。いくつかの実施形態では、TSLは、標的鎖DNA骨格の切断可能なリン酸をRuvC活性部位に配置するフォールディングした状態の標的鎖を配置又は捕捉するように作用する。例示的なTSLは、配列番号1のアミノ酸824~933又は配列番号2のアミノ酸811~920を含む。理論に束縛されることを望むものではないが、場合によっては、ヘリックスIドメインは、プロトスペーサー隣接モチーフ(protospacer adjacent motif、PAM)の結合に寄与し得ると考えられている。いくつかの実施形態では、参照CasXタンパク質のヘリックスIドメインは、1つ以上のアルファヘリックスを含む。例示的なヘリックスI-I及びI-IIドメインは、それぞれ配列番号1のアミノ酸56~99及び191~331、又はそれぞれ配列番号2のアミノ酸58~101及び192~332を含む。ヘリックスIIドメインは、ガイドRNA足場ステムループ並びに結合したDNAへの結合に関与する。例示的なヘリックスIIドメインは、配列番号1のアミノ酸332~508、又は配列番号2のアミノ酸333~500を含む。OBDは、主にガイドRNA足場のRNA三重鎖に結合する。OBDはまた、プロトスペーサー隣接モチーフ(PAM)への結合に関与し得る。例示的なOBD I及びIIドメインは、それぞれ配列番号1のアミノ酸1~55及び509~659、又はそれぞれ配列番号2のアミノ酸1~57及び501~646を含む。RuvCは、DNAの両方の鎖を切断することに関与するDEDモチーフ活性部位を有する(1つずつ、まず、非標的鎖が標的化配列へ11~14ヌクレオチド(nt)で切断され、次に、標的鎖が標的配列の2~4ヌクレオチド後で切断される可能性が最も高く、その結果、ずれた切断が生じる)。特にCasXでは、RuvCドメインが、CasXの機能に重要なガイドRNA足場ステムループの結合にも関与するという点で独特である。例示的なRuvC I及びIIドメインは、それぞれ配列番号1のアミノ酸660~823及び934~986、又はそれぞれ配列番号2のアミノ酸647~810及び921~978を含み、一方、CasXバリアントは、配列番号2に対してI658位及びA708位における変異、又は以下に記載されるCasX515の変異を含み得る。
いくつかの実施形態では、CasXバリアントタンパク質は、配列番号1~3の配列を含む参照CasXタンパク質の少なくとも1つのドメインにおいて、少なくとも2つのドメインの各々において、少なくとも3つのドメインの各々において、少なくとも4つのドメインの各々において、又は少なくとも5つのドメインの各々において、少なくとも1つの改変を含む。いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質の少なくとも1つのドメインにおいて2つ以上の改変を含む。いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質の少なくとも1つのドメインにおいて少なくとも2つの改変、参照CasXタンパク質の少なくとも1つのドメインにおいて少なくとも3つの改変、又は参照CasXタンパク質の少なくとも1つのドメインにおいて少なくとも4つ以上の改変を含む。いくつかの実施形態では、CasXバリアントは、参照CasXと比較して2つ以上の改変を含み、各改変は、独立して、NTSB、TSL、ヘリックスIドメイン、ヘリックスIIドメイン、OBD、及びRuvC DNA切断ドメインからなる群から選択されるドメインにおいて行われる。いくつかの実施形態では、CasXバリアントが参照CasXタンパク質と比較して2つ以上の改変を含み、改変が、2つ以上のドメインにおいて行われる。いくつかの実施形態では、CasXバリアントタンパク質の少なくとも1つの改変は、配列番号1~3の参照CasXタンパク質の1つのドメインの少なくとも一部の欠失を含む。いくつかの実施形態では、欠失は、NTSBドメイン、TSLドメイン、ヘリックスIドメイン、ヘリックスIIドメイン、OBD、又はRuvC DNA切断ドメインにある。
場合によっては、本開示のCasXバリアントは、1つ以上のドメインを包含し得る構造領域における改変を含む。いくつかの実施形態では、CasXバリアントは、gRNA: CasXバリアントとの標的核酸複合体化が起こるチャネルを形成する、CasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む。他の実施形態では、CasXバリアントは、gRNAと結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む。他の実施形態では、CasXバリアントは、非標的鎖DNAと結合するチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む。他の実施形態では、CasXバリアントは、標的核酸のプロトスペーサー隣接モチーフ(PAM)と結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む。他の実施形態では、CasXバリアントは、CasXバリアントの連続していない表面露出アミノ酸残基の領域の少なくとも1つの改変を含む。他の実施形態では、CasXバリアントは、CasXバリアントのドメインにおける疎水性パッキングを介してコアを形成する非隣接アミノ酸残基の領域の少なくとも1つの改変を含む。本段落の前述の実施形態では、領域の改変は、領域の1つ以上のアミノ酸の欠失、挿入、若しくは置換のうちの1つ以上を含み得るか、又はCasXバリアントの領域の2~15アミノ酸残基が帯電アミノ酸で置換されるか、又はCasXバリアントの領域の2~15アミノ酸残基が、極性アミノ酸で置換されるか、又はCasXバリアントの領域の2~15アミノ酸残基が、DNA若しくはRNAの塩基とスタッキングするか又は親和性を有するアミノ酸で置換される。
他の実施形態では、本開示は、別のCasXバリアントと比較して少なくとも1つの改変を含むCasXバリアントを提供する。例えば、CasXバリアント515及び527は、CasXバリアント491のバリアントであり、CasXバリアント668及び672は、CasX535のバリアントである(図44を参照)。いくつかの実施形態では、少なくとも1つの改変は、アミノ酸の挿入、欠失、又は置換からなる群から選択される。本明細書に記載の参照CasXタンパク質又はそれが由来するバリアントと比較した場合、CasXバリアントタンパク質の1つ以上の機能又は特徴を改善する全てのバリアントは、本開示の範囲内であると想定される。実施例に記載されるように、CasXバリアントは、別のCasXバリアントを生成するために変異誘発され得る。特定の実施形態では、本開示は、実施例14において、1つ以上のドメインにおける1つ以上の位置でのアミノ酸の置換、欠失、又は挿入をもたらす改変をコード配列に導入することによって生成されたCasX515(配列番号416)のバリアントを提供する。
本開示のCasXバリアントタンパク質を生成するための好適な変異誘発法には、例えば、網羅的変異進化(DME)、網羅的変異スキャニング(DMS)、エラープローンPCR、カセット変異誘発、ランダム変異誘発、付着伸長PCR、遺伝子シャフリング、又はドメインスワッピングが含まれ得る(国際出願PCT/US20/36506及び国際公開第2020247883(A2)号に記載されており、参照により本明細書に援用さる)。いくつかの実施形態では、CasXバリアントは、例えば、実施例に記載のアッセイを使用して同定されたCasXバリアントにおける複数の所望の変異を選択することによって設計される。特定の実施形態では、参照CasX又はCasXバリアントタンパク質の活性は、変異誘発前、それに対して1つ以上の得られたCasXバリアントの活性が比較されるベンチマークとして使用され、それによって、新しいCasXバリアントの機能の改善が測定される。
本明細書に記載のCasXバリアントのいくつかの実施形態では、少なくとも1つの改変は、以下を含む:(a)配列番号1、配列番号2、配列番号3の参照CasX、CasXバリアント491(配列番号336)、若しくはCasXバリアント515(配列番号416)と比較した、CasXバリアントにおける1~100個の連続した若しくは連続していないアミノ酸の置換、(b)参照CasX若しくはそれが由来するバリアントと比較した、CasXバリアントにおける1~100個の連続した若しくは連続していないアミノ酸の欠失、(c)参照CasX若しくはそれが由来するバリアントと比較した、CasXにおける1~100個の連続した若しくは連続していないアミノ酸の挿入、又は(d)(a)~(c)の任意の組み合わせ。いくつかの実施形態では、少なくとも1つの改変は、以下を含む:(a)配列番号1、配列番号2、配列番号3の参照CasX、又はそれが由来するバリアントと比較した、CasXバリアントにおける1~10個の連続した又は連続していないアミノ酸の置換、(b)参照CasX又はそれが由来するバリアントと比較した、CasXバリアントにおける1~5個の連続した又は連続していないアミノ酸の欠失、(c)参照CasX又はそれが由来するバリアントと比較した、CasXにおける1~5個の連続した又は連続していないアミノ酸の挿入、又は(d)(a)~(c)の任意の組み合わせ。
いくつかの実施形態では、CasXバリアントタンパク質は、配列番号1、配列番号2、配列番号3、CasX491、又はCasX515の配列と比較して、少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも20、少なくとも30、少なくとも40、少なくとも50、少なくとも60、少なくとも70、少なくとも80、少なくとも90、又は少なくとも100個の改変を有する配列を含むか又はそれからなる。いくつかの実施形態では、CasXバリアントタンパク質は、CasX491又は配列番号336と比較して1つ以上の置換を含む。いくつかの実施形態では、CasXバリアントタンパク質は、CasX515又は配列番号416と比較して1つ以上の置換を含む。これらの改変は、アミノ酸の挿入、欠失、置換、又はそれらの任意の組み合わせであり得る。改変は、CasXバリアントの1つのドメイン、又はいずれかのドメイン、又はドメインのいずれかの組み合わせにあり得る。本明細書に記載の置換において、任意のアミノ酸は、任意の他のアミノ酸と置換され得る。置換は、保存的置換であり得る(例えば、塩基性アミノ酸が別の塩基性アミノ酸に置換される)。置換は、非保存的置換であってもよい(例えば、塩基性アミノ酸が酸性アミノ酸に置換されるか、又はその逆も同様である)。例えば、参照CasXタンパク質におけるプロリンを、アルギニン、ヒスチジン、リジン、アスパラギン酸、グルタミン酸、セリン、スレオニン、アスパラギン、グルタミン、システイン、グリシン、アラニン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、トリプトファン、チロシン、又はバリンのうちのいずれかに置換して、本開示のCasXバリアントタンパク質を生成することができる。
本明細書に記載の実施形態の置換、挿入、及び欠失の任意の順列を組み合わせて、本開示のCasXバリアントタンパク質を生成することができる。例えば、CasXバリアントタンパク質は、参照CasXタンパク質配列又はCasX491若しくはCasX515の配列と比較して、少なくとも1つの置換及び少なくとも1つの欠失を含むことができ、参照CasXタンパク質配列又はCasX491若しくはCasX515の配列と比較して、少なくとも1つの置換及び少なくとも1つの挿入を含むことができ、参照CasXタンパク質配列又はCasX491若しくはCasX515の配列と比較して、少なくとも1つの挿入及び少なくとも1つの欠失を含むことができ、あるいは参照CasXタンパク質配列又はCasX491若しくはCasX515の配列と比較して、少なくとも1つの置換、少なくとも1つの挿入、及び少なくとも1つの欠失を含むことができる。
いくつかの実施形態では、CasXバリアントタンパク質は、400~2000アミノ酸、500~1500アミノ酸、700~1200アミノ酸、800~1100アミノ酸、又は900~1000アミノ酸を含む。
いくつかの実施形態では、CasXバリアントタンパク質は、表3に示される配列番号247~592又は1147~1231の配列を含む。いくつかの実施形態では、CasXバリアントタンパク質は、表3に示される配列番号247~592又は1147~1231の配列からなる。他の実施形態では、CasXバリアントタンパク質は、表3に示される配列番号247~592及び1147~1231の配列と少なくとも60%同一、少なくとも65%同一、少なくとも70%同一、少なくとも75%同一、少なくとも80%同一、少なくとも81%同一、少なくとも82%同一、少なくとも83%同一、少なくとも84%同一、少なくとも85%同一、少なくとも86%同一、少なくとも86%同一、少なくとも87%同一、少なくとも88%同一、少なくとも89%同一、少なくとも89%同一、少なくとも90%同一、少なくとも91%同一、少なくとも92%同一、少なくとも93%同一、少なくとも94%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一の配列を含む。いくつかの実施形態では、CasXバリアントタンパク質は、配列番号270~592又は1147~1231の配列を含むか、又はそれからなる。他の実施形態では、CasXバリアントタンパク質は、配列番号270~592又は1147~1231の配列と少なくとも60%同一、少なくとも65%同一、少なくとも70%同一、少なくとも75%同一、少なくとも80%同一、少なくとも81%同一、少なくとも82%同一、少なくとも83%同一、少なくとも84%同一、少なくとも85%同一、少なくとも86%同一、少なくとも86%同一、少なくとも87%同一、少なくとも88%同一、少なくとも89%同一、少なくとも89%同一、少なくとも90%同一、少なくとも91%同一、少なくとも92%同一、少なくとも93%同一、少なくとも94%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一の配列を含む。いくつかの実施形態では、CasXバリアントタンパク質は、配列番号415~592又は1147~1231の配列を含むか、又はそれからなる。他の実施形態では、CasXバリアントタンパク質は、配列番号416~592又は1147~1231の配列と少なくとも60%同一、少なくとも65%同一、少なくとも70%同一、少なくとも75%同一、少なくとも80%同一、少なくとも81%同一、少なくとも82%同一、少なくとも83%同一、少なくとも84%同一、少なくとも85%同一、少なくとも86%同一、少なくとも86%同一、少なくとも87%同一、少なくとも88%同一、少なくとも89%同一、少なくとも89%同一、少なくとも90%同一、少なくとも91%同一、少なくとも92%同一、少なくとも93%同一、少なくとも94%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一の配列を含む。(ND=記載されていないか、又はそうでなければ提供されていない)。
c.複数の供給源のタンパク質由来のドメインを有するCasXバリアントタンパク質
特定の実施形態では、本開示は、2つ以上の異なるCasXタンパク質(例えば、2つ以上の天然に存在するCasXタンパク質又は本明細書に記載される2つ以上のCasXバリアントタンパク質配列)由来のタンパク質ドメインを含むキメラCasXタンパク質を提供する。本明細書で使用される場合、「キメラCasXタンパク質」とは、異なる供給源(例えば、2つの天然に存在するタンパク質)から単離又は誘導された少なくとも2つのドメインを含むCasXを指し、これは、いくつかの実施形態では、異なる種から単離され得る。例えば、いくつかの実施形態では、キメラCasXタンパク質は、第1のCasXタンパク質由来の第1のドメインと、第2の異なるCasXタンパク質由来の第2のドメインと、を含む。いくつかの実施形態では、第1のドメインは、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択され得る。いくつかの実施形態では、第2のドメインは、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択され、第2のドメインは、前述の第1のドメインとは異なる。特定の実施形態では、514~791(配列番号415~592及び1147~1231)のCasXバリアントは、配列番号1の配列に由来するNTSBドメイン及びヘリックス1Bドメインを有し、一方、他のドメインは、配列番号2に由来し、このバリアントは、選択位置で更なるアミノ酸変化を有することが理解される。
d.gRNAに対するタンパク質親和性
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質と比較して、gRNAに対する改善された親和性を有し、リボ核タンパク質複合体(RNP)の形成をもたらす。gRNAに対するCasXバリアントタンパク質の親和性の増加は、例えば、RNP複合体の形成についてより低いKをもたらし得、これは、場合によっては、より安定なリボ核タンパク質複合体の形成をもたらし得る。いくつかの実施形態では、gRNAに対するCasXバリアントタンパク質の親和性の増加は、ヒト細胞に送達された場合、リボ核タンパク質複合体の安定性の増加をもたらす。この安定性の増加は、対象の細胞における複合体の機能及び有用性に影響を及ぼし得、並びに対象に送達された場合、血液における改善された薬物動態学特性をもたらし得る。いくつかの実施形態では、CasXバリアントタンパク質の親和性の増加、及び得られるリボ核タンパク質複合体の安定性の増加は、所望の活性、例えば、インビボ又はインビトロでの遺伝子編集を依然として有しながら、対象又は細胞に送達されるCasXバリアントタンパク質の用量がより低くなる。いくつかの実施形態では、CasXバリアントタンパク質のgRNAに対するより高い親和性(より強い結合)は、CasXバリアントタンパク質及びgRNAの両方がRNP複合体中に残っている場合、より多くの編集事象を可能にする。編集事象の増加は、本明細書に記載のtdTom編集アッセイなどの編集アッセイを使用して評価することができる。いくつかの実施形態では、gRNAに対するCasXバリアントタンパク質のKは、参照CasXタンパク質と比較して、少なくとも約1.1、少なくとも約1.2、少なくとも約1.3、少なくとも約1.4、少なくとも約1.5、少なくとも約1.6、少なくとも約1.7、少なくとも約1.8、少なくとも約1.9、少なくとも約2、少なくとも約3、少なくとも約4、少なくとも約5、少なくとも約6、少なくとも約7、少なくとも約8、少なくとも約9、少なくとも約10、少なくとも約15、少なくとも約20、少なくとも約25、少なくとも約30、少なくとも約35、少なくとも約40、少なくとも約45、少なくとも約50、少なくとも約60、少なくとも約70、少なくとも約80、少なくとも約90、又は少なくとも約100倍増加する。いくつかの実施形態では、CasXバリアントは、配列番号2の参照CasXタンパク質と比較して、gRNAに対して約1.1~約10倍増加した結合親和性を有する。
いくつかの実施形態では、gRNAに対するCasXバリアントタンパク質の親和性の増加は、対象へのインビボ送達を含む、哺乳動物細胞に送達された場合、リボ核タンパク質複合体の安定性の増加をもたらす。この安定性の増加は、対象の細胞における複合体の機能及び有用性に影響を及ぼし得、並びに対象に送達された場合、血液における改善された薬物動態学特性をもたらし得る。いくつかの実施形態では、CasXバリアントタンパク質の親和性の増加、及び得られるリボ核タンパク質複合体の安定性の増加は、所望の活性(例えば、インビボ又はインビトロ遺伝子編集)を依然として有しながら、対象又は細胞に送達されるCasXバリアントタンパク質の用量をより低くする。RNPを形成し、それらを安定な形態に保つ能力の増加は、アッセイ(例えば、本明細書の実施例に記載のインビトロ切断アッセイ)を使用して評価することができる。いくつかの実施形態では、本開示のCasXバリアントを含むRNPは、RNPとして複合体化した場合、配列番号1~3の参照CasXを含むRNPと比較して、少なくとも2倍、少なくとも5倍、又は少なくとも10倍高いk切断速度を達成することができる。
いくつかの実施形態では、CasXバリアントタンパク質のgRNAに対するより高い親和性(より強い結合)は、CasXバリアントタンパク質及びgRNAの両方がRNP複合体中に残っている場合、より多くの編集事象を可能にする。編集事象の増加は、本明細書に記載のアッセイなどの編集アッセイを使用して評価することができる。
理論に束縛されることを望むものではないが、いくつかの実施形態では、ヘリックスIドメインにおけるアミノ酸変化は、CasXバリアントタンパク質とgRNA標的化配列との結合親和性を増加させることができ、ヘリックスIIドメインにおける変化は、CasXバリアントタンパク質とgRNA足場ステムループとの結合親和性を増加させることができ、オリゴヌクレオチド結合ドメイン(OBD)における変化は、CasXバリアントタンパク質とgRNA三重鎖との結合親和性を増加させる。
gRNAに対するCasXタンパク質の結合親和性を測定する方法は、精製されたCasXタンパク質及びgRNAを使用するインビトロの方法を含む。参照CasX及びバリアントタンパク質に対する結合親和性は、gRNA又はCasXタンパク質がフルオロフォアでタグ付けされている場合、蛍光偏光によって測定することができる。代替的に、又は追加的に、結合親和性は、バイオレイヤー干渉法、電気泳動移動度シフトアッセイ(electrophoretic mobility shift assay、EMSA)、又は膜結合によって測定することができる。参照gRNA及びそのバリアントなどの特定のgRNAに対する、参照CasX及び本開示のバリアントタンパク質などのRNA結合タンパク質の絶対親和性を定量化するための更なる標準的な技術としては、等温熱量測定(isothermal calorimetry、ITC)及び表面プラズモン共鳴(surface plasmon resonance、SPR)、並びに実施例の方法が挙げられるが、これらに限定されない。
触媒的に不活性ないくつかの実施形態では、CasXバリアントタンパク質は、gRNA:標的核酸複合体化が起こるチャネルを形成する連続していない残基の領域に1つ以上の改変を含む。いくつかの実施形態では、CasXバリアントタンパク質は、gRNAと結合する界面を形成する連続していない残基の領域を含む1つ以上の改変を含む。例えば、参照CasXタンパク質のいくつかの実施形態では、ヘリックスI、ヘリックスII、及びOBDドメインは全て、gRNA:標的核酸複合体に接触又は近接しており、これらのドメインのうちのいずれかのドメイン内の連続していない残基に対する1つ以上の改変が、CasXバリアントタンパク質の機能を改善し得る。
いくつかの実施形態では、CasXバリアントタンパク質は、非標的鎖DNAと結合するチャネルを形成する連続していない残基の領域に1つ以上の改変を含む。例えば、CasXバリアントタンパク質は、NTSBドメインの連続していない残基に対する1つ以上の改変を含むことができる。いくつかの実施形態では、CasXバリアントタンパク質は、PAMと結合する界面を形成する連続していない残基の領域に1つ以上の改変を含む。例えば、CasXバリアントタンパク質は、ヘリックスIドメイン又はOBDの連続していない残基に対する1つ以上の改変を含み得る。いくつかの実施形態では、CasXバリアントタンパク質は、連続していない表面露出残基の領域を含む1つ以上の改変を含む。本明細書で使用される場合、「表面露出残基」は、CasXタンパク質の表面上のアミノ酸、又はアミノ酸の少なくとも一部(例えば、骨格若しくは側鎖の一部)がタンパク質の表面上にあるアミノ酸を指す。水性の細胞内環境に露出した細胞タンパク質(例えば、CasX)の表面露出残基は、多くの場合、正に帯電した親水性アミノ酸、例えば、アルギニン、アスパラギン、アスパラギン酸、グルタミン、グルタミン酸、ヒスチジン、リジン、セリン、及びスレオニンから選択される。したがって、例えば、本明細書に提供されるバリアントのいくつかの実施形態では、表面露出残基の領域は、参照CasXタンパク質と比較して、1つ以上の挿入、欠失、又は置換を含む。いくつかの実施形態では、1つ以上の正に帯電した残基は、1つ以上の他の正に帯電した残基、又は負に帯電した残基、又は帯電していない残基、又はそれらの任意の組み合わせと置換される。いくつかの実施形態では、置換のための1つ以上のアミノ酸残基は、近くに結合した核酸(例えば、標的核酸に接触するRuvCドメイン若しくはヘリックスIドメインにおける残基、又はgRNAに結合するOBD若しくはヘリックスIIドメインにおける残基)であり、1つ以上の正に帯電したアミノ酸若しくは極性アミノ酸と置換され得る。
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質のドメインにおける疎水性パッキングを介してコアを形成する連続していない残基の領域に1つ以上の改変を含む。いかなる理論にも束縛されることを望むものではないが、疎水性パッキングを介してコアを形成する領域は、疎水性アミノ酸(例えばバリン、イソロイシン、ロイシン、メチオニン、フェニルアラニン、トリプトファン、及びシステイン)に富む。例えば、いくつかの参照CasXタンパク質において、RuvCドメインは、活性部位に隣接する疎水性ポケットを含む。いくつかの実施形態では、領域の2~15個の残基は、帯電残基、極性残基、又は塩基スタッキング残基である。帯電アミノ酸(本明細書において残基と称されることもある)としては、例えば、アルギニン、リジン、アスパラギン酸、及びグルタミン酸を挙げることができ、これらのアミノ酸の側鎖は、架橋パートナーも存在することを条件として、塩橋を形成することができる(図14参照)。極性アミノ酸としては、例えば、グルタミン、アスパラギン、ヒスチジン、セリン、スレオニン、チロシン、及びシステインを挙げることができる。極性アミノ酸は、いくつかの実施形態では、それらの側鎖の同一性に応じて、プロトンドナー又はアクセプターとして水素結合を形成することができる。本明細書で使用される場合、「塩基スタッキング」は、アミノ酸残基(トリプトファン、チロシン、フェニルアラニン、又はヒスチジンなど)の芳香族側鎖と、核酸においてスタッキングされたヌクレオチド塩基との相互作用を含む。CasXバリアントタンパク質の機能的部分を形成するために空間的に近接している連続していないアミノ酸の領域に対する任意の修飾は、本開示の範囲内であると想定される。
e.複数の供給源のタンパク質由来のドメインを有するCasXバリアントタンパク質
特定の実施形態では、本開示は、2つ以上の異なるCasXタンパク質(例えば、2つ以上の天然に存在するCasXタンパク質又は本明細書に記載される2つ以上のCasXバリアントタンパク質配列)由来のタンパク質ドメインを含むキメラCasXバリアントタンパク質を提供する。本明細書で使用される場合、「キメラCasXタンパク質」とは、異なる供給源(例えば、2つの天然に存在するタンパク質)から単離又は誘導された少なくとも2つのドメインを含むCasXを指し、これは、いくつかの実施形態では、異なる種から単離され得る。例えば、いくつかの実施形態では、キメラCasXタンパク質は、第1のCasXタンパク質由来の第1のドメインと、第2の異なるCasXタンパク質由来の第2のドメインと、を含む。いくつかの実施形態では、第1のドメインは、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択され得る。いくつかの実施形態では、第2のドメインは、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択され、第2のドメインは、前述の第1のドメインとは異なる。例えば、キメラCasXタンパク質は、配列番号2のCasXタンパク質由来のNTSB、TSL、ヘリックスI、ヘリックスII、OBDドメイン、及び配列番号1のCasXタンパク質由来のRuvCドメインを含み得るか、又はその逆であり得る。更なる例として、キメラCasXタンパク質は、配列番号2のCasXタンパク質由来のNTSB、TSL、ヘリックスII、OBD、及びRuvCドメイン、並びに配列番号1のCasXタンパク質由来のヘリックスIドメインを含み得るか、又はその逆であり得る。したがって、特定の実施形態では、キメラCasXタンパク質は、第1のCasXタンパク質由来のNTSB、TSL、ヘリックスII、OBD、及びRuvCドメイン、並びに第2のCasXタンパク質由来のヘリックスIドメインを含み得る。キメラCasXタンパク質のいくつかの実施形態では、第1のCasXタンパク質のドメインは、配列番号1、配列番号2、又は配列番号3の配列に由来し、第2のCasXタンパク質のドメインは、配列番号1、配列番号2、又は配列番号3の配列に由来し、第1のCasXタンパク質と第2のCasXタンパク質は同じではない。いくつかの実施形態では、第1のCasXタンパク質のドメインは、配列番号1に由来する配列を含み、第2のCasXタンパク質のドメインは、配列番号2に由来する配列を含む。いくつかの実施形態では、第1のCasXタンパク質のドメインは、配列番号1に由来する配列を含み、第3のCasXタンパク質のドメインは、配列番号2に由来する配列を含む。いくつかの実施形態では、第2のCasXタンパク質のドメインは、配列番号1に由来する配列を含み、第3のCasXタンパク質のドメインは、配列番号2に由来する配列を含む。前述の例として、キメラRuvCドメインは、配列番号1のアミノ酸660~823及び配列番号2のアミノ酸921~978を含む。前述の代替例として、キメラRuvCドメインは、配列番号2のアミノ酸647~810及び配列番号1のアミノ酸934~986を含む。いくつかの実施形態では、少なくとも1つのキメラドメインは、キメラヘリックスIドメインを含み、キメラヘリックスIドメインが、配列番号1のアミノ酸56~99及び配列番号2のアミノ酸192~332を含む。いくつかの実施形態では、キメラCasXバリアントは、更に改変され、配列番号270、配列番号328、配列番号336、配列番号780、配列番号412、配列番号413、配列番号414、配列番号416、配列番号435、配列番号329、配列番号781、配列番号330、配列番号782、配列番号331、配列番号783、配列番号332、配列番号784、配列番号333、配列番号785、配列番号334、配列番号786、配列番号335、配列番号567、配列番号570、配列番号574、配列番号787、及び配列番号788の配列からなる群から選択されるCasXバリアントが含まれる。いくつかの実施形態では、1つ以上の追加の改変は、本明細書に記載の挿入、置換又は欠失を含む。
ヘリックスI、RuvC、及びOBDなどの分割又は非連続ドメインの場合、非連続ドメインの一部を任意の他の供給源由来の対応する部分で置換することができる。例えば、配列番号2におけるヘリックスI-Iドメイン(ヘリックスI-aと称されることもある)は、配列番号1由来の対応するヘリックスI-I配列などで置換され得る。表4に、参照CasXタンパク質由来のドメイン配列及びそれらの座標を示す。キメラCasXタンパク質の代表的な例としては、CasX472~483、485~491、及び515のバリアントが挙げられ、表3に、その配列を示す。

OBDI及びII、ヘリックスI-I及びI-II、並びにRuvC I及びIIは、本明細書において、OBDa及びb、ヘリックスIa及びb、並びにRuvCa及びbとも称される。
例示的なドメイン配列を、以下の表5に提供する。
更なる例示的なヘリックスIIドメイン配列が、配列番号2351として提供され、更なる例示的なRuvCaドメイン配列が、配列番号2352として提供される。
他の実施形態では、CasXバリアントタンパク質は、表3に示される配列番号247~592又は1147~1231の配列を含み、N末端、C末端、若しくはその両方のいずれかに、又はその近くに、本明細書に開示される1つ以上のNLSを更に含む。他の実施形態では、CasXバリアントタンパク質は、配列番号270~592及び1147~1231の配列を含み、N末端、C末端、若しくはその両方のいずれかに、又はその近くに、本明細書に開示される1つ以上のNLSを更に含む。他の実施形態では、CasXバリアントタンパク質は、配列番号415~592及び1147~1231の配列を含み、N末端、C末端、若しくはその両方のいずれかに、又はその近くに、本明細書に開示される1つ以上のNLSを更に含む。場合によっては、表のCasXバリアントのN末端メチオニンは、翻訳後修飾の間に、発現されたCasXバリアントから除去されることが理解されるであろう。当業者は、タンパク質のN末端又はC末端近くのNLSが、N末端又はC末端の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、又は20アミノ酸以内であり得ることを理解するであろう。
f.他のCasXバリアントに由来するCasXバリアント
バリアントタンパク質の生成の更なる反復において、バリアントタンパク質を利用して、本開示の更なるCasXバリアントを生成することができる。例えば、図44に示されるように、CasX119(配列番号270)、CasX491(配列番号336)、及びCasX515(配列番号416)は、それらが由来する参照CasX又はCasXバリアントと比較して改善を有する若しくは追加の特性を有する本開示の追加のCasXバリアントを生成するように改変された例示的なバリアントタンパク質である。CasX119は、配列番号2のL379Rの置換、A708Kの置換、及び793位のPの欠失を含む。CasX491は、配列番号1由来のNTSB及びヘリックス1Bスワップを含む。CasX515は、793位(配列番号2に対して)にPを挿入することによってCasX491から誘導され、実施例13及び14に記載のCasXバリアントを作製するために使用された。例えば、CasX668は、CasX515と比較して、26位にRの挿入及びG223Sの置換を有する。CasX672は、CasX515と比較して、L169K及びG223Sの置換を有する。CasX676は、CasX515と比較して、L169K及びG223Sの置換並びに26位にRの挿入を有する。
他のCasXバリアントに由来するCasXバリアントを生成及び評価するために使用される例示的な方法は、実施例に記載されており、これは、CasXバリアントの1つ以上のドメインにおける1つ以上の位置でのアミノ酸の置換、欠失、又は挿入をもたらす改変をコード配列に導入することによって生成された。特に、実施例14及び実施例15は、CasX515(配列番号416)のバリアントを生成するために使用される方法を記載しており、これらは、次いで、アミノ酸の挿入、欠失、又は置換によって改変された場合、アッセイにおいて濃縮又は改善をもたらす配列における位置を決定するためにアッセイされた。場合によっては、アッセイの結果を使用して、図34~図36のヒートマップを生成した。これらは、本方法によって改変された所与のアミノ酸位置における定性的及び定量的データを提供する。本開示の目的のために、CasX515のドメインの配列を表4に提供し、配列番号2342の配列を有するOBD-Iドメイン、配列番号2347の配列を有するOBD-IIドメイン、配列番号2335の配列を有するNTSBドメイン、配列番号2343の配列を有するヘリックスI-Iドメイン、配列番号2336の配列を有するヘリックスI-IIドメイン、配列番号2351の配列を有するヘリックスIIドメイン、配列番号2352の配列を有するRuvC-Iドメイン、配列番号2350の配列を有するRuvC-IIドメイン、及び配列番号2349の配列を有するTSLドメインを含む。本開示の方法によって、CasX515のドメインにおける個々の位置を改変し、アッセイし、各ドメイン又はサブドメインにおけるそれらの位置と比較して、得られた位置及びその後の濃縮又は改善をもたらす例示的な改変を提供する。場合によっては、そのような位置は、実施例の表21~24に開示されている。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2335と比較して、P2、S4、Q9、E15、G20、G33、L41、Y51、F55、L68、A70、E75、K88、及びG90からなる群から選択される、NTSBドメインにおける1つ以上のアミノ酸位置で1つ以上の改変(すなわち、挿入、欠失、又は置換)を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、配列番号2335と比較して、NTSBドメインにおける1つ以上のアミノ酸位置における1つ以上の改変は、^G2、^I4、^L4、Q9P、E15S、G20D、[S30]、G33T、L41A、Y51T、F55V、L68D、L68E、L68K、A70Y、A70S、E75A、E75D、E75P、K88Q、及びG90Qからなる群から選択される(ここで、「^」はその位置での挿入を表し、「[]」はその位置での欠失を表す)。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2336と比較して、I24、A25、Y29、G32、G44、S48、S51、Q54、I56、V63、S73、L74、K97、V100、M112、L116、G137、F138、及びS140からなる群から選択される、ヘリックスI-IIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、ヘリックスI-IIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変は、^T24、^C25、Y29F,G32Y、G32N、G32H、G32S、G32T、G32A、G32V、[G32]、G32S、G32T、G44L、G44H、S48H、S48T、S51T、Q54H、I56T、V63T、S73H、L74Y、K97G、K97S、K97D、K97E、V100L、M112T、M112W、M112R、M112K、L116K、G137R、G137K、G137N、^Q138、及びS140Qからなる群から選択される。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2351と比較して、L2、V3、E4、R5、Q6、A7、E9、V10、D11、W12、W13、D14、M15、V16、C17、N18、V19、K20、L22、I23、E25、K26、K31、Q35、L37、A38、K41、R42、Q43、E44、L46、K57、Y65、G68、L70、L71、L72、E75、G79、D81、W82、K84、V85、Y86、D87、I93、K95、K96、E98、L100、K102、I104、K105、E109、R110、D114、K118、A120、L121、W124、L125、R126、A127、A129、I133、E134、G135、L136、E138、D140、K141、D142、E143、F144、C145、C147、E148、L149、K150、L151、Q152、K153、L158、E166、及びA167からなる群から選択される、ヘリックスIIドメインにおける1つ以上のアミノ酸位置で1つ以上の改変を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、ヘリックスIIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変は、^A2、^H2、[L2]+[V3]、V3E、V3Q、V3F、[V3]、^D3、V3P、E4P、[E4]、E4D、E4L、E4R、R5N、Q6V、^Q6、^G7、^H9、^A9、VD10、^T10、[V10]、^F10、^D11、[D11]、D11S、[W12]、W12T、W12H、^P12、^Q13、^G12、^R13、W13P、W13D、^D13、W13L、^P14、^D14、[D14]+[M15]、[M15]、^T16、^P17、N18I、V19N、V19H、K20D、L22D、I23S、E25C、E25P、^G25、K26T、K27E、K31L、K31Y、Q35D、Q35P、^S37、[L37]+[A38]、K41L、^R42、[Q43]+[E44]、L46N、K57Q、Y65T、G68M、L70V、L71C、L72D、L72N、L72W、L72Y、E75F、E75L、E75Y、G79P、^E79、^T81、^R81、^W81、^Y81、^W82、^Y82、W82G、W82R、K84D、K84H、K84P、K84T、V85L、V85A、^L85、Y86C、D87G、D87M、D87P、I93C、K95T、K96R、E98G、L100A、K102H、I104T、I104S、I104Q、K105D、^K109、E109L、R110D、[R110]、D114E、^D114、K118P、A120R、L121T、W124L、L125C、R126D、A127E、A127L、A129T、A129K、I133E、^C133、^S134、^G134、^R135、G135P、L136K、L136D、L136S、L136H、[E138]、D140R、^D140、^P141、^D142、[E143]+[F144]、^Q143、F144K、[F144]、[F144]+[C145]、C145R、^G145、C145K、C147D、^V148、E148D、^H149、L149R、K150R、L151H、Q152C、K153P、L158S、E166L、及び^F167からなる群から選択される。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2352と比較して、I4、K5、P6、M7、N8、L9、V12、G49、K63、K80、N83、R90、M125、及びL146からなる群から選択される、RuvC-Iドメインにおける1つ以上のアミノ酸位置で1つ以上の改変を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、RuvC-Iドメインにおける1つ以上のアミノ酸位置での1つ以上の改変は、^I4、^S5、^T6、^N6、^R7、^K7、^H8、^S8、V12L、G49W、G49R、S51R、S51K、K62S、K62T、K62E、V65A、K80E、N83G、R90H、R90G、M125S、M125A、L137Y、^P137、[L141]、L141R、L141D、^Q142、^R143、^N143、E144N、^P146、L146F、P147A、K149Q、T150V、^R152、^H153、T155Q、^H155、^R155、^L156、[L156]、^W156、^A157、^F157、A157S、Q158K、[Y159]、T160Y、T160F、^I161、S161P、T163P、^N163、C164K、及びC164Mからなる群から選択される。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2342と比較して、I4、K5、P6、M7、N8、L9、V12、G49、K63、K80、N83、R90、M125、及びL146からなる群から選択される、OBD-Iドメインにおける1つ以上のアミノ酸位置で1つ以上の改変を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、OBD-Iドメインにおける1つ以上のアミノ酸位置での1つ以上の改変は、^G3、I3G、I3E、^G4、K4G、K4P、K4S、K4W、K4W、R5P、^P5、^G5、R5S、^S5、R5A、R5P、R5G、R5L、I6A、I6L、^G6、N7Q、N7L、N7S、K8G、K15F、D16W、^F16、^F18、^P27、M28P、M28H、V33T、R34P、M36Y、R41P、L47P、^P48、E52P、^P55、[P55]+[Q56]、Q56S、Q56P、^D56、^T56、及びQ56Pからなる群から選択される。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2347と比較して、I4、K5、P6、M7、N8、L9、V12、G49、K63、K80、N83、R90、M125、及びL146からなる群から選択される、OBD-IIドメインにおける1つ以上のアミノ酸位置で1つ以上の改変を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、OBD-Iドメインにおける1つ以上のアミノ酸位置での1つ以上の改変は、[S2]、I3R、I3K、[I3]+[L4]、[L4]、K11T、^P24、K37G、R42E、^S53、^R58、[K63]、M70T、I82T、Q92I、Q92F、Q92V、Q92A、^A93、K110Q、R115Q、L121T、^A124、^R141、^D143、^A143、^W144、及び^A145からなる群から選択される。いくつかの実施形態では、本開示は、CasX515に由来するCasXバリアントを提供し、配列番号2349と比較して、S1、N2、C3、G4、F5、I7、K18、V58、S67、T76、G78、S80、G81、E82、S85、V96、及びE98からなる群から選択される、TSLドメインにおける1つ以上のアミノ酸位置で1つ以上の改変を含み、改変が、CasX515と比較して、改善された特徴をもたらす。特定の実施形態では、OBD-Iドメインにおける1つ以上のアミノ酸位置での1つ以上の改変は、^M1、[N2]、^V2、C3S、^G4、^W4、F5P、^W7、K18G、V58D、^A67、T76E、T76D、T76N、G78D、[S80]、[G81]、^E82、^N82、S85I、V96C、V96T、及びE98Dからなる群から選択される。段落の同じ前述の改変のうちのいずれかの組み合わせを、本開示のCasXバリアントに同様に導入することができ、改善された特徴を有するCasXバリアントがもたらされることが理解されるであろう。例えば、一実施形態では、本開示は、CasX515と比較してG223Sの単一変異を有するCasXバリアント535(配列番号435)を提供する。別の実施形態
では、本開示は、CasX515と比較して26位にRの挿入及びG223Sの置換を有するCasXバリアント668(配列番号567)を提供する。別の実施形態では、本開示は、CasX515と比較してL169K及びG223Sの置換を有するCasX672(配列番号570)を提供する。別の実施形態では、本開示は、CasX515と比較して26にL169K及びG223Sの置換並びにRの挿入を有するCasX676(配列番号574)を提供する。CasX515と比較して改善された特徴を有するCasXバリアントは、表3のバリアントを含む。
参照CasXタンパク質における同じ特徴と比較して、又それらが由来するCasXバリアントと比較して、CasXバリアントタンパク質において改善され得る例示的な特徴としては、バリアントのフォールディングの改善、gRNAに対する結合親和性の改善、標的核酸に対する結合親和性の改善、標的核酸の編集及び/又は結合においてより広範囲のPAM配列を利用する能力の改善、標的DNAの巻き戻しの改善、編集活性の増加、編集効率の改善、標的核酸に対する編集特異性の改善、オフターゲット編集若しくは切断の減少、効率的に編集され得る真核生物ゲノムの割合の増加、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、DNAの非標的鎖の結合の改善、タンパク質安定性の改善、タンパク質:gRNA(RNP)複合体の安定性の改善、並びに改善された融合体特徴が挙げられるが、これらに限定されない。特定の実施形態では、実施例に記載されるように、このような改善された特徴としては、TTC、ATC、及びCTC PAM配列を有する標的核酸における切断活性の改善、標的核酸配列の切断に対する特異性の増加、並びに標的核酸のオフターゲット切断の減少が挙げられ得るが、これらに限定されない。
本明細書に記載の実施形態のCasXバリアントは、本明細書に開示されるgRNAとRNP複合体を形成する能力を有する。いくつかの実施形態では、本開示のCasXバリアントタンパク質及びgRNAを含むRNPは、20pM以下の濃度で、少なくとも80%の効率で二本鎖DNA標的を切断することができる。いくつかの実施形態では、20pM以下の濃度のRNPは、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、又は少なくとも95%の効率で二本鎖DNA標的を切断することができる。いくつかの実施形態では、50pM以下、40pM以下、30pM以下、20pM以下、10pM以下、又は5pM以下の濃度のRNPは、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、又は少なくとも95%の効率で二本鎖DNA標的を切断することができる。これらの改善された特徴は、以下により詳細に記載される。
g.タンパク質安定性
いくつかの実施形態では、本開示は、参照CasXタンパク質と比較して、改善された安定性を有するCasXバリアントタンパク質を提供する。いくつかの実施形態では、CasXバリアントタンパク質の改善された安定性は、より高い定常状態のタンパク質の発現をもたらし、編集効率を改善する。いくつかの実施形態では、CasXバリアントタンパク質の改善された安定性は、機能的なコンフォメーションにフォールディングされたままであるより大きな割合のCasXタンパク質をもたらし、編集効率を改善するか、又は製造目的のための精製可能性を改善する。本明細書で使用される場合、「機能的なコンフォメーション」は、タンパク質がgRNA及び標的核酸に結合することができるコンフォメーションにあるCasXタンパク質を指す。CasXバリアントがそれを触媒的に失活させる1つ以上の変異を有しない実施形態では、CasXバリアントは、標的核酸とハイブリダイズすることができる標的化配列を有するgRNAと複合体化した場合、標的核酸を切断、ニッキング、又は他の方法で改変することができる。CasXの機能的なコンフォメーションは、「切断コンピテント(cleavage competent)」なコンフォメーションを指す。いくつかの実施形態では、CasXバリアントタンパク質が機能的なコンフォメーションにフォールディングされたままであるより大きな割合のCasXタンパク質をもたらすそれらの実施形態を含めて、遺伝子編集などの適用には、参照CasXタンパク質と比較して、より低い濃度のCasXバリアントが必要とされる。したがって、いくつかの実施形態では、改善された安定性を有するCasXバリアントは、1つ以上の遺伝子編集状況において、参照CasXと比較して改善された効率を有する。
いくつかの実施形態では、本開示は、RNPが機能的な形態のままであるように、参照CasXタンパク質:gRNA複合体と比較して、CasXバリアントタンパク質:gRNA RNP複合体の改善された安定性を有するCasXバリアントタンパク質を提供する。安定性の改善は、熱安定性の増加、タンパク質分解に対する耐性、薬物動態特性の増強、ある範囲のpH条件にわたる安定性、塩条件、及び張性を含み得る。複合体の安定性の改善は、いくつかの実施形態では、編集効率の改善をもたらし得る。いくつかの実施形態では、CasXバリアント及びgRNAバリアントのRNPは、表1の配列番号1~3の参照CasX及び配列番号4又は5のgRNAのRNPと比較して、少なくとも2倍、少なくとも3倍、又は少なくとも4倍高い割合の切断コンピテントRNPを有する。増加した切断コンピテントRNPの例示的なデータは、実施例において提供されている。
いくつかの実施形態では、CasXバリアントタンパク質の改善された安定性は、参照CasXタンパク質と比較して改善されたCasXバリアントタンパク質のフォールディング動態を含む。いくつかの実施形態では、CasXバリアントタンパク質のフォールディング動態は、参照CasXタンパク質と比較して、少なくとも約5倍、少なくとも約10倍、少なくとも約50倍、少なくとも約100倍、少なくとも約500倍、少なくとも約1,000倍、少なくとも約2,000倍、少なくとも約3,000倍、少なくとも約4,000倍、少なくとも約5,000倍、又は少なくとも約10,000倍改善されている。いくつかの実施形態では、CasXバリアントタンパク質のフォールディング動態は、参照CasXタンパク質と比較して、少なくとも約1kJ/mol、少なくとも約5kJ/mol、少なくとも約10kJ/mol、少なくとも約20kJ/mol、少なくとも約30kJ/mol、少なくとも約40kJ/mol、少なくとも約50kJ/mol、少なくとも約60kJ/mol、少なくとも約70kJ/mol、少なくとも約80kJ/mol、少なくとも約90kJ/mol、少なくとも約100kJ/mol、少なくとも約150kJ/mol、少なくとも約200kJ/mol、少なくとも約250kJ/mol、少なくとも約300kJ/mol、少なくとも約350kJ/mol、少なくとも約400kJ/mol、少なくとも約450kJ/mol、又は少なくとも約500kJ/mol改善されている。
参照CasXタンパク質と比較してCasXバリアントタンパク質の安定性を増加させることができる例示的なアミノ酸変化としては、CasXバリアントタンパク質内の水素結合の数を増加させる、CasXバリアントタンパク質内のジスルフィド架橋の数を増加させる、CasXバリアントタンパク質内の塩橋の数を増加させる、CasXバリアントタンパク質の部分間の相互作用を強化する、CasXバリアントタンパク質の埋もれた疎水性表面を増加させるアミノ酸変化、又はそれらの任意の組み合わせを挙げることができるが、これらに限定されない。
h.gRNAに対するタンパク質親和性
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質又はそれが由来する別のCasXバリアントと比較して、gRNAに対する親和性が改善されており、リボ核タンパク質複合体の形成をもたらす。gRNAに対するCasXバリアントタンパク質の親和性の増加は、例えば、RNP複合体の形成についてより低いKをもたらし得、これは、場合によっては、より安定なRNP複合体形成をもたらす。いくつかの実施形態では、gRNAに対するCasXバリアントタンパク質の親和性の増加は、ヒト細胞に送達された場合、RNP複合体の安定性の増加をもたらす。この安定性の増加は、対象の細胞における複合体の機能及び有用性に影響を及ぼし得、並びに対象に送達された場合、血液における改善された薬物動態学特性をもたらし得る。いくつかの実施形態では、CasXバリアントタンパク質の親和性の増加、及び得られるRNP複合体の安定性の増加は、所望の活性、例えば、インビボ又はインビトロでの遺伝子編集を依然として有しながら、対象又は細胞に送達されるCasXバリアントタンパク質の用量がより低くなる。
いくつかの実施形態では、CasXバリアントタンパク質のgRNAに対するより高い親和性(より強い結合)は、CasXバリアントタンパク質及びgRNAの両方がRNP複合体中に残っている場合、より多くの編集事象を可能にする。編集事象の増加は、本明細書に記載の編集アッセイを使用して評価することができる。
いくつかの実施形態では、gRNAに対するCasXバリアントタンパク質のKは、参照CasXタンパク質又はそれが由来する別のCasXバリアントと比較して、少なくとも約1.1、少なくとも約1.2、少なくとも約1.3、少なくとも約1.4、少なくとも約1.5、少なくとも約1.6、少なくとも約1.7、少なくとも約1.8、少なくとも約1.9、少なくとも約2、少なくとも約3、少なくとも約4、少なくとも約5、少なくとも約6、少なくとも約7、少なくとも約8、少なくとも約9、少なくとも約10、少なくとも約15、少なくとも約20、少なくとも約25、少なくとも約30、少なくとも約35、少なくとも約40、少なくとも約45、少なくとも約50、少なくとも約60、少なくとも約70、少なくとも約80、少なくとも約90、又は少なくとも約100倍増加する。いくつかの実施形態では、CasXバリアントは、配列番号2の参照CasXタンパク質と比較して、gRNAに対して約1.1~約10倍増加した結合親和性を有する。
理論に束縛されることを望むものではないが、いくつかの実施形態では、ヘリックスIドメインにおけるアミノ酸変化は、CasXバリアントタンパク質とgRNA標的化配列との結合親和性を増加させることができ、ヘリックスIIドメインにおける変化は、CasXバリアントタンパク質とgRNA足場ステムループとの結合親和性を増加させることができ、オリゴヌクレオチド結合ドメイン(OBD)における変化は、CasXバリアントタンパク質とgRNA三重鎖との結合親和性を増加させる。
gRNAに対するCasXタンパク質の結合親和性を測定する方法は、精製されたCasXタンパク質及びgRNAを使用するインビトロの方法を含む。参照CasX及びバリアントタンパク質に対する結合親和性は、gRNA又はCasXタンパク質がフルオロフォアでタグ付けされている場合、蛍光偏光によって測定することができる。代替的に、又は追加的に、結合親和性は、バイオレイヤー干渉法、電気泳動移動度シフトアッセイ(EMSA)、又は膜結合によって測定することができる。参照gRNA及びそのバリアントなどの特定のgRNAに対する、参照CasX及び本開示のバリアントタンパク質などのRNA結合タンパク質の絶対親和性を定量化するための更なる標準的な技術としては、等温熱量測定(ITC)及び表面プラズモン共鳴(SPR)、並びに実施例の方法が挙げられるが、これらに限定されない。
i.標的核酸に対する親和性
いくつかの実施形態では、CasXバリアントタンパク質は、標的核酸に対する参照CasXタンパク質又はそれが由来する別のCasXバリアントの親和性と比較して、標的核酸に対する改善された結合親和性を有する。それらの標的核酸に対してより高い親和性を有するCasXバリアントは、いくつかの実施形態では、標的核酸に対して増加した親和性を有しない参照CasXタンパク質よりも迅速に標的核酸配列を切断することができる。
いくつかの実施形態は、標的核酸に対する改善された親和性は、標的核酸の標的配列若しくはプロトスペーサー配列に対する親和性の改善、PAM配列に対する親和性の改善、標的配列についてDNAを検索する能力の改善、又はそれらの任意の組み合わせを含む。理論に束縛されることを望むものではないが、CasXなどのCRISPR/Casシステムのタンパク質は、DNA分子に沿った一次元的な拡散によってそれらの標的配列を見出すことができると考えられている。このプロセスは、(1)リボ核タンパク質のDNA分子への結合、続いて、(2)標的配列での停止、を含むと考えられており、いくつかの実施形態では、これらはいずれも、標的核酸配列に対するCasXタンパク質の改善された親和性によって影響され得、それによって、参照CasXタンパク質と比較して、CasXバリアントタンパク質の機能を改善する。
いくつかの実施形態では、改善された標的核酸親和性を有するCasXバリアントタンパク質は、TTC、ATC、GTC、及びCTCからなる群から選択されるPAM配列を含む、配列番号2の参照CasXタンパク質によって認識される正準TTC PAM以外の特異的PAM配列に対する親和性又はそれを利用する能力が増加しており、それによって、野生型CasXヌクレアーゼ又はCasX199若しくは491のヌクレアーゼと比較して、編集され得る標的核酸の量が増加する。理論に束縛されることを望むものではないが、これらのタンパク質バリアントは、全体的にDNAとより強く相互作用し得、野生型参照CasX又はCasX199若しくは491のヌクレアーゼのPAM配列を超える更なるPAM配列を利用する能力に起因して、標的核酸内の配列にアクセスし、それを編集する増大した能力を有し得、それによって、標的配列についてのCasXタンパク質のより効率的な検索プロセスを可能にすることが可能である。DNAに対するより高い全体的な親和性はまた、いくつかの実施形態では、CasXタンパク質が結合及び巻き戻しステップを効果的に開始及び終了することができる頻度を増加させることができ、それによって、標的鎖侵入及びRループ形成、並びに最終的に標的核酸配列の切断を促進する。
理論に束縛されるものではないが、NTSBドメインにおけるアミノ酸変化は、巻き戻された状態の非標的核酸鎖の巻き戻し又は捕捉の効率を増加させ、標的核酸に対するCasXバリアントタンパク質の親和性を増加させることができる可能性がある。代替的に、又は追加的に、NTSBドメインにおけるアミノ酸変化は、巻き戻し中にDNAを安定化するNTSBドメインの能力を増大させ、標的核酸に対するCasXバリアントタンパク質の親和性を増加させることができる。代替的に、又は追加的に、OBDにおけるアミノ酸変化は、プロトスペーサー隣接モチーフ(PAM)へのCasXバリアントタンパク質結合の親和性を増加させ、それによって、標的核酸に対するCasXバリアントタンパク質の親和性を増加させ得る。代替的に、又は追加的に、ヘリックスI及び/又はヘリックスII、RuvC、並びにTSLドメインにおけるアミノ酸変化は、標的核酸鎖に対するCasXバリアントタンパク質の親和性を増加させ、標的核酸に対するCasXバリアントタンパク質の親和性を増加させることができる。
いくつかの実施形態では、標的核酸分子に対する本開示のCasXバリアントタンパク質の結合親和性は、参照CasXタンパク質又はそれが由来する別のCasXバリアントと比較して、少なくとも約1.1、少なくとも約1.2、少なくとも約1.3、少なくとも約1.4、少なくとも約1.5、少なくとも約1.6、少なくとも約1.7、少なくとも約1.8、少なくとも約1.9、少なくとも約2、少なくとも約3、少なくとも約4、少なくとも約5、少なくとも約6、少なくとも約7、少なくとも約8、少なくとも約9、少なくとも約10、少なくとも約15、少なくとも約20、少なくとも約25、少なくとも約30、少なくとも約35、少なくとも約40、少なくとも約45、少なくとも約50、少なくとも約60、少なくとも約70、少なくとも約80、少なくとも約90、又は少なくとも約100倍増加する。いくつかの実施形態では、CasXバリアントタンパク質は、配列番号1、配列番号2、若しくは配列番号3の参照タンパク質、又はCasX491及び515バリアントと比較して、標的核酸に対して約1.1~約100倍増加した結合親和性を有する。
いくつかの実施形態では、CasXバリアントタンパク質は、標的核酸の非標的鎖に対する増加した結合親和性を有する。本明細書で使用される場合、「非標的鎖」という用語は、gRNAにおける標的化配列とワトソン及びクリック塩基対を形成せず、標的核酸鎖に相補的であるDNA標的核酸配列の鎖を指す。いくつかの実施形態では、CasXバリアントタンパク質は、配列番号1、配列番号2、若しくは配列番号3の参照タンパク質、又は配列番号270若しくは配列番号336のCasXバリアントと比較して、標的核酸の非標的鎖に対して約1.1~約100倍増加した結合親和性を有する。
標的核酸分子及び/又は非標的核酸分子に対するCasXタンパク質(例えば、参照若しくはバリアント)の親和性を測定する方法は、電気泳動移動度シフトアッセイ(EMSA)、膜結合、等温熱量測定(ITC)、及び表面プラズモン共鳴(SPR)、蛍光偏光、及びバイオレイヤー干渉法(BLI)を含み得る。標的に対するCasXタンパク質の親和性を測定する更なる方法は、経時的にDNA切断事象を測定するインビトロ生化学的アッセイを含む。
j.標的部位に対する改善された特異性
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質又はそれが由来する別のCasXバリアントと比較して、標的核酸配列に対して改善された特異性を有する。本明細書で使用される場合、「特異性」(互換的に「標的特異性」と称されることもある)は、CRISPR/Casシステムリボ核タンパク質複合体が、標的核酸配列に類似するが同一ではないオフターゲット配列を切断する程度を指す。例えば、より高い程度の特異性を有するCasXバリアントRNPは、参照CasXタンパク質と比較して、配列のオフターゲット切断の低減を示す。CRISPR/Casシステムタンパク質の特異性、及び潜在的に有害なオフターゲット効果の低減は、哺乳動物対象における使用のための許容される治療指数を達成するために極めて重要であり得る。
いくつかの実施形態では、CasXバリアントタンパクは、gRNAの標的化配列に相補的である標的配列内の標的部位に対して改善された特異性を有する。上記のように、特異性の改善と相関するものは、オフターゲット編集の低減である。いくつかの実施形態では、CasXバリアントタンパク質は、RNPとしてCasXバリアントと複合体化したgRNAの標的化配列に100%相補的ではない標的配列内の標的部位に対するオフターゲット編集又は切断の低減を示す。理論に束縛されることを望むものではないが、標的核酸鎖に対するCasXバリアントタンパク質の特異性を増加させるヘリックスI及びIIドメインにおけるアミノ酸変化は、標的核酸全体に対するCasXバリアントタンパク質の特異性を増加させることができる可能性がある。いくつかの実施形態では、標的核酸に対するCasXバリアントタンパク質の特異性を増加させるアミノ酸変化はまた、DNAに対するCasXバリアントタンパク質の親和性の減少をもたらし得る。
CasXタンパク質(例えば、バリアント又は参照)の標的特異性を試験する方法は、ガイド及び配列決定による切断効果のインビトロ報告のための環状化(Circularization for In vitro Reporting of Cleavage Effects by Sequencing)(CIRCLE-seq)、又は同様の方法を含み得る。簡潔に、CIRCLE-seq技術では、ゲノムDNAを剪断し、ステム・ループアダプターのライゲーションによって環状化し、ステム・ループ領域にニックを入れて、4ヌクレオチドのパリンドロームオーバーハングを露出させる。これに続いて、残りの直鎖DNAの分子内ライゲーション及び分解が行われる。続いて、CasX切断部位を含む環状DNA分子をCasXで線状化し、アダプターアダプターを、露出した末端にライゲーションした後、ハイスループット配列決定を行って、オフターゲット部位についての情報を含むペアエンドリードを生成する。オフターゲット事象(したがって、CasXタンパク質の特異性)を検出するために使用することができる更なるアッセイとしては、それらの選択されたオフターゲット部位で形成されたインデル(挿入及び欠失)を検出及び定量化するために使用されるアッセイ(例えば、ミスマッチ検出ヌクレアーゼアッセイ及び次世代配列決定(next generation sequencing、NGS)が挙げられる。例示的なミスマッチ検出アッセイとしては、ヌクレアーゼアッセイが挙げられ、これは、CasX及びsgRNAで処理した細胞由来のゲノムDNAをPCR増幅し、変性させ、再ハイブリダイズして、1つの野生型鎖と1つのインデルを有する鎖とを含むヘテロ二重鎖DNAを形成する。ミスマッチは、Surveyorヌクレアーゼ又はT7エンドヌクレアーゼIなどのミスマッチ検出ヌクレアーゼによって認識及び切断される。CasXバリアントの特異性を評価するための方法は、CasXバリアントの実施形態の改善された特異性を実証する支持データとともに、実施例に記載されている。
k.プロトスペーサー及びPAM配列
本明細書において、プロトスペーサーは、ガイドRNAの標的化配列に相補的なDNA配列及びその配列に相補的なDNAとして定義され、それぞれ標的鎖及び非標的鎖と呼ばれる。本明細書で使用される場合、PAMは、プロトスペーサーに近位のヌクレオチド配列であり、これは、gRNAの標的化配列と併せて、プロトスペーサー鎖の潜在的な切断のためのCasXの配向及び位置決めを助ける。
PAM配列は縮重していてもよく、特定のRNP構築物は、異なる切断効率を支持する異なる好ましい許容されるPAM配列を有していてもよい。慣例に従って、別段の記載がない限り、本開示は、PAM及びプロトスペーサー配列の両方、並びに非標的鎖の配向に従ったそれらの方向性について言及する。これは、標的鎖ではなく非標的鎖のPAM配列が切断の決定因子であるか、又は標的認識に機構的に関与することを意味するものではない。例えば、TTC PAMに言及する場合、実際には、標的切断に必要な相補的なGAA配列であってもよく、又は両方の鎖からのヌクレオチドの何らかの組み合わせであってもよい。本明細書に開示されるCasXタンパク質の場合、PAMは、プロトスペーサーの5’側に位置し、単一のヌクレオチドがPAMをプロトスペーサーの第1のヌクレオチドから分離する。したがって、参照CasXの場合、TTC PAMは、式5’-...NNTTCN(プロトスペーサー)NNNNNN...3’(配列番号19)(式中、「N」は、任意のDNAヌクレオチドであり、「(プロトスペーサー)」は、ガイドRNAの標的化配列と同一性を有するDNA配列である)に従う配列を意味すると理解されるべきである。拡張されたPAM認識を有するCasXバリアントの場合、TTC、CTC、GTC、又はATC PAMは、以下の式に従う配列を意味すると理解されるべきである:5’-...NNTTCN(プロトスペーサー)NNNNNN...3’(配列番号19)、5’-...NNCTCN(プロトスペーサー)NNNNNN...3’(配列番号20);5’-...NNGTCN(プロトスペーサー)NNNNNN...3’(配列番号21);又は5’-...NNATCN(プロトスペーサー)NNNNNN...3’(配列番号22)。代替的に、TC PAMは、式5’-...NNNTCN(プロトスペーサー)NNNNNN...3’(配列番号23)に従う配列を意味すると理解されるべきである。
追加的に、本開示のCasXバリアントタンパク質は、TTC、ATC、GTC、又はCTC(5’から3’の配向で)から選択されるPAM配列を含むPAM TCモチーフを利用して、RNPとしてgRNAと複合体化した場合、参照CasXタンパク質及び参照gRNAのRNP、又はそれが由来する別のCasXバリアント(例えば、CasX491及びgRNA174)のRNPと比較して、標的核酸を効率的に編集及び/又はそれと結合する能力が増強されている。前述において、PAM配列は、同等のアッセイシステムにおける参照CasXタンパク質及び参照gRNAを含むRNPの編集効率及び/又は結合と比較して、アッセイシステムにおけるgRNAの標的化配列と同一性を有するプロトスペーサーの非標的鎖に対して少なくとも1ヌクレオチド5’側に位置する。一実施形態では、CasXバリアント及びgRNAバリアントのRNPは、標的DNAのPAM配列がTTCである、同等のアッセイシステムにおける参照CasXタンパク質及び参照gRNAを含むRNP(又はそれが由来する別のCasXバリアントのRNP、例えば、CasX491及びgRNA174)と比較して、より高い編集効率及び/又は標的核酸における標的配列の結合を示す。別の実施形態では、CasXバリアント及びgRNAバリアントのRNPは、標的DNAのPAM配列がATCである、同等のアッセイシステムにおける参照CasXタンパク質及び参照gRNAを含むRNP(又は、それが由来する別のCasXバリアントのRNP、例えば、CasX491及びgRNA174)と比較して、より高い編集効率及び/又は標的核酸における標的配列の結合を示す。CasXバリアントがATC PAMによる編集の増強を示す前述の特定の実施形態では、CasXバリアントは、528(配列番号428)である。別の実施形態では、CasXバリアント及びgRNAバリアントのRNPは、標的DNAのPAM配列がCTCである、同等のアッセイシステムにおける参照CasXタンパク質及び参照gRNAを含むRNP(又は、それが由来する別のCasXバリアントのRNP、例えば、CasX491及びgRNA174)と比較して、より高い編集効率及び/又は標的核酸における標的配列の結合を示す。別の実施形態では、CasXバリアント及びgRNAバリアントのRNPは、標的DNAのPAM配列がGTCである、同等のアッセイシステムにおける参照CasXタンパク質及び参照gRNAを含むRNP(又は、それが由来する別のCasXバリアント及びgRNA174のRNP)と比較して、より高い編集効率及び/又は標的核酸における標的配列の結合を示す。前述の実施形態では、1つ以上のPAM配列に対する増加した編集効率及び/又は結合親和性は、PAM配列についての配列番号1~3のうちのいずれか1つのCasXタンパク質及び表1のgRNAのRNPの編集効率及び/又は結合親和性と比較して、少なくとも1.5倍、少なくとも2倍、少なくとも4倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、若しくは少なくとも40倍、又はそれ以上大きい。改善された編集を実証する例示的なアッセイは、本明細書の実施例に記載されている(例えば、図41を参照されたい)。いくつかの実施形態では、CasXタンパク質は、標的核酸及び/又は標的核酸に会合するポリペプチド(例えば、ヒストンテールのメチル化又はアセチル化)に結合及び/又は改変(例えば、切断、ニッキング、メチル化、脱メチル化など)することができる。いくつかの実施形態では、CasXタンパクは、触媒的に不活性(dCasX)であるが、標的核酸に結合する能力を保持する。
l.DNAの巻き戻し
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質と比較して、改善されたDNAを巻き戻す能力を有する。不十分なdsDNA巻き戻しは、CRISPR/Casシステムタンパク質AnaCas9又はCas14のDNAを切断する能力を損なうか又は妨げることが以前に示されている。したがって、いかなる理論にも束縛されることを望むものではないが、本開示のいくつかのCasXバリアントタンパク質によるDNA切断活性の増加は、少なくとも部分的に、標的部位でdsDNAを見つけて巻き戻す能力の増加に起因する可能性が高い。CasXタンパク質(例えば、バリアント又は参照)がDNAを巻き戻す能力を測定する方法としては、蛍光偏光又はバイオレイヤー干渉法におけるdsDNA標的のオン速度の増加を観察するインビトロアッセイが挙げられるが、これらに限定されない。
理論に束縛されることを望むものではないが、NTSBドメインにおけるアミノ酸変化は、DNA巻き戻し特徴が増加したCasXバリアントタンパク質を産生することができると考えられる。代替的に、又は追加的に、OBD又はPAMと相互作用するヘリックスドメイン領域におけるアミノ酸変化はまた、DNA巻き戻し特徴が増加したCasXバリアントタンパク質を生成することができる。
CasXタンパク質(例えば、バリアント又は参照)がDNAを巻き戻す能力を測定する方法としては、蛍光偏光又はバイオレイヤー干渉法におけるdsDNA標的のオン速度の増加を観察するインビトロアッセイが挙げられるが、これらに限定されない。
m.触媒活性
本明細書に開示されるCasX:gRNAシステムのリボ核タンパク質複合体は、標的核酸に結合し、場合によっては標的核酸を切断するgRNAバリアントと複合体化したCasXバリアントを含む。いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質、又はそれが由来する別のCasXバリアントと比較して、改善された触媒活性を有する。理論に束縛されることを望むものではないが、場合によっては、標的鎖の切断が、dsDNA切断の生成におけるCas12様分子の制限因子であり得ると考えられる。いくつかの実施形態では、CasXバリアントタンパク質は、DNAの標的鎖の屈曲及びこの鎖の切断を改善し、CasXリボ核タンパク質複合体によるdsDNA切断の全体的な効率の改善をもたらす。
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質と比較して、又はそれが由来する別のCasXバリアントと比較して、増加したヌクレアーゼ活性を有する。ヌクレアーゼ活性が増加したバリアントは、例えば、RuvCヌクレアーゼドメインにおけるアミノ酸変化を介して生成することができる。いくつかの実施形態では、CasXバリアントは、ニッカーゼ活性を有するRuvCヌクレアーゼドメインを含む。前述において、CasX:gRNAシステムのCasXニッカーゼは、非標的鎖におけるPAM部位の3’側の10~18ヌクレオチド内に一本鎖切断を生成する。他の実施形態では、CasXバリアントは、二本鎖切断活性を有するRuvCヌクレアーゼドメインを含む。前述において、CasX:gRNAシステムのCasXは、標的鎖上のPAM部位の5’側18~26ヌクレオチド及び非標的鎖上の3’側10~18ヌクレオチド内に二本鎖切断を生成する。ヌクレアーゼ活性は、実施例の方法を含む様々な方法によってアッセイすることができる。いくつかの実施形態では、CasXバリアントは、参照CasXと比較して、少なくとも2倍、又は少なくとも3倍、又は少なくとも4倍、又は少なくとも5倍、又は少なくとも6倍、又は少なくとも7倍、又は少なくとも8倍、又は少なくとも9倍、又は少なくとも10倍大きいk切断定数を有する。
いくつかの実施形態では、CasXバリアントタンパク質は、gRNAを有するRNPを形成する改善された特徴を有し、実施例に記載されるように、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質及びgRNAのRNPと比較して、より高い割合の切断コンピテントRNPをもたらす。切断コンピテント(cleavage competent)とは、形成されるRNPが標的核酸を切断する能力を有することを意味する。いくつかの実施形態では、CasXバリアント及びgRNAのRNPは、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質及び表2のgRNAのRNPと比較して、少なくとも2倍、又は少なくとも3倍、又は少なくとも4倍、又は少なくとも5倍、又は少なくとも10倍の切断速度を示す。前述の実施形態では、改善されたコンピテンシー率は、実施例に記載されているようなインビトロアッセイにおいて実証することができる。
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXと比較して、二本鎖切断のための増加した標的鎖装填を有する。増加した標的鎖装填活性を有するバリアントは、例えば、TLSドメインにおけるアミノ酸変化を介して生成され得る。理論に束縛されることを望むものではないが、TSLドメインにおけるアミノ酸変化は、改善された触媒活性を有するCasXバリアントタンパク質をもたらし得る。代替的に、又は追加的に、RNA:DNA二重鎖の結合チャネル周囲のアミノ酸変化はまた、CasXバリアントタンパク質の触媒活性も改善することができる。
いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質と比較して、増加した付随的な切断活性を有する。本明細書で使用される場合、「付随的な切断活性」とは、標的核酸配列の認識及び切断に続く、核酸の更なる非標的化切断をいう。いくつかの実施形態では、CasXバリアントタンパク質は、参照CasXタンパク質と比較して、減少した付随的な切断活性を有する。
CasXタンパク質の触媒活性を特徴付けるための例示的な方法としては、以下の実施例の方法を含むインビトロ切断アッセイが挙げられ得るが、これらに限定されない。いくつかの実施形態では、アガロースゲル上でのDNA産物の電気泳動は、鎖切断の動態を調べることができる。
n.標的RNAに対する親和性
いくつかの実施形態では、参照CasXタンパク質又はそのバリアントを含むリボ核タンパク質複合体は、標的RNAに結合し、標的核酸を切断する。いくつかの実施形態では、参照CasXタンパク質のバリアントは、参照CasXタンパク質と比較した場合、標的RNAに対するCasXバリアントタンパク質の特異性を増加させ、標的RNAに対するCasXバリアントタンパク質の活性を増加させる。例えば、CasXバリアントタンパク質は、参照CasXタンパク質と比較した場合、標的RNAに対する結合親和性の増加又は標的RNAの切断の増加を示すことができる。いくつかの実施形態では、CasXバリアントタンパクを含むリボ核タンパク質複合体は、標的RNAに結合し、かつ/又は標的RNAを切断する。いくつかの実施形態では、CasXバリアントは、配列番号1、配列番号2、若しくは配列番号3の参照タンパク質、又は配列番号270若しくは配列番号336のCasXバリアントと比較して、少なくとも約2倍~約10倍増加した標的核酸に対する結合親和性を有する。
o.触媒的に不活性なCasXバリアント
いくつかの実施形態、例えば、標的核酸配列の切断が所望の結果ではない適用を包含する実施形態では、CasXバリアントタンパク質の触媒活性を改善することは、CasXバリアントタンパク質の触媒活性を変化、低下、又は消失させることを含む。いくつかの実施形態では、本開示は、標的核酸に相補的な標的化配列を有するgRNAと複合体化した場合、標的核酸に結合することができるが、標的核酸を切断することができない、触媒的に不活性なCasXバリアントタンパク質を提供する。例示的な触媒的に不活性なCasXタンパク質は、CasXタンパク質のRuvCドメインの活性部位に1つ以上の変異を含む。いくつかの実施形態では、触媒的に不活性なCasXバリアントタンパク質は、配列番号1と比較して、残基672、769、及び/又は935に置換を含む。一実施形態では、触媒的に不活性なCasXバリアントタンパク質は、配列番号1の参照CasXタンパク質と比較して、D672A、E769A、及び/又はD935Aの置換を含む。他の実施形態では、触媒的に不活性なCasXバリアントタンパク質は、配列番号2の参照CasXタンパク質と比較して、アミノ酸659、756、及び/又は922における置換を含む。いくつかの実施形態では、触媒的に不活性なCasXバリアントタンパク質は、配列番号2の参照CasXタンパク質と比較して、D659A、E756A、及び/又はD922A置換を含む。いくつかの実施形態では、触媒的に不活性なCasXバリアント527、668、及び676タンパク質は、エンドヌクレアーゼ活性を消失させるD660A、E757A、及びD922Aの改変を含む。更なる実施形態では、触媒的に不活性なCasXタンパク質は、CasXタンパク質のRuvCドメインの全部又は一部の欠失を含む。同じ前述の置換を、同様に本開示のCasXバリアントに導入することができ、触媒的に不活性なCasX(dCasX)バリアントをもたらすことが理解されるであろう。一実施形態では、RuvCドメインの全部又は一部がCasXバリアントから欠失され、dCasXバリアントをもたらす。触媒的に不活性なdCasXバリアントタンパク質は、いくつかの実施形態では、塩基編集又はエピジェネティック改変のために使用され得る。いくつかの実施形態では、DNAに対してより高い親和性を有する触媒的に不活性なdCasXバリアントタンパクは、触媒的に活性なCasXと比較して、それらの標的核酸をより速く見つけることができ、標的核酸により長い期間結合したままであり得、標的核酸により安定した様式で結合することができ、又はそれらの組み合わせであり得、それによって、その切断能力を保持するCasXバリアントと比較して、触媒的に不活性なCasXバリアントタンパク質のこれらの機能を改善する。例示的なdCasXバリアント配列は、表7に示される配列番号44~62及び1232~1235として開示される。いくつかの実施形態では、dCasXバリアントは、配列番号44~62又は1232~1235の配列と少なくとも80%同一、少なくとも85%同一、少なくとも90%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、又は少なくとも99%同一であり、dCasXバリアントタンパクの機能特性を保持している。いくつかの実施形態では、dCasXバリアントは、配列番号44~62又は1232~1235の配列を含む。
p.CasX融合タンパク質
いくつかの実施形態では、本開示は、本明細書に記載の実施形態のいずれかのCasXバリアントを含む、CasXに融合された異種タンパク質を含むCasXバリアントタンパク質を提供する。これは、異種タンパク質若しくはそのドメインへのCasXのN末端融合、C末端融合、又は内部融合を含むCasXバリアントを含む。
いくつかの実施形態では、CasX融合タンパク質は、融合タンパク質をもたらす、目的の異なる活性を有する1つ以上のタンパク質又はそのドメインに融合された、配列番号247~592若しくは1147~1231のバリアント、又は表3の配列のうちのいずれか1つを含む。いくつかの実施形態では、CasX融合タンパク質は、目的の異なる活性を有する1つ以上のタンパク質又はそのドメインに融合された、配列番号270~592又は1147~1231のバリアントのうちのいずれか1つを含む。いくつかの実施形態では、CasX融合タンパク質は、目的の異なる活性を有する1つ以上のタンパク質又はそのドメインに融合された、配列番号415~592又は1147~1231のバリアントのうちのいずれか1つを含む。例えば、いくつかの実施形態では、CasXバリアントタンパク質は、転写を阻害する、標的核酸を改変する、又は核酸に会合するポリペプチドを改変する(例えば、ヒストン改変)タンパク質(又はそのドメイン)に融合される。
いくつかの実施形態では、異種ポリペプチド(又はシステイン残基若しくは非天然アミノ酸などの異種アミノ酸)をCasXタンパク質内の1つ以上の位置に挿入して、CasX融合タンパク質を生成することができる。他の実施形態では、システイン残基をCasXタンパク質内の1つ以上の位置に挿入し、続いて、以下に記載する異種ポリペプチドをコンジュゲートすることができる。いくつかの代替的な実施形態では、異種ポリペプチド又は異種アミノ酸は、参照又はCasXバリアントタンパク質のN末端又はC末端に付加され得る。他の実施形態では、異種ポリペプチド又は異種アミノ酸は、CasXタンパク質の配列内に内部挿入され得る。
いくつかの実施形態では、CasXバリアント融合タンパク質は、RNA誘導型の配列特異的な標的核酸結合及び切断活性を保持する。場合によっては、CasXバリアント融合タンパク質は、異種タンパク質の挿入を有しない対応するCasXバリアントタンパク質の活性(例えば、切断活性及び/又は結合活性)の50%以上を有する(保持する)。場合によっては、CasXバリアント融合タンパク質は、異種タンパク質の挿入を有しない対応するCasXタンパク質の活性(例えば、切断活性及び/又は結合活性)の少なくとも約60%、又は少なくとも約70%、少なくとも約80%、又は少なくとも約90%、又は少なくとも約92%、又は少なくとも約95%、又は少なくとも約98%、又は少なくとも約100%を保持する。
場合によっては、参照CasX又はCasXバリアント融合タンパク質は、挿入された異種アミノ酸又は異種ポリペプチドを有しないCasXタンパク質の活性と比較して、標的核酸の結合活性を保持する(有する)。場合によっては、参照CasX又はCasXバリアント融合タンパク質は、異種タンパク質の挿入を有しない対応するCasXタンパク質の結合活性の少なくとも約60%、又は少なくとも約70%、少なくとも約80%、又は少なくとも約90%、又は少なくとも約92%、又は少なくとも約95%、又は少なくとも約98%、又は約100%を保持する。
場合によっては、CasXバリアント融合タンパク質は、挿入された異種アミノ酸又は異種ポリペプチドを有しない親CasXタンパク質の活性と比較して、標的核酸の結合活性及び/又は切断活性を保持する(有する)。例えば、場合によっては、CasXバリアント融合タンパク質は、対応する親CasXタンパク質(挿入を有しないCasXタンパク質)の結合活性及び/又は切断活性の50%以上を有する(保持する)。例えば、場合によっては、CasXバリアント融合タンパク質は、対応するCasX親タンパク質(挿入を有しないCasXタンパク質)の結合活性及び/又は切断活性の60%以上(70%以上、80%以上、90%以上、92%以上、95%以上、98%以上、又は100%)を有する(保持する)。CasXタンパク質及び/又はCasX融合タンパク質の切断活性及び/又は結合活性を測定する方法は、当業者に既知であり、任意の便利な方法を使用することができる。
様々な異種ポリペプチドが、本開示のCasXバリアント融合タンパク質に含めるのに好適である。場合によっては、融合パートナーは、標的核酸の転写を調節する(例えば、転写を阻害する、転写を増加させる)ことができる。例えば、場合によっては、融合パートナーは、転写を抑制するタンパク質(又はタンパク質由来のドメイン)(例えば、転写リプレッサー、転写抑制タンパク質の動員、メチル化などの標的核酸の改変、DNAモディファイヤーの動員、標的核酸に会合するヒストンの調節、ヒストンのアセチル化及び/又はメチル化を改変するものなどのヒストンモディファイヤーの動員などを介して機能するタンパク質)である。場合によっては、融合パートナーは、転写を増加させるタンパク質(又はタンパク質由来のドメイン)(例えば、転写アクチベーター、転写アクチベータータンパク質の動員、脱メチル化などの標的核酸の改変、DNAモディファイヤーの動員、標的核酸に会合するヒストンの調節、ヒストンのアセチル化及び/又はメチル化を改変するものなどのヒストンモディファイヤーの動員などを介して機能するタンパク質)である。
場合によっては、融合パートナーは、標的核酸配列を改変する酵素活性、例えば、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ化活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、又はグリコシラーゼ活性を有する。いくつかの実施形態では、CasXバリアントは、配列番号247~592又は1147~1231のうちのいずれか1つと、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、又は脱ミリストイル化活性を有するポリペプチドと、を含む。いくつかの実施形態、CasXバリアントは、配列番号270~592又は1147~1231のうちのいずれか1つと、上記のポリペプチドと、を含む。いくつかの実施形態、CasXバリアントは、配列番号415~592又は1147~1231のうちのいずれか1つと、上記のポリペプチドと、を含む。
転写を増加させるための融合パートナーとして使用することができるタンパク質(又はその断片)の例としては、転写アクチベーター(例えば、VP16、VP64、VP48、VP160、p65サブドメイン(例えば、NFkB由来)、及び(例えば、植物における活性の)EDLLの活性化ドメイン及び/又はTAL活性化ドメイン);ヒストンリジンメチルトランスフェラーゼ(例えば、SET1A、SET1B、MLL1~5、ASH1、SYMD2、NSD1など);ヒストンリジンデメチラーゼ(例えば、JHDM2a/b、UTX、JMJD3など);ヒストンアセチルトランスフェラーゼ(例えば、GCN5、PCAF、CBP、p300、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、SRC1、ACTR、P160、CLOCKなど);並びにDNAデメチラーゼ(例えば、Ten-Eleven Translocation(TET)ジオキシゲナーゼ1(TET1CD)、TET1、DME、DML1、DML2、ROS1など)が挙げられるが、これらに限定されない。
転写を減少させるための融合パートナーとして使用され得るタンパク質(又はその断片)の例としては、以下が挙げられるが、これらに限定されない:転写リプレッサー(例えば、Kruppel関連ボックス(KRAB又はSKD));KOX1抑制ドメイン;Mad mSIN3相互作用ドメイン(SID);ERFリプレッサードメイン(ERF repressor domain、ERD)、(例えば、植物における抑制のための)SRDX抑制ドメインなど;ヒストンリジンメチルトランスフェラーゼ(例えば、Pr-SET7/8、SUV4-20H1、RIZ1など);ヒストンリジンデメチラーゼ(例えば、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCYなど);ヒストンリジンデアセチラーゼ(例えば、HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11など);DNAメチラーゼ(例えば、HhaI DNA m5c-メチルトランスフェラーゼ(M.HhaI)、DNAメチルトランスフェラーゼ1(DNMT1)、DNAメチルトランスフェラーゼ3a(DNMT3a)、DNAメチルトランスフェラーゼ3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)など);及び末梢動員エレメント(例えば、Lamin A、Lamin Bなど)。
場合によっては、CasXバリアントに対する融合パートナーは、標的核酸(例えば、ssRNA、dsRNA、ssDNA、dsDNA)を改変する酵素活性を有する。融合パートナーによって提供され得る酵素活性の例としては、ヌクレアーゼ活性(例えば、制限酵素(例えば、FokIヌクレアーゼ)によって提供されるもの)、メチルトランスフェラーゼ活性(例えば、メチルトランスフェラーゼ(例えば、HhaI DNA m5c-メチルトランスフェラーゼ(M.Hhal)、DNAメチルトランスフェラーゼ1(DNMT1)、DNAメチルトランスフェラーゼ3a(DNMT3a)、DNAメチルトランスフェラーゼ3b(DNMT3b)、METI、DRM3(植物)、ZMET2、CMT1、CMT2(植物)などによって提供されるもの)、デメチラーゼ活性(例えば、デメチラーゼ(例えば、Ten-Eleven Translocation(TET)ジオキシゲナーゼ1(TET1 CD)、TET1、DME、DML1、DML2、ROS1など)によって提供されるもの)、DNA修復活性、DNA損傷活性、脱アミノ化活性(例えば、デアミナーゼ(例えば、シトシンデアミナーゼ酵素、例えば、ラットアポリポタンパク質BのmRNA編集酵素、触媒ペプチド1{APOBEC1}などのAPOBECタンパク質)によって提供されるもの)、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジン二量体形成活性、インテグラーゼ活性(例えば、インテグラーゼ及び/又はリゾルバーゼ(例えば、Ginインベルターゼ(例えば、GinインベルターゼGinH106Yの高活性変異体))、ヒト免疫不全ウイルス1型インテグラーゼ(IN)、Tn3リゾルバーゼなどによって提供されるもの)、トランスポザーゼ活性、リコンビナーゼ活性(例えば、リコンビナーゼ(例えば、Ginリコンビナーゼの触媒ドメイン)によって提供されるもの)、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、及びグリコシラーゼ活性が挙げられるが、これらに限定されない。
場合によっては、本開示のCasXバリアントタンパク質は、転写を増加させるためのドメイン(例えば、VP16ドメイン、VP64ドメイン)、転写を減少させるためのドメイン(例えば、KRABドメイン(例えば、Kox1タンパク質由来))、ヒストンアセチルトランスフェラーゼのコア触媒ドメイン(例えば、ヒストンアセチルトランスフェラーゼp300)、検出可能なシグナルを提供するタンパク質/ドメイン(例えば、GFPなどの蛍光タンパク質)、ヌクレアーゼドメイン(例えば、FokIヌクレアーゼ)、又は塩基エディター(例えば、APOBEC1などのシチジンデアミナーゼ)から選択されるポリペプチドに融合される。
いくつかの実施形態では、CasXバリアントは、転写を減少させるためのドメイン、酵素活性を有するドメイン、ヒストンアセチルトランスフェラーゼのコア触媒ドメイン、検出可能なシグナルを提供するタンパク質/ドメイン、ヌクレアーゼドメイン、及び塩基エディターからなる群から選択されるポリペプチドに融合された、配列番号247~592若しくは1147~1231のうちのいずれか1つ、又は配列番号270~592若しくは1147~1231のうちのいずれか1つ、又は配列番号415~592若しくは1147~1231のうちのいずれか1つ、又は表3の配列を含む。いくつかの実施形態では、CasXバリアントは、転写を減少させるためのドメイン、酵素活性を有するドメイン、ヒストンアセチルトランスフェラーゼのコア触媒ドメイン、検出可能なシグナルを提供するタンパク質/ドメイン、ヌクレアーゼドメイン、及び塩基エディターからなる群から選択されるポリペプチドに融合された、配列番号247~592又は1147~1231のうちのいずれか1つを含む。いくつかの実施形態では、CasXバリアントは、上記のポリペプチドに融合された配列番号270~592又は1147~1231のうちのいずれか1つを含む。いくつかの実施形態では、CasXバリアントは、上記のポリペプチドに融合された配列番号415~592又は1147~1231のうちのいずれか1つを含む。いくつかの実施形態では、CasXバリアントは、転写を減少させるためのドメイン、酵素活性を有するドメイン、ヒストンアセチルトランスフェラーゼのコア触媒ドメイン、検出可能なシグナルを提供するタンパク質/ドメイン、ヌクレアーゼドメイン、及び塩基エディターからなる群から選択されるポリペプチドに融合された、配列番号760~789のうちのいずれか1つを含む。いくつかの実施形態では、CasXバリアントは、転写を減少させるためのドメイン、酵素活性を有するドメイン、ヒストンアセチルトランスフェラーゼのコア触媒ドメイン、検出可能なシグナルを提供するタンパク質/ドメイン、ヌクレアーゼドメイン、及び塩基エディターからなる群から選択されるポリペプチドに融合された、配列番号411~592のうちのいずれか1つを含む。
場合によっては、本開示の参照CasXタンパク質又はCasXバリアントは、塩基エディターに融合される。塩基エディターには、ヌクレオシド又はヌクレオチド上のグアニン、アデニン、シトシン、チミン、又はウラシル塩基を改変することができるものが含まれる。塩基エディターとしては、アデノシンデアミナーゼ、シトシンデアミナーゼ(例えば、APOBEC1)、及びグアニンオキシダーゼが挙げられるが、これらに限定されない。したがって、本明細書に提供されるCasXバリアントのいずれかは、塩基エディターを含み得る(すなわち、それに融合され得る)。例えば、本開示のCasXバリアントは、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼに融合され得る。例示的な実施形態では、配列番号247~592又は1147~1231のうちのいずれか1つを含む本開示のCasXバリアントは、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼに融合される。更なる例示的な実施形態では、配列番号270~592又は1147~1231のうちのいずれか1つを含む本開示のCasXバリアントは、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼに融合される。更なる例示的な実施形態では、配列番号415~592又は1147~1231のうちのいずれか1つを含む本開示のCasXバリアントは、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼに融合される。
場合によっては、CasXバリアントに対する融合パートナーは、標的核酸(例えば、ssRNA、dsRNA、ssDNA、dsDNA)に会合するタンパク質(例えば、ヒストン、RNA結合タンパク質、DNA結合タンパク質など)を改変する酵素活性を有する。CasXバリアントとの融合パートナーによって提供され得る(標的核酸に会合するタンパク質を改変する)酵素活性の例としては、メチルトランスフェラーゼ活性(例えば、メチルトランスフェラーゼ(histone methyltransferase、HMT)(例えば、斑入り3-9ホモログ1のサプレッサー(SUV39H1、KMT1Aとしても知られる)、真性染色質ヒストンリジンメチルトランスフェラーゼ2(G9A、KMT1C及びEHMT2としても知られる)、SUV39H2、ESET/SETDB1など、SET1A、SET1B、MLL1~5、ASH1、SMYD2、NSD1、DOT1様ヒストンリジンメチルトランスフェラーゼ(DOT1L)、Pr-SET7/8、リジンメチルトランスフェラーゼ5B(SUV4-20H1)、zeste2ポリコーム抑制複合体2サブユニットのエンハンサー(EZH2)、PR/SETドメイン2(RIZ1)によって提供されるもの)、デメチラーゼ活性(例えば、ヒストンデメチラーゼ(例えば、リジンデメチラーゼ1A(KDM1A、LSD1としても知られる)、JHDM2a/b、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、JARID1A/RBP2、JARID1B/PLU-1、JARID1C/SMCX、JARID1D/SMCY、UTX、JMJD3など)によって提供されるもの)、アセチルトランスフェラーゼ活性(例えば、ヒストンアセチルトランスフェラーゼ(例えば、ヒトアセチルトランスフェラーゼp300の触媒コア/断片、GCN5、PCAF、CBP、TAF1、TIP60/PLIP、MOZ/MYST3、MORF/MYST4、HB01/MYST2、HMOF/MYST1、SRC1、ACTR、P160、CLOCKなど)によって提供されるもの)、デアセチラーゼ活性(例えば、ヒストンデアセチラーゼ(例えば、HDAC1、HDAC2、HDAC3、HDAC8、HDAC4、HDAC5、HDAC7、HDAC9、SIRT1、SIRT2、HDAC11など)によって提供されるもの)、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、及び脱ミリストイル化活性が挙げられるが、これらに限定されない。
CasXバリアントに対する好適な融合パートナーの更なる例としては、(i)ジヒドロ葉酸レダクターゼ(dihydrofolate reductase、DHFR)不安定化ドメイン(例えば、化学的に制御可能な対象のRNA誘導型ポリペプチドを生成するため)、及び(ii)葉緑体移行ペプチド、が挙げられる。
いくつかの実施形態では、CasXバリアントは、配列番号247~592若しくは1147~1231のうちのいずれか1つ、又は配列番号270~592若しくは1147~1231のうちのいずれか1つ、又は配列番号415~592若しくは1147~1231のうちのいずれか1つ、又は表3の配列と、葉緑体移行ペプチド(MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGR VKCMQVWPPIGKKKFETLSYLPPLTRDSRA(配列番号338);MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS(配列番号339);MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQV WPPIEKKKFETLSYLPDLTDSGGRVNC(配列番号340);MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC(配列番号341);MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC(配列番号342);MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLF CSFRISASVATAC(配列番号343);MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPH RFDRRCLSMVV(配列番号344);MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQ QRSVQRGSRRFPSVVVC(配列番号345);MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC(配列番号346);MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVIS RSAAAA(配列番号347);及びMGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS(配列番号348)が含まれるが、これらに限定されない)と、を含む。
場合によっては、本開示のCasXバリアントタンパク質は、エンドソームエスケープペプチドを含んでもよい。場合によっては、エンドソーム脱出ポリペプチドは、アミノ酸GLFXALLXLLXSLWXLLLXA(配列番号349)を含み、各Xは、独立して、リジン、ヒスチジン、及びアルギニンから選択される。場合によっては、エンドソーム脱出ポリペプチドは、アミノ酸配列GLFHALLHLLHSLWHLLLHA(配列番号350)又はHHHHHHHHH(配列番号351)を含む。いくつかの実施形態では、CasXバリアントは、配列番号247~592若しくは1147~1231のうちのいずれか1つ、又は配列番号270~592若しくは1147~1231のうちのいずれか1つ、又は配列番号415~592若しくは1147~1231のうちのいずれか1つの配列、又は表3の配列と、エンドソーム脱出ポリペプチドと、を含む。
ssRNA標的核酸配列を標的化する場合、使用のためのCasXバリアントのための融合パートナーの非限定的な例としては(限定されないが)、スプライシング因子(例えば、RSドメイン);タンパク質翻訳成分(例えば、翻訳開始、伸長、及び/又は終結因子;例えば、真核生物翻訳開始因子4γ{eIF4G});RNAメチラーゼ;RNA編集酵素(例えば、RNAデアミナーゼ(例えば、RNAに作用するアデノシンデアミナーゼ(adenosine deaminase acting on RNA、ADAR))、AからI及び/又はCからUの編集酵素を含む);ヘリカーゼ;RNA結合タンパク質などが挙げられる。異種ポリペプチドは、タンパク質全体を含み得るか、又は場合によっては、タンパク質の断片(例えば、機能的ドメイン)を含み得ることが理解される。
いくつかの実施形態では、配列番号247~592若しくは1147~1231のうちのいずれか1つ、又は配列番号270~592若しくは1147~1231のうちのいずれか1つ、又は配列番号415~592若しくは1147~1231のうちのいずれか1つ、あるいは表3の配列のCasXバリアントは、ssRNAと相互作用することができる任意のドメインの融合パートナーを含む(本開示の目的のために、分子内及び/又は分子間二次構造を含む、例えば、二本鎖RNA二重鎖(例えば、ヘアピン、ステムループなど)が含まれる)。これには、一過的か不可逆的か、直接的か又は間接的かにかかわらず、以下を含む群から選択されるエフェクタードメインが含まれるが、これらに限定されない:エンドヌクレアーゼ(例えば、RNase III、CRR22 DYWドメイン、Dicer、並びにSMG5及びSMG6などのタンパク質由来のPIN(PilT N末端)ドメイン);RNA切断の刺激に関与するタンパク質及びタンパク質ドメイン(例えば、切断及びポリアデニル化特異的因子{CPSF}、切断刺激因子{CstF}、CFIm、及びCFIIm);エキソヌクレアーゼ(例えば、クロマチン結合エキソヌクレアーゼXRN1(XRN-1)又はエキソヌクレアーゼT);デアデニラーゼ(例えば、DNA 5’-アデノシン一リン酸ヒドロラーゼ{HNT3});ナンセンス媒介RNA分解に関与する因子及びタンパク質ドメイン(例えば、UPF1 RNAヘリカーゼ及びATPアーゼ{UPF1}、UPF2、UPF3、UPF3b、RNP SI、RNA結合モチーフタンパク質8A{Y14}、DEKがん原遺伝子{DEK}、RNAプロセシングタンパク質REF2{REF2}、及びセリン-アルギニン反復マトリックス1{SRm160});RNAの安定化に関与するタンパク質及びタンパク質ドメイン(例えば、細胞質ポリ(A)結合タンパク質1{PABP});翻訳の抑制に関与するタンパク質及びタンパク質ドメイン(例えば、アルゴノートRISC触媒成分2{Ago2}及びAgo4);翻訳の刺激に関与するタンパク質及びタンパク質ドメイン(例えば、Staufen);翻訳の調節に関与する(例えば、翻訳を調節することができる)タンパク質及びタンパク質ドメイン(例えば、翻訳因子(例えば、開始因子、伸長因子、終結因子など、例えば、eIF4G));RNAのポリアデニル化に関与するタンパク質及びタンパク質ドメイン(例えば、ポリ(A)ポリメラーゼ(PAP1)、PAP関連ドメイン含有タンパク質;ポリ(A)RNAポリメラーゼgld-2{GLD-2}、及びStar-PAP);RNAのポリウリジニル化に関与するタンパク及びタンパクドメイン(例えば、末端ウリジリルトランスフェラーゼ{CID1}及び末端ウリジル酸トランスフェラーゼ);RNA局在に関与するタンパク及びタンパクドメイン(例えば、インスリン様増殖因子2 mRNA結合タンパク質1{IMP1}、Z-DNA結合タンパク質1{ZBP1}、She2p、She3p、及びBicaudal-D由来);RNAの核内保持に関与するタンパク質及びタンパク質ドメイン(例えば、Rrp6);RNAの核外輸送に関与するタンパク質及びタンパク質ドメイン(例えば、核RNA輸送因子1{TAP}、核RNA輸送因子1{NXF1}、THO複合体{THO}、TREX、REF、及びAly/REF輸送因子{Aly});RNAスプライシングの抑制に関与するタンパク質及びタンパク質ドメイン(例えば、ポリピリミジントラクト結合タンパク質1{PTB}、KH RNA結合ドメイン含有、シグナル伝達関連1 Sam68}、及びヘテロ核リボ核タンパク質A1{hnRNP A1});RNAスプライシングの刺激に関与するタンパク質及びタンパク質ドメイン(例えば、セリン/アルギニンリッチ(serine/arginine-rich、SR)ドメイン);転写効率の低下に関与するタンパク質及びタンパク質ドメイン(例えば、FUS RNA結合タンパク質{FUS(TLS));並びに転写の刺激に関与するタンパク質及びタンパク質ドメイン(例えば、サイクリン依存性キナーゼ7{CDK7}及びHIV Tat)。代替的に、エフェクタードメインは、以下を含む群から選択することができる:エンドヌクレアーゼ;RNA切断を刺激することができるタンパク質及びタンパク質ドメイン;エキソヌクレアーゼ;デアデニラーゼ;ナンセンス媒介RNA分解活性を有するタンパク質及びタンパク質ドメイン;RNAを安定化することができるタンパク質及びタンパク質ドメイン;翻訳を抑制することができるタンパク質及びタンパク質ドメイン;翻訳を刺激することができるタンパク質及びタンパク質ドメイン;翻訳を調節することができるタンパク質及びタンパク質ドメイン(例えば、翻訳因子(例えば、開始因子、伸長因子、終結因子など、例えば、eIF4G));RNAをポリアデニル化することができるタンパク質及びタンパク質ドメイン;RNAをポリウリジニル化することができるタンパク及びタンパクドメイン;RNA局在化活性を有するタンパク質及びタンパク質ドメイン;RNAを核内保持することができるタンパク質及びタンパク質ドメイン;RNA核外輸送活性を有するタンパク質及びタンパク質ドメイン;RNAスプライシングを抑制することができるタンパク質及びタンパク質ドメイン;RNAスプライシングを刺激することができるタンパク質及びタンパク質ドメイン;転写効率を低下させることができるタンパク質及びタンパク質ドメイン;並びに転写を刺激することができるタンパク質及びタンパク質ドメイン。別の好適な異種ポリペプチドは、PUF RNA結合ドメインであり、これは、国際公開第2012/068627号(その全体が参照により本明細書に援用される)により詳細に記載されている。
CasXバリアントとの融合パートナーとして(全体又はその断片で)使用することができるいくつかのRNAスプライシング因子は、別個の配列特異的なRNA結合モジュール及びスプライシングエフェクタードメインを有するモジュール構成を有する。例えば、セリン/アルギニンリッチ(serine/arginine-rich、SR)タンパク質ファミリーのメンバーは、プレmRNAにおけるエキソンスプライシングエンハンサー(exonic splicing enhancer、ESE)に結合するN末端RNA認識モチーフ(RNA recognition motif、RRM)及びエキソン封入を促進するC末端RSドメインを含む。別の例として、hnRNPタンパク質hnRNP A1は、そのRRMドメインを介してエキソンスプライシングサイレンサー(exonic splicing silencer、ESS)に結合し、C末端グリシンリッチドメインを介してエキソン封入を阻害する。いくつかのスプライシング因子は、2つの選択的部位の間の調節配列に結合することによって、スプライス部位(splice site、ss)の選択的使用を調節することができる。例えば、ASF/SF2は、ESEを認識し、イントロン近位部位の使用を促進することができるが、hnRNP A1は、ESSに結合し、スプライシングをイントロン遠位部位の使用にシフトさせることができる。かかる因子の1つの適用は、内因性遺伝子(特に、疾患関連遺伝子)の選択的スプライシングを調節するESFを作製することである。例えば、BCL2様1(Bcl-x)プレmRNAは、反対の機能のタンパク質をコードする2つの選択的5’スプライス部位を有する2つのスプライシングアイソフォームを産生する。長いスプライシングアイソフォームのBcl-xLは、長寿命の有糸分裂後細胞において発現される強力なアポトーシス阻害剤であり、多くのがん細胞において上方制御され、アポトーシスシグナルから細胞を保護する。短いアイソフォームのBcl-xSは、アポトーシス促進性アイソフォームであり、高い代謝率を有する細胞(例えば、発生中のリンパ球)において高レベルで発現される。2つのBcl-xスプライシングアイソフォームの比は、コアエキソン領域又はエキソン伸長領域(すなわち、2つの選択的5’スプライス部位間)のいずれかに位置する複数のccエレメントによって調節される。更なる例については、国際公開第2010/075303号を参照されたい(その全体が参照により本明細書に援用される)。
CasXバリアントとともに使用するための更なる好適な融合パートナーとしては、境界エレメント(例えば、CTCF)であるタンパク質(又はその断片)、末梢動員を提供するタンパク質及びその断片(例えば、ラミンA、ラミンBなど)、並びにタンパク質ドッキングエレメント(例えば、FKBP/FRB、Pill/Abylなど)が挙げられるが、これらに限定されない。
追加的に、又は代替的に、本開示のCasXバリアントタンパク質は、細胞による取り込みを促進するために、ポリペプチド透過性ドメインに融合され得る。いくつかの透過性ドメインが当該技術分野で既知であり、ペプチド、ペプチド模倣物、及び非ペプチド担体を含む本開示の非組み込み型ポリペプチドにおいて使用され得る。例えば、国際公開第2017/106569号及び米国特許出願公開第2018/0363009(A1)号(参照によりその全体が本明細書に援用される)は、Casタンパク質と細胞取り込みを促進するための1つ以上の核局在化配列(NLS)との融合体を記載している。他の実施形態では、透過性ペプチドは、アミノ酸配列RQIKIWFQNRRMKWKK(配列番号398)を含む、ペネトラチンと呼ばれるDrosophila melanogaster転写因子アンテナペディアの3番目のαヘリックスに由来し得る。別の例として、透過性ペプチドは、HIV-1 tat塩基性領域アミノ酸配列を含み、例えば、天然に存在するtatタンパク質のアミノ酸49~57を含み得る。他の透過性ドメインとしては、ポリアルギニンモチーフ、例えば、HIV-1 revタンパク質のアミノ酸34~56の領域、ノナアルギニン、オクタアルギニンなどが挙げられる。融合がなされる部位は、ポリペプチドの生物学的活性、分泌、又は結合特徴を最適化するために選択され得る。最適な部位は、日常的な実験によって決定される。
場合によっては、CasXバリアントとともに使用するための異種ポリペプチド(融合パートナー)は、細胞内局在化を提供する。すなわち、異種ポリペプチドは、細胞内局在化配列(例えば、核への標的化のための核局在化シグナル(nuclear localization signal、NLS)、融合タンパク質を核外に保持するための配列(例えば、核外輸送配列(nuclear export sequence、NES))、融合タンパク質を細胞質に保持するための配列、ミトコンドリアへの標的化のためのミトコンドリア局在化シグナル、葉緑体への標的化のための葉緑体局在化シグナル、ER保持シグナルなど)を含む。いくつかの実施形態では、対象のRNAガイドポリペプチド若しくは条件的活性型RNAガイドポリペプチド及び/又は対象のCasX融合タンパク質は、タンパク質が核に標的化されないように、NLSを含まない(これは、例えば、標的核酸が細胞質ゾルに存在するRNAである場合に有利であり得る)。いくつかの実施形態では、融合パートナーは、追跡及び/又は精製を容易にするためのタグを提供することができる。すなわち、異種ポリペプチドが検出可能な標識である(例えば、蛍光タンパク質、例えば、緑色蛍光タンパク質(green fluorescent protein、GFP)、黄色蛍光タンパク質(yellow fluorescent protein、YFP)、赤色蛍光タンパク質(red fluorescent protein、RFP)、シアン蛍光タンパク質(cyan fluorescent protein、CFP) 、mCherry、tdTomatoなど;ヒスチジンタグ、例えば、6×Hisタグ;赤血球凝集素(HA)タグ;FLAGタグ;Mycタグなど)。いくつかの実施形態では、CasXバリアントは、配列番号XX~XXのうちのいずれか1つ及び細胞内局在化配列又はタグを含む。
場合によっては、参照タンパク質又はCasXバリアントタンパク質は、核局在化シグナル(NLS)を含む(に融合される)。CasXバリアントとともに使用するのに好適なNLSの非限定的な例としては、以下に由来する配列と少なくとも約80%、少なくとも約90%、若しくは少なくとも約95%の同一性を有するか、又はそれと同一である配列が挙げられる:アミノ酸配列PKKKRKV(配列番号352)を有するSV40ウイルスラージT抗原のNLS;ヌクレオプラスミン由来のNLS(例えば、配列KRPAATKKAGQAKKKK(配列番号353)を有するヌクレオプラスミン二分NLS);アミノ酸配列PAAKRVKLD(配列番号354)又はRQRRNELKRSP(配列番号355)を有するc-myc NLS;配列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号356)を有するhRNPAl M9 NLS;インポーチンアルファ由来のIBBドメインの配列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号357);筋腫Tタンパク質の配列VSRKRPRP(配列番号358)及びPPKKARED(配列番号359);ヒトp53の配列PQPKKKPL(配列番号360);マウスc-abl IVの配列SALIKKKKKMAP(配列番号361);インフルエンザウイルスNS1の配列DRLRR(配列番号362)及びPKQKKRK(配列番号363);ヘルペスウイルスδ抗原の配列RKLKKKIKKL(配列番号364);マウスMxlタンパク質の配列REKKKFLKRR(配列番号365);ヒトポリ(ADP-リボース)ポリメラーゼの配列KRKGDEVDGVDEVAKKKSKK(配列番号366);ステロイドホルモン受容体(ヒト)グルココルチコイドの配列RKCLQAGMNLEARKTKK(配列番号367);ボルナ病ウイルスPタンパク質(Borna disease virus P protein、BDV-P1)の配列PRPRKIPR(配列番号368);C型肝炎ウイルス非構造タンパク質(HCV-NS5A)の配列PPRKKRTVV(配列番号369);LEF1の配列NLSKKKKRKREK(配列番号370);ORF57 simiraeの配列RRPSRPFRKP(配列番号371);EBV LANAの配列KRPRSPSS(配列番号372);インフルエンザAタンパク質の配列KRGINDRNFWRGENERKTR(配列番号373);ヒトRNAヘリカーゼA(human RNA helicase A、RHA)の配列PRPPKMARYDN(配列番号374);核小体RNAヘリカーゼIIの配列KRSFSKAF(配列番号375);TUS-タンパク質の配列KLKIKRPVK(配列番号376);インポーチンαに関連する配列PKKKRKVPPPPAAKRVKLD(配列番号377);HTLV-1のRexタンパク質由来の配列PKTRRRPRRSQRKRPPT(配列番号378);Caenorhabditis elegansのEGL-13タンパク由来の配列SRRRKANPTKLSENAKKLAKEVEN(配列番号379);並びに配列KTRRRPRRSQRKRPPT(配列番号380)、RRKKRRPRRKKRR(配列番号381)、PKKKSRKPKKKSRK(配列番号382)、HKKKHPDASVNFSEFSK(配列番号383)、QRPGPYDRPQRPGPYDRP(配列番号384)、LSPSLSPLLSPSLSPL(配列番号385)、RGKGGKGLGKGGAKRHRK(配列番号386)、PKRGRGRPKRGRGR(配列番号387)、PKKKRKVPPPPAAKRVKLD(配列番号388)、PKKKRKVPPPPKKKRKV(配列番号389)、PAKRARRGYKC(配列番号63)、KLGPRKATGRW(配列番号64)、PRRKREE(配列番号65)、PYRGRKE(配列番号66)、PLRKRPRR(配列番号67)、PLRKRPRRGSPLRKRPRR(配列番号68)、PAAKRVKLDGGKRTADGSEFESPKKKRKV(配列番号69)、PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(配列番号70)、PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(配列番号71)、PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(配列番号72)、KRKGSPERGERKRHW(配列番号73)、KRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号74)、及びPKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号75)。いくつかの実施形態では、1つ以上のNLSは、リンカーペプチドを用いて、CRISPRタンパク質又は隣接するNLSに連結され、リンカーペプチドが、RS、(G)n(配列番号1023)、(GS)n(配列番号1024)、(GSGGS)n(配列番号399)、(GGSGGS)n(配列番号400)、(GGGS)n(配列番号401)、GGSG(配列番号402)、GGSGG(配列番号403)、GSGSG(配列番号404)、GSGGG(配列番号405)、GGGSG(配列番号406)、GSSSG(配列番号407)、GPGP(配列番号408)、GGP、PPP、PPAPPA(配列番号409)、PPPG(配列番号24)、PPPGPPP(配列番号410)、PPP(GGGS)n(配列番号25)、(GGGS)nPPP(配列番号26)、AEAAAKEAAAKEAAAKA(配列番号1025)、及びTPPKTKRKVEFE(配列番号27)(式中、nは1~5である)からなる群から選択される。一般に、NLS(又は複数のNLS)は、真核細胞の核におけるCasXバリアント融合タンパク質の蓄積を駆動するのに十分強力なものである。核における蓄積の検出は、任意の好適な技術によって実施され得る。例えば、検出可能なマーカーは、細胞内の位置が可視化され得るように、CasXバリアント融合タンパク質に融合され得る。細胞核はまた、細胞から単離され得、次いで、その内容物が、タンパク質を検出するための任意の好適なプロセス(例えば、免疫組織化学、ウェスタンブロット、又は酵素活性アッセイ)によって分析され得る。核における蓄積はまた、間接的に決定され得る。
本開示は、CRISPRタンパク質への連結のための様々な構成での複数のNLSのアセンブリを企図する。いくつかの実施形態では、1、2、3、4個又はそれ以上のNLSが、リンカーペプチドによってCRISPRタンパク質のN末端に連結される。他の実施形態では、1、2、3、4個又はそれ以上のNLSが、リンカーペプチドによってCRISPRタンパク質のC末端に連結される。いくつかの実施形態では、CRISPRタンパク質のN末端に連結されたNLSは、C末端に連結されたNLSと同一である。他の実施形態では、CRISPRタンパク質のN末端に連結されたNLSは、C末端に連結されたNLSとは異なる。いくつかの実施形態では、CRISPRタンパク質のN末端に連結されたNLSは、表8に示されるN末端配列からなる群から選択される。いくつかの実施形態では、CRISPRタンパク質のC末端に連結されたNLSは、表8に示されるC末端配列からなる群から選択される。核における蓄積の検出は、任意の好適な技術によって実施され得る。例えば、検出可能なマーカーは、細胞内の位置が可視化され得るように、参照又はCasXバリアント融合タンパク質に融合され得る。細胞核はまた、細胞から単離され得、次いで、その内容物が、タンパク質を検出するための任意の好適なプロセス(例えば、免疫組織化学、ウェスタンブロット、又は酵素活性アッセイ)によって分析され得る。核における蓄積はまた、間接的に決定され得る。
いくつかの実施形態では、CasXバリアントは、配列番号63~75、219~236、239、352~389、983~1021、1237~1278のうちのいずれか1つ又は表8の配列のいずれかの1つ以上のNLSに融合された、配列番号247~592若しくは1147~1231のうちのいずれか1つ、又は配列番号270~592若しくは1147~1231のうちのいずれか1つ、又は配列番号415~592若しくは1147~1231のうちのいずれか1つ、又は表3の配列を含む。いくつかの実施形態では、1つ以上のNLSが、CasXバリアントのN末端又はその近傍に融合される。いくつかの実施形態では、1つ以上のNLSが、CasXバリアントのC末端又はその近傍に融合される。いくつかの実施形態では、1つ以上のNLSが、CasXバリアントのN末端及びC末端の両方に融合される。いくつかの実施形態では、NLSは、リンカーによって別のNLSに連結される。
場合によっては、参照又はCasXバリアント融合タンパク質は、「タンパク質形質導入ドメイン」又はPTD(CPP細胞透過ペプチドとしても知られる)を含み、これは、脂質二重層、ミセル、細胞膜、細胞小器官膜、又は小胞膜の横断を促進するタンパク質、ポリヌクレオチド、炭水化物、又は有機若しくは無機化合物を指す。別の分子(これは、小さな極性分子から大きな高分子及び/又はナノ粒子の範囲であり得る)に結合したPTDは、分子が膜を横断すること、例えば、細胞外空間から細胞内空間へ、又はサイトゾルから細胞小器官内へ移行することを容易にする。いくつかの実施形態では、PTDは、参照又はCasXバリアント融合タンパク質のアミノ末端に共有結合される。いくつかの実施形態では、PTDは、参照又はCasXバリアント融合タンパク質のカルボキシル末端に共有結合される。場合によっては、PTDは、好適な挿入部位で参照又はCasXバリアント融合タンパク質の配列の内部に挿入される。場合によっては、参照又はCasXバリアント融合タンパク質は、1つ以上のPTD(例えば、2つ以上、3つ以上、4つ以上のPTDを含む(にコンジュゲートされている、に融合されている)。場合によっては、PTDは、1つ以上の核局在化シグナル(NLS)を含む。PTDの例としては、以下が挙げられるが、これらに限定されない:YGRKKRRQRRR(配列番号390)、RKKRRQRR(配列番号391)を含むHIV TATのペプチド形質導入ドメイン;YARAAARQARA(配列番号392);THRLPRRRRRR(配列番号393);及びGGRRARRRRRR(配列番号394);細胞への侵入を指示するのに十分な数のアルギニン(例えば、3、4、5、6、7、8、9、10、又は10~50個のアルギニン)を含むポリアルギニン配列(配列番号1026);VP22ドメイン(Zender et al.(2002)Cancer Gene Ther.9(6): 489-96);Drosophilaアンテナペディアタンパク形質導入ドメイン(Noguchi et al.(2003)Diabetes 52(7):1732-1737);短縮型ヒトカルシトニンペプチド(Trehin et al.(2004)Pharm.Research 21:1248-1256);polylysine(Wender et al.(2000)Proc.Natl.Acad.Sci.USA 97:13003-13008);RRQRRTSKLMKR(配列番号395);トランスポータンGWTLNSAGYLLGKINLKALAALAKKIL(配列番号396);KALAWEAKLAKALAKALAKHLAKALAKALKCEA(配列番号397);並びにRQIKIWFQNRRMKWKK(配列番号398)。いくつかの実施形態では、PTDは、活性化可能CPP(ACPP)である(Aguilera et al.(2009)Integr Biol(Camb)June;1(5-6):371-381)。ACPPは、一致するポリアニオン(例えば、Glu9又は「E9」)に切断コンピテントリンカーを介して連結されたポリカチオン性CPP(例えば、Arg9又は「R9」)を含み、これは、正味電荷をほぼ0に減少させ、それによって、細胞への接着及び取り込みを阻害する。リンカーが切断されると、ポリアニオンが放出され、ポリアルギニン及びその固有の接着性を局所的にアンマスクし、したがって、ACPPを「活性化」して膜を通過させる。いくつかの実施形態では、CasXバリアントは、配列番号247~592若しくは1147~1231のうちのいずれか1つ、又は配列番号270~592若しくは1147~1231のうちのいずれか1つ、又は配列番号415~592若しくは1147~1231のうちのいずれか1つ、又は表3の配列及びPTDを含む。
いくつかの実施形態では、CasXバリアント融合タンパク質は、リンカーポリペプチド(例えば、1つ以上のリンカーポリペプチド)を介して内部に挿入された異種アミノ酸又は異種ポリペプチド(異種アミノ酸配列)に連結されたCasXタンパク質を含むことができる。いくつかの実施形態では、参照又はCasXバリアント融合タンパク質は、C末端及び/又はN末端において、リンカーポリペプチド(例えば、1つ以上のリンカーポリペプチド)を介して異種ポリペプチド(融合パートナー)に連結され得る。リンカーポリペプチドは、様々なアミノ酸配列のいずれかを有し得る。タンパク質は、一般的に柔軟な性質のスペーサーペプチドによって連結され得るが、他の化学結合は除外されない。好適なリンカーには、4アミノ酸~40アミノ酸長、又は4アミノ酸~25アミノ酸長のポリペプチドが含まれる。これらのリンカーは、一般に、合成のリンカーをコードするオリゴヌクレオチドを使用してタンパク質をカップリングすることによって生成される。ある程度の柔軟性を有するペプチドリンカーを使用することができる。連結ペプチドは、好ましいリンカーが一般的に柔軟なペプチドをもたらす配列を有するであろうことを考慮して、実質的に任意のアミノ酸配列を有し得る。グリシン及びアラニンなどの小アミノ酸の使用は、柔軟なペプチドの生成において有用である。かかる配列の生成は、当業者にとって日常的である。様々な異なるリンカーが市販されており、使用に好適であると考えられる。例示的なリンカーポリペプチドとしては、グリシンポリマー(G)n、グリシン-セリンポリマー(例えば、(GS)n(配列番号1024)、(GSGGS)n(配列番号399)、(GGSGGS)n(配列番号400)、及び(GGGS)n(配列番号401)を含み(式中、nは少なくとも1の整数である)、グリシン-アラニンポリマー、アラニン-セリンポリマー、グリシン-プロリンポリマー、プロリンポリマー、及びプロリン-アラニンポリマーが挙げられる。例示的なリンカーは、RS、(G)n、(GS)n(配列番号1024)、(GSGGS)n(配列番号399)、(GGSGGS)n(配列番号400)、(GGGS)n(配列番号401)、GGSG(配列番号402)、GGSGG(配列番号403)、GSGSG(配列番号404)、GSGGG(配列番号405)、GGGSG(配列番号406)、GSSSG(配列番号407)、GPGP(配列番号408)、GGP、PPP、PPAPPA(配列番号409)、PPPG(配列番号24)、PPPGPPP(配列番号410)、PPP(GGGS)n(配列番号25)、(GGGS)nPPP(配列番号26)、AEAAAKEAAAKEAAAKA(配列番号1025)、及びTPPKTKRKVEFE(配列番号27)(式中、nは1~5である)を含むがこれらに限定されないアミノ酸配列を含むことができる。当業者であれば、上記の任意のエレメントにコンジュゲートされたペプチドの設計は、リンカーが、柔軟なリンカー、並びにあまり柔軟ではない構造を付与する1つ以上の部分を含むことができるように、全て又は部分的に柔軟なリンカーを含むことができることを認識するであろう。
V.CasXバリアントタンパク質及びgRNAバリアントを作製する方法
本明細書に記載されるCasXバリアントタンパク質及びgRNAバリアントは、様々な方法によって構築することができる。そのような方法は、例えば、以下及び実施例、並びに国際出願PCT/US20/36506及び国際公開第2020247883(A2)号(参照により本明細書に援用される)に記載されている網羅的変異進化(DME)を含むことができる。
a.網羅的変異進化(DME)
いくつかの実施形態では、DMEは、改善された機能を有するCasXタンパク質及びsgRNA足場バリアントを同定するために使用される。DME法は、いくつかの実施形態では、生体分子バリアントのライブラリ(例えば、CasXバリアントタンパク質又はsgRNA足場バリアントのライブラリ)を生成するために、開始生体分子に対する変異の包括的なセットを構築及び試験することを含む。DMEは、開始生体分子に対して、アミノ酸(タンパク質の場合)又はヌクレオチド(RNA又はDNAの場合)の全ての可能な置換、並びに全ての可能な小さな挿入、及び全ての可能な欠失を作製することを包含し得る。図16に、DME法を示す概略図を示す。いくつかの実施形態では、DMEは、そのような全ての可能な置換、挿入、及び欠失のサブセットを含む。DMEの特定の実施形態では、バリアントの1つ以上のライブラリが構築され、機能的な変化について評価され、この情報が1つ以上の追加のライブラリを構築するために使用される。バリアントのそのような反復的な構築及び評価は、例えば、特定の方法で変異した場合に1つ以上の改善された機能をもたらすタンパク質又はRNAの領域など、特定の機能的な結果につながる変異テーマの同定をもたらし得る。次いで、このような同定された変異の層化は、例えば、相加的又は相乗的相互作用を介して、機能を更に改善することができる。DMEは、ライブラリ設計、ライブラリ構築、及びライブラリスクリーニングを含む。いくつかの実施形態では、複数ラウンドの設計、構築、及びスクリーニングが行われる。
b.ライブラリ設計
DME法は、多くのモノマーのポリマーである生体分子のバリアントを生成する。いくつかの実施形態では、生体分子は、タンパク質又はリボ核酸(RNA)分子を含み、モノマー単位は、それぞれアミノ酸又はリボヌクレオチドである。生体分子変異の基本単位は、(1)あるモノマーを異なる同一性の別のモノマーに交換すること(置換)、(2)生体分子に1つ以上の追加のモノマーを挿入すること(挿入)、又は(3)生体分子から1つ以上のモノマーを除去すること(欠失)、のいずれかを含む。本明細書に記載の任意の生体分子内の任意の1つ以上のモノマーに対する置換、挿入、及び欠失を単独で又は組み合わせて含むDMEライブラリは、本発明の範囲内であると考えられる。
いくつかの実施形態では、DMEは、全ての可能な置換、並びにアミノ酸(タンパク質の場合)又はヌクレオチド(RNAの場合)の小さな挿入及び欠失を包含する、生体分子に対する変異の包括的なセットを構築及び試験するために使用される。これらの変異の構築及び機能的読み出しは、確立された様々な分子生物学の方法を用いて達成され得る。いくつかの実施形態では、ライブラリは、モノマーに対する全ての可能な改変のサブセットを含む。例えば、いくつかの実施形態では、ライブラリは集合的に、生体分子における総モノマー位置の少なくとも10%について、1つのモノマーの単一の改変を表し、各単一の改変は、置換、単一の挿入、及び単一の欠失からなる群から選択される。いくつかの実施形態では、ライブラリは、集合的に、出発生体分子における総モノマー位置の少なくとも5%、少なくとも10%、少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、又は最大100%の、1つのモノマーの単一の改変を表す。特定の実施形態では、出発生体分子における総モノマー位置の特定の割合について、ライブラリは、集合的に、1つのモノマーの各可能な単一の改変、例えば、19個の他の天然に存在するアミノ酸(タンパク質の場合)若しくは3個の他の天然に存在するリボヌクレオチド(RNAの場合)による全ての可能な置換、20個の天然に存在するアミノ酸(タンパク質場合)若しくは4個の天然に存在するリボヌクレオチド(RNA場合)の各々の挿入、又はモノマーの欠失を表す。なお更なる実施形態では、各位置での挿入は、独立して、1つよりも多いモノマー、例えば、2つ以上、3つ以上、若しくは4つ以上のモノマーの挿入、又は1~4つ、2~4つ、若しくは1~3つのモノマーの挿入である。いくつかの実施形態では、位置での欠失は、独立して、1つよりも多いモノマー、例えば、2つ以上、3つ以上、若しくは4つ以上のモノマーの欠失、又は1~4つ、2~4つ、若しくは1~3つのモノマーの欠失である。CasXバリアント及びgRNAバリアントのそのようなライブラリの例は、それぞれ実施例14及び実施例15に記載されている。
いくつかの実施形態では、生体分子は、タンパク質であり、個々のモノマーは、アミノ酸である。生体分子がタンパク質である実施形態では、タンパク質における各モノマー(アミノ酸)位置での可能なDME変異の数は、19個のアミノ酸置換、20個のアミノ酸挿入、及び1個のアミノ酸欠失を含み、タンパク質において1アミノ酸当たり合計40個の可能な変異をもたらす。
いくつかの実施形態では、挿入を含むCasXバリアントタンパク質のDMEライブラリは、1アミノ酸挿入ライブラリ、2アミノ酸挿入ライブラリ、3アミノ酸挿入ライブラリ、4アミノ酸挿入ライブラリ、5アミノ酸挿入ライブラリ、6アミノ酸挿入ライブラリ、7アミノ酸挿入ライブラリ、8アミノ酸挿入ライブラリ、9アミノ酸挿入ライブラリ、又は10アミノ酸挿入ライブラリである。いくつかの実施形態では、挿入を含むCasXバリアントタンパク質のDMEライブラリは、1~4個のアミノ酸挿入を含む。
いくつかの実施形態では、生体分子は、RNAである。生体分子がRNAである実施形態では、RNAにおける各モノマー(リボヌクレオチド)位置での可能なDME変異の数は、3個のヌクレオチド置換、4個のヌクレオチド挿入、及び1個のヌクレオチド欠失を含み、1ヌクレオチド当たり合計8個の可能な変異をもたらす。
いくつかの実施形態では、DMEライブラリの設計は、生体分子における1つ以上の標的モノマーの各々についての全ての可能な変異を列挙することを含む。本明細書で使用される場合、「標的モノマー」とは、本明細書に記載の置換、挿入、及び欠失を有するDMEを標的化する生体分子ポリマーにおけるモノマーを指す。例えば、標的モノマーは、タンパク質における特定の位置のアミノ酸、又はRNAにおける特定の位置のヌクレオチドであり得る。生体分子は、少なくとも1、2、3、4、5、6、7、8、9、10、20、30、40、50、100、又はそれ以上の標的モノマーを有することができ、これらは、生体分子バリアントのDMEライブラリを生成するために体系的に変異される。いくつかの実施形態では、生体分子における全てのモノマーが、標的モノマーである。例えば、2つの標的アミノ酸が存在するタンパク質のDMEでは、DMEライブラリの設計は、2つの標的アミノ酸の各々で、40の可能なDME変異を列挙することを含む。更なる例では、4つの標的ヌクレオチドが存在するRNAのDMEでは、DMEライブラリの設計は、4つの標的ヌクレオチドの各々で、8つの可能なDME変異を列挙することを含む。いくつかの実施形態では、生体分子の各標的モノマーは、独立してランダムに選択されるか、又は意図的な設計によって選択される。したがって、いくつかの実施形態では、DMEライブラリは、ランダムバリアント、又は設計されたバリアント、又は単一の生体分子内のランダム変異及び設計された変異を含むバリアント、又はそれらの任意の組み合わせを含む。
DME法のいくつかの実施形態では、DME変異は、生体分子をコードする二本鎖DNAに組み込まれる。このDNAは、標準的なクローニングベクター(例えば、本明細書において標的プラスミドと称される細菌プラスミド)において維持及び複製され得る。例示的な標的プラスミドは、DMEに供される出発生体分子をコードするDNA配列、細菌の複製起点、及び好適な抗生物質耐性発現カセットを含む。いくつかの実施形態では、抗生物質耐性カセットは、カナマイシン、アンピシリン、スペクチノマイシン、ブレオマイシン、ストレプトマイシン、エリスロマイシン、テトラサイクリン、又はクロラムフェニコールに対する耐性を付与する。いくつかの実施形態では、抗生物質耐性カセットは、カナマイシンに対する耐性を付与する。
当該バリアントを含むライブラリは、様々な方法で構築することができる。特定の実施形態では、プラスミド組換え操作を使用してライブラリが構築される。そのような方法は、1つ以上の変異をコードするDNAオリゴヌクレオチドを使用して、参照生体分子をコードするプラスミドに当該変異を組み込むことができる。複数の変異を有する生体分子バリアントの場合、いくつかの実施形態では、2つ以上のオリゴヌクレオチドが使用される。いくつかの実施形態では、DNAオリゴヌクレオチドは、1つ以上の変異をコードし、変異領域は、変異に対して5’及び3’の両方で、標的プラスミドに相同な10~100ヌクレオチドに隣接する。このようなオリゴヌクレオチドは、いくつかの実施形態では、商業的に合成され得、PCR増幅において使用され得る。変異をコードするオリゴヌクレオチドの例示的な鋳型を以下に提供する。
5’-(N)10-100-変異-(N’)10-100-3’
この例示的なオリゴヌクレオチド設計では、Nは、標的プラスミドと同一の配列(本明細書においてホモロジーアームと称される)を表す。生体分子における特定のモノマーが変異を標的化する場合、これらのホモロジーアームは、標的プラスミドのモノマーをコードするDNAに直接隣接する。DMEを受ける生体分子がタンパク質であるいくつかの例示的な実施形態では、同じセットの相同アームを使用する40個の異なるオリゴヌクレオチドが、DMEを標的化するタンパク質における各アミノ酸残基について列挙された40個の異なるアミノ酸変異をコードするように使用される。変異が単一アミノ酸の変異である場合、1つ又は複数の所望の変異をコードする領域は、アミノ酸をコードする3つのヌクレオチド(置換又は単一の挿入の場合)又は0ヌクレオチド(欠失の場合)を含む。いくつかの実施形態では、オリゴヌクレオチドは、1つよりも多いアミノ酸の挿入をコードする。例えば、オリゴヌクレオチドがXアミノ酸の挿入をコードする場合、所望の変異をコードする領域は、Xアミノ酸をコードする3×Xヌクレオチドを含む。いくつかの実施形態では、変異領域は、2つ以上の変異、例えば、近接している(例えば、互いに隣接しているか、又は互いの1、2、3、4、5、6、7、8、9、若しくは10個、又はそれ以上のモノマー内にある)生体分子の2つ以上のモノマーに対する変異をコードする。
DMEを受ける生体分子がRNAであるいくつかの例示的な実施形態では、8つの異なるオリゴヌクレオチドが、同じセットのホモロジーアームを使用して、DMEを標的化するRNAにおける各ヌクレオチドに対する8つの異なる単一ヌクレオチド変異をコードする。変異が単一のリボヌクレオチドの変異である場合、変異をコードするオリゴの領域は、以下のヌクレオチド配列からなり得る:ヌクレオチドを指定する1つのヌクレオチド(置換又は挿入の場合)、又は0ヌクレオチド(欠失の場合)。いくつかの実施形態では、オリゴヌクレオチドは、一本鎖DNAオリゴヌクレオチドとして合成される。いくつかの実施形態では、DMEに供される生体分子の特定のアミノ酸又はヌクレオチドを標的化する全てのオリゴヌクレオチドがプールされる。いくつかの実施形態では、DMEに供される生体分子を標的化する全てのオリゴヌクレオチドがプールされる。DMEライブラリにおいて同時に生成され得る変異の種類又は数に制限はない。
c.ライブラリスクリーニング
DMEライブラリをスクリーニング又は選択するための任意の適切な方法は、本発明の範囲内であり、以下のように想定される。ハイスループット法を使用して、数千の個々の変異を有する大きなライブラリを評価することができる。いくつかの実施形態では、ライブラリのスクリーニング又は選択アッセイのスループットは、数百万個の個々の細胞におけるスループットを有する。いくつかの実施形態では、表現型及び遺伝子型は、生細胞を利用するアッセイが好ましく、それは、同じ脂質二重層内に含まれる性質によって生細胞において物理的に関連付けられるためである。生細胞を使用して、ライブラリ全体の亜集団を直接増幅することもできる。他の実施形態では、例えば、複数ラウンドの変異及び評価を通して開発されたフォーカスされたライブラリをスクリーニングするために、より小さなアッセイが、DME法において使用される。ライブラリをスクリーニングする例示的な方法は、実施例14及び15に記載されている。
いくつかの実施形態では、高度に機能的なバリアントについてスクリーニング又は選択されたDMEライブラリが、更に特徴付けられる。いくつかの実施形態では、DMEライブラリを更に特徴付けることは、配列決定(例えば、サンガー配列決定)によってDMEバリアントを個別に分析して、高度に機能的なバリアントを生じた1つ又は複数の特定の変異を同定することを包含する。生体分子の個々の変異体バリアントは、後の機能分析のために、標準的な分子生物学の技術によって単離することができる。いくつかの実施形態では、DMEライブラリを更に特徴付けることは、Iライブラリと高度に機能的なバリアントの1つ以上のライブラリとの両方のハイスループット配列決定を含む。このアプローチは、いくつかの実施形態では、ナイーブなDMEライブラリと比較して、高度に機能的なバリアントの1つ以上のライブラリにおいて過剰提示された変異の迅速な同定を可能にし得る。いかなる理論にも束縛されることを望むものではないが、高度に機能的なバリアントの1つ以上のライブラリにおいて過剰提示された変異は、高度に機能的なバリアントの活性に関連する可能性が高い。いくつかの実施形態では、DMEライブラリを更に特徴付けることは、個々のバリアントの配列決定と、ナイーブなライブラリ及び高度に機能的なバリアントの1つ以上のライブラリの両方のハイスループット配列決定との両方を含む。
ハイスループット配列決定は、ライブラリメンバーの機能的効果を示すハイスループットデータを生成することができる。1つ以上のライブラリが、全てのモノマー位置の全ての可能な変異を表す実施形態では、このようなハイスループット配列決定は、全ての可能なDME変異の機能的効果を評価することができる。このような配列決定はまた、所与のライブラリの1つ以上の高度に機能的な亜集団を評価するために使用することができ、これは、いくつかの実施形態では、改善された機能をもたらす変異の同定につながり得る。網羅的変異スキャニング
いくつかの実施形態では、網羅的変異スキャニング(DMS)が、改善された機能を有するCasXバリアントタンパク質を同定するために使用される。網羅的変異スキャニングは、機能に関連するタンパク質の可塑性を評価する。DMS法では、タンパク質の全てのアミノ酸を他の全てのアミノ酸に変更し、絶対的なタンパク質機能をアッセイする。例えば、CasXタンパク質における全てのアミノ酸を他の全てのアミノ酸に変化させることができ、変異したCasXタンパク質がDNAに結合又はそれを切断するそれらの能力についてアッセイすることができる。DMS CasXバリアントタンパク質のコレクションを特徴付けるために使用することができるCRISPRiアッセイ又は細菌ベースの切断アッセイなどの例示的なアッセイは、Oakes et al.(2016)“Profiling of engineering hotspots identifies an allosteric CRISPR-Cas9 switch”Nat Biotechnol 34(6): 646-51及びLiu et al.(2019)“CasX enzymes comprise a distinct family of RNA-guided genome editors”Nature doi.org/10.1038/s41586-019-0908に記載されている(これらの内容は、参照により本明細書に援用される)。
いくつかの実施形態では、DMSは、改善されたDNA結合活性を有するCasXタンパク質を同定するために使用される。いくつかの実施形態では、DNA結合活性は、CRISPRiアッセイを使用してアッセイされる。CRISPRiアッセイの非限定的な例示的な実施形態では、緑色蛍光タンパク質(GFP)又は赤色蛍光タンパク質(RFP)などの蛍光タンパク質を発現する細胞を、FACSを使用してアッセイして、sgRNA依存的な様式で蛍光タンパク質の発現を抑制することができるCasXバリアントを同定する。この例では、触媒的に不活性なCasX(dCasX)を使用して、アッセイされるDMS変異体のコレクションが生成される。野生型CasXタンパク質は、その同族sgRNAに結合し、タンパク質-RNA複合体を形成する。この複合体は、sgRNAとDNA標的との間のワトソンクリック塩基対合によって特定のDNA標的(この場合、蛍光タンパク質をコードするDNA配列)に結合する。野生型CasXの場合、DNAは、CasXタンパク質のヌクレアーゼ活性により切断される。しかしながら、理論に束縛されることを望むものではないが、dCasXは、依然としてsgRNAと複合体を形成し、特異的なDNA標的に結合することができる可能性が高い。dCasXの標的化がタンパク質コード領域で生じる場合、それは、RNAポリメラーゼII並びに転写開始及び/又は伸長を遮断し、FACによって検出され得る蛍光タンパク質の発現の減少をもたらす。
いくつかの実施形態では、DMSは、改善されたDNA切断活性を有するCasXタンパク質を同定するために使用される。CasXバリアントタンパク質のDNA切断効率をアッセイする方法は、当業者には明らかであろう。例えば、特定の標的核酸配列に相補的なスペーサーを有するsgRNAと複合体化したCasXタンパク質を使用して、好適な細胞型においてDNA標的配列をインビトロ又はインビボで切断し、切断部位における挿入及び欠失の頻度をアッセイすることができる。理論に束縛されることを望むものではないが、CasXによる切断又はニッキングは、DNAにおいて二本鎖切断を生成し、その後の非相同末端結合経路(NHEJ)による修復が、二本鎖切断部位で小さな挿入又は欠失(インデル)を生じさせる。CasX切断部位におけるインデルの頻度は、標的配列のハイスループット配列決定又はサンガー配列決定を使用して測定することができる。代替的に、又は追加的に、標的配列のCasX切断によるインデル生成の頻度は、ミスマッチアッセイ(例えば、T7エンドヌクレアーゼI(T7 Endonuclease I、T7EI)又はSurveyorミスマッチアッセイ)を使用して測定することができる。
いくつかの実施形態では、DMSに続いて、それらの得られた表現型と関連付けられたDMS変異体の遺伝子型のマップ(例えば、ヒートマップ)が生成され、タンパク質の基本原理を特徴付けるために使用される。全ての可能な変異は、そのタンパク質の機能的ランドスケープを確立するために、機能的又は非機能的なタンパク質産物をもたらすものとして特徴付けられる。
d.エラープローンPCR
いくつかの実施形態では、エラープローンPCRを使用して、改善された機能を有するCasXタンパク質又はsgRNA足場バリアントを生成する。DNAを複製するポリメラーゼは、異なるレベルの忠実度を有する。ランダム変異を遺伝子に導入する1つの方法は、ある範囲の頻度で誤ったヌクレオチドを組み込むであろうエラープローンポリメラーゼによるものである。この頻度は、所望の結果に応じて調節することができる。いくつかの実施形態では、タンパク質配列において平均n 1~4個のアミノ酸変化を生成するヌクレオチド変化の頻度をもたらすポリメラーゼ及びポリメラーゼ活性の条件が選択される。例示的なエラープローンポリメラーゼには、AgilentのGeneMorphIIキットが含まれる。GeneMorphIIキットは、製造者のプロトコルに従って、野生型CasXタンパク質(例えば、配列番号1、配列番号2、又は配列番号3のタンパク質)をコードするDNA配列を増幅するために使用することができ、それによって、タンパク質を偏りのないランダム変異誘発に供し、CasXバリアントタンパク質の多様な集団を生成する。次いで、CasXバリアントタンパク質のこの多様な集団は、どのように遺伝子型の変化が表現型の変化に関連するかを観察するために、DMSについて上に記載した同じアッセイを使用してアッセイすることができる。
e.カセット変異誘発
いくつかの実施形態では、カセット変異誘発を使用して、改善された機能を有するCasXバリアントタンパク質又はsgRNA足場バリアントを生成する。カセット変異誘発は、CasXタンパク質又はsgRNA足場などの目的の遺伝子の選択領域において多様性の高い小領域を作製するために、縮重ヌクレオチドによって置換される固有の制限酵素部位を利用する。例示的なカセット変異誘発プロトコルでは、制限酵素を使用して、好適なベクターに含まれるCasXタンパク質又はsgRNA足場をコードするDNA分子上の変異誘発のために標的化された配列の近くを切断する。このステップは、変異誘発のために標的化された配列及び制限部位間の全てを除去する。次いで、所望の変異及び制限消化末端に相補的な末端を含む合成二本鎖DNA分子が、制限消化によって除去された配列の代わりに連結され、連結されたベクターで、好適な細胞(例えば、E.coli)が形質転換される。いくつかの実施形態では、カセット変異誘発を使用して、CasXタンパク質又はsgRNA足場において1つ以上の特異的変異を生成することができる。いくつかの実施形態では、カセット変異誘発を使用して、本明細書に記載の方法を使用して改善された機能についてスクリーニング又は選択することができるCasXバリアントタンパク質又はsgRNA足場バリアントのライブラリを生成することができる。例えば、カセット変異誘発を使用してCasXバリアントを生成する際に、非標的鎖結合(NTSB)ドメインの一部を、縮重ヌクレオチドの配列で置換することができる。縮重ヌクレオチドの配列は、CasXタンパク質の領域(例えば、それらが高度に可動性のエレメントであるか又はそれらがDNAと直接接触することから関心対象であるNTSBの領域)に高度に局在化し得る。次いで、カセット変異誘発を介して生成されたCasXバリアントタンパク質のライブラリは、DME、DMS、及びエラープローンPCRについて本明細書に記載のアッセイを使用してスクリーニングされ得、バリアントが、改善された機能について選択され得る。
f.ランダム変異誘発
いくつかの実施形態では、ランダム変異誘発を使用して、改善された機能を有するCasXバリアントタンパク質又はsgRNA足場バリアントを生成する。ランダム変異誘発は、DNAを変化させる偏りのない方法である。ランダム変異誘発の例示的な方法は、当業者に既知であり、化学物質、UV光、X線への曝露、又は不安定細胞株の使用を含む。異なる変異誘発剤は、異なるタイプの変異を生成する。当業者は、適切な薬剤を選択して、所望のタイプの変異を生成することができる。例えば、エチルメタンスルホネート(EMS)及びN-エチル-N-ニトロソウレア(ENU)は、単一塩基対変化を生成するために使用され得るが、X線は、しばしば、欠失及び全体的な染色体再編成をもたらす。UV光曝露は、DNAにおける隣接するピリミジン間に二量体を生成し、これは点変異、欠失、及び再編成をもたらし得る。エラープローン細胞株を使用して、例えば、本開示のCasXタンパク質又はsgRNA足場を含むプラスミド上に変異を導入することもできる。CasXタンパク質(例えば、配列番号1、配列番号2、又は配列番号3のタンパク質)又はsgRNA足場をコードするDNA分子の集団を変異原に曝露して、CasXバリアントタンパク質又はsgRNA足場バリアントのコレクションを生成することができ、これらのコレクションを、本明細書に記載のアッセイのうちのいずれかを使用して、改善された機能についてアッセイすることができる。
g.付着伸長プロセス(StEP)
いくつかの実施形態では、付着伸長プロセス(staggered extension process)(StEP)を使用して、改善された機能を有するCasXバリアントタンパク質又はsgRNA足場バリアントを生成する。付着伸長プロセスは、PCR反応中にタンパク質の複数のバリアントの育種を可能にする特殊なPCRプロトコルである。StEPは、低い処理能力を有するポリメラーゼ(例えば、Taq又はVentポリメラーゼ)を利用して、有意なレベルの配列類似性を有する2つ以上の異なる鋳型鎖から短いプライマーを生成する。次いで、短いプライマーは、鋳型鎖のシャフリングを可能にする短い時間間隔で伸長される。この方法は、DMEバリアントをスタックする手段としても使用することができる。例示的なStEPプロトコルは、Zhao,H.et al.(1998)“Molecular evolution by staggered extension process(StEP)in vitro recombination”Nature Biotechnology 16:258-261によって記載されている(その内容は、その全体が参照により本明細書に援用される)。StEPは、CasXバリアントタンパク質又はsgRNA足場バリアントのコレクションを生成するために使用することができ、これらのコレクションは、本明細書に記載のアッセイのいずれかを使用して、改善された機能についてアッセイすることができる。
h.遺伝子シャフリング
いくつかの実施形態では、遺伝子シャフリングを使用して、改善された機能を有するCasXバリアントタンパク質又はsgRNA足場バリアントを生成する。いくつかの実施形態は、遺伝子シャフリングを使用して、プラスミド組換え操作などの本明細書に記載の他の方法によって産生されたバリアントを組み合わせる(本明細書において「スタックする」と称されることもある)。例示的な遺伝子シャフリングプロトコルでは、親遺伝子のセットを50~100塩基対(bp)の長さの小片に剪断するために、DNase(例えば、DNase I)が使用される。いくつかの実施形態では、これらの親遺伝子は、本明細書に記載の方法を使用して生成及び単離された、機能が改善されたCasXバリアントタンパク質を含む。いくつかの実施形態では、これらの親遺伝子は、本明細書に記載の方法を使用して生成及び単離された、機能が改善されたsgRNA足場バリアントを含む。次いで、Dnase断片化後、プライマーを用いないポリメラーゼ連鎖反応(PCR)が続く。十分に重複する相同配列を有するDNA断片は、互いにアニールし、次いで、DNAポリメラーゼによって伸長される。異なる変異を含む異なる断片がアニールする場合、これらの2つの変異を組み合わせた新しいバリアントが得られる。いくつかの実施形態では、プライマーを用いないPCR後、PCR伸長、及び親遺伝子(例えば、CasXタンパク質又はsgRNA足場をコードする配列)のサイズに達した、シャフリングされたDNA分子の精製が続く。次いで、これらの遺伝子は、別のPCRを用いて(例えば、シャフリングを受ける遺伝子の5’末端及び3’末端に相補的なPCRプライマーを添加することによって)増幅され得る。いくつかの実施形態では、プライマーは、クローニングベクターへのライゲーションに必要な制限酵素認識部位のための配列などの、それらの5’末端に付加される追加の配列を有してもよい。
i.ドメインスワッピング
いくつかの実施形態では、ドメインスワッピングを使用して、改善された機能を有するCasXバリアントタンパク質又はsgRNA足場バリアントを生成する。CasXバリアントタンパク質を生成するために、操作されたドメインスワッピングを使用して、部分を他のタンパク質及びCRISPR分子と混合し、マッチさせることができる。例えば、CRISPRタンパク質は、保存されたRuvCドメインを有するので、CasX RuvCドメインを他のCRISPRタンパク質のドメインとスワップすることができ、得られたタンパク質を、本明細書に記載のアッセイを使用して、改善されたDNA切断についてアッセイすることができる。sgRNAの場合、足場ステム、伸長ステム又はループは、他のRNAにおいて見出される構造と交換することができ、例えば、sgRNAの足場ステム及び伸長ステムは、他のRNA由来の熱安定性ステムループと交換することができ、得られたバリアントは、本明細書に記載のアッセイを使用して、改善された機能についてアッセイされる。いくつかの実施形態では、ドメインスワッピングを使用して、新しいドメインをCasXタンパク質又はsgRNAに挿入することができる。ドメインスワッピングがタンパク質に適用される一部の例示的な実施形態では、挿入されたドメインは、第2のタンパク質全体を含む。
j.CasX及びgRNAバリアントの産生
本開示のCasXバリアントタンパク質は、標準的なクローニング及び分子生物学の技術を使用して、又は実施例に記載されるように、コードするベクター(下記)で形質転換された真核細胞又は原核細胞によってインビトロで産生され得る。特定の配列及び調製の様式は、利便性、経済性、必要とされる純度などによって決定される。いくつかの実施形態では、まず、CasXバリアントをコードするDNA配列を含む構築物が調製される。かかる構築物の調製のための例示的な方法は、実施例に記載されている。いくつかの実施形態では、CasXタンパク質をコードするヌクレオチド配列は、意図された宿主細胞のためにコドン最適化される。次いで、構築物を使用して、タンパク質の発現及び回収のための宿主細胞(例えば、原核宿主細胞又は真核宿主細胞)を形質転換するのに好適な発現ベクターを生成する。所望であれば、宿主細胞は、E.coliである。他の実施形態では、宿主細胞は、真核細胞である。真核宿主細胞は、ベビーハムスター腎線維芽細胞(Baby Hamster Kidney、BHK)細胞、ヒト胎児腎臓293(HEK293)、ヒト胎児腎臓293T(HEK293T)、NS0細胞、SP2/0細胞、YO骨髄腫細胞、P3X63マウス骨髄腫細胞、PER細胞、PER.C6細胞、ハイブリドーマ細胞、NIH3T3細胞、SV40遺伝物質を有するCV-1(サル)起源(COS)細胞、HeLa、チャイニーズハムスター卵巣(Chinese hamster ovary、CHO)、若しくは酵母細胞、又は組換え産物の産生に好適な当該技術分野で既知の他の真核細胞から選択することができる。
所望により、他の分子又は表面への連結を可能にする様々な基を、合成中又は発現中に配列に導入することができる。したがって、システインは、チオエーテルを作製するために使用され得、ヒスチジンは、金属イオン錯体への連結のために使用され得、カルボキシル基は、アミド又はエステルを形成するために使用され得、アミノ基は、アミドを形成するために使用され得るなどである。本開示のCasXバリアントタンパク質はまた、組換え合成の従来の方法に従って単離及び精製され得る。発現宿主の溶解物を調製し、高性能液体クロマトグラフィー(HPLC)、排除クロマトグラフィー、ゲル電気泳動、アフィニティークロマトグラフィー、又は他の精製技術を使用して溶解物を精製することができる。ほとんどの場合、使用される組成物は、生成物の調製及びその精製の方法に関連する夾雑物に対して、80重量%以上、より通常は90重量%以上、好ましくは95重量%以上、そして治療目的の場合、通常99.5重量%以上の所望の生成物を含む。
本開示のgRNAの産生の場合、gRNAをコードする組換え発現ベクターは、gRNAを産生するために、例えば、T7プロモーター調節配列及びT7ポリメラーゼを使用してインビトロで転写され得、次いで、これは、従来の方法(例えば、実施例に記載されるゲル電気泳動による精製)によって回収され得る。合成されると、gRNAは、標的核酸に直接接触させるために遺伝子編集ペアにおいて利用され得、又は核酸を細胞に導入するための周知の技術(例えば、マイクロインジェクション、エレクトロポレーション、トランスフェクションなど)のいずれかによって細胞に導入され得る。
VI.ポリヌクレオチド及びベクター
別の態様では、本開示は、細胞における標的核酸の編集において有用であるクラス2、V型ヌクレアーゼ及びgRNAをコードするポリヌクレオチドに関する。いくつかの実施形態では、本開示は、CasXタンパク質をコードするポリヌクレオチド及び本明細書に記載の実施形態のいずれかのCasX: gRNAシステムのgRNAのポリヌクレオチドを提供する。
いくつかの実施形態では、本開示は、本明細書に記載の実施形態のいずれかのCasXバリアントをコードするポリヌクレオチド配列を提供し、表3に記載される配列番号247~592若しくは1147~1231のCasXタンパク質バリアント、又は表3の配列番号247~592及び1147~1231の配列と少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を含む。いくつかの実施形態では、本開示は、配列番号270~592若しくは1147~1231のうちのいずれかのCasXバリアントをコードするポリヌクレオチド配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を提供する。いくつかの実施形態では、本開示は、配列番号415~592若しくは1147~1231のうちのいずれかのCasXバリアントをコードするポリヌクレオチド配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を提供する。いくつかの実施形態では、本開示は、本明細書に記載の実施形態のいずれかのgRNAバリアント配列をコードする単離されたポリヌクレオチド配列を提供し、表2の配列番号2101~2332及び2353~2398の配列とともに、改変される標的核酸とハイブリダイズすることができる標的化配列を含む。いくつかの実施形態では、本開示は、配列番号2238~2332又は2353~2398のうちのいずれか1つのgRNAバリアント配列をコードする単離されたポリヌクレオチド配列とともに、改変される標的核酸とハイブリダイズすることができる標的化配列を提供する。いくつかの実施形態では、本開示は、配列番号2281~2332又は2353~2398のうちのいずれか1つのgRNAバリアント配列をコードする単離されたポリヌクレオチド配列とともに、改変される標的核酸とハイブリダイズすることができる標的化配列を提供する。
いくつかの実施形態では、本開示は、改変される遺伝子の一部又は全部をコードするドナー鋳型ポリヌクレオチドを提供する。いくつかの実施形態では、ドナー鋳型は、CasX:gRNAシステムと併せて遺伝子編集を目的とし、改変される遺伝子の少なくとも一部を含む。他の実施形態では、ドナー配列は、改変される遺伝子のエキソンの少なくとも一部をコードする配列を含む。他の実施形態では、ドナー鋳型は、改変される遺伝子のイントロンの少なくとも一部をコードする配列を有する。他の実施形態では、ドナー鋳型は、改変される遺伝子のイントロン-エキソン接合部の少なくとも一部をコードする配列を有する。他の実施形態では、ドナー鋳型は、改変される遺伝子の遺伝子間領域の少なくとも一部をコードする配列を有する。他の実施形態では、ドナー鋳型は、改変される遺伝子の調節エレメントの少なくとも一部をコードする配列を有する。場合によっては、ドナー鋳型は、改変される遺伝子の少なくとも一部をコードする野生型配列である。他の場合では、ドナー鋳型配列は、ノックダウン又はノックアウトされる野生型遺伝子と比較して、1つ以上の変異を含む。そのような場合、ドナー鋳型は、野生型配列と比較して、少なくとも1~5つ又はそれ以上の変異を有する。前述の実施形態では、ドナー鋳型は、少なくとも10ヌクレオチド、少なくとも100ヌクレオチド、少なくとも200ヌクレオチド、少なくとも300ヌクレオチド、少なくとも400ヌクレオチド、少なくとも500ヌクレオチド、少なくとも600ヌクレオチド、少なくとも700ヌクレオチド、少なくとも800ヌクレオチド、少なくとも900ヌクレオチド、少なくとも1,000ヌクレオチド、少なくとも2,000ヌクレオチド、少なくとも3,000ヌクレオチド、少なくとも4,000ヌクレオチド、少なくとも5,000ヌクレオチド、少なくとも6,000ヌクレオチド、少なくとも7,000ヌクレオチド、少なくとも8,000ヌクレオチド、少なくとも9,000ヌクレオチド、少なくとも10,000ヌクレオチド、少なくとも12,000ヌクレオチド、又は少なくとも15,000ヌクレオチドである。いくつかの実施形態では、ドナー鋳型は、少なくとも約10~約15,000ヌクレオチドを含む。いくつかの実施形態では、ドナー鋳型は、一本鎖DNA鋳型である。他の実施形態では、ドナー鋳型は、一本鎖RNA鋳型である。他の実施形態では、ドナー鋳型は、二本鎖DNA鋳型である。いくつかの実施形態では、ドナー鋳型は、遺伝子を編集するためのシステムにおいて裸の核酸として提供され得、ベクターに組み込まれる必要はない。他の実施形態では、ドナー鋳型をベクターに組み込んで(例えば、ウイルスベクターで)、細胞へのその送達を容易にすることができる。
他の態様では、本開示は、本明細書に記載の実施形態のいずれかのCasXバリアント又はgRNA(その相同バリアントを含む)をコードするポリヌクレオチド配列を産生するための方法、並びにポリヌクレオチド配列によって発現されるタンパク質又は転写されるRNAを発現させるための方法に関する。概して、本方法は、本明細書に記載の実施形態のいずれかのCasXバリアント又はgRNAをコードするポリヌクレオチド配列を産生することと、コード遺伝子を宿主細胞に適した発現ベクターに組み込むことと、を含む。分子生物学における標準的な組換え技術を使用して、本開示のポリヌクレオチド及び発現ベクターを作製することができる。本明細書に記載の実施形態のいずれかのコードされた参照CasX、CasXバリアント、又はgRNAの産生のために、本方法は、適切な宿主細胞をコードポリヌクレオチドを含む発現ベクターで形質転換することと、得られる本明細書に記載の実施形態のいずれかの参照CasX、CasXバリアント、又はgRNAが形質転換された宿主細胞において発現又は転写されることを引き起こすか又は可能にする条件下で宿主細胞を培養し、それによって、CasXバリアント又はgRNAを産生することと、を含み、それは、本明細書に記載の方法によって、又は当該技術分野で既知の標準的な精製方法によって、又は実施例に記載されるように回収される。
本開示によれば、本明細書に記載の実施形態のいずれかのCasXバリアント又はgRNA(又はそれらの相補体)をコードする核酸配列を使用して、適切な宿主細胞における発現を指示する組換えDNA分子を生成する。いくつかのクローニング戦略が本開示を実施するのに好適であり、その多くは、本開示の組成物をコードする遺伝子又はその相補体を含む構築物を生成するために使用される。いくつかの実施形態では、クローニング戦略を使用して、組成物の発現のために宿主細胞を形質転換するために使用される、CasXバリアント又はgRNAをコードするヌクレオチドを含む構築物をコードする遺伝子を生成する。
いくつかのアプローチでは、まず、CasXバリアント又はgRNAをコードするDNA配列を含む構築物が調製される。かかる構築物の調製のための例示的な方法は、実施例に記載されている。次いで、構築物を使用して、宿主細胞(例えば、CasX又はgRNAの場合、タンパク質構築物の発現及び回収のための原核宿主細胞又は真核宿主細胞)を形質転換するのに好適な発現ベクターを生成する。所望であれば、宿主細胞は、E.coliである。他の実施形態では、宿主細胞は、真核細胞である。真核宿主細胞は、ベビーハムスター腎線維芽細胞(Baby Hamster Kidney、BHK)細胞、ヒト胎児腎臓293(HEK293)、ヒト胎児腎臓293T(HEK293T)、NS0細胞、SP2/0細胞、YO骨髄腫細胞、P3X63マウス骨髄腫細胞、PER細胞、PER.C6細胞、ハイブリドーマ細胞、NIH3T3細胞、SV40遺伝物質を有するCV-1(サル)起源(COS)細胞、HeLa、チャイニーズハムスター卵巣(Chinese hamster ovary、CHO)、若しくは酵母細胞、又は組換え産物の産生に好適な当該技術分野で既知の他の真核細胞から選択することができる。発現ベクターの生成、宿主細胞の形質転換、並びにCasXバリアント又はgRNAの発現及び回収のための例示的な方法は、実施例に記載されている。
CasXバリアント又はgRNA構築物をコードする遺伝子は、完全に合成的に、又は実施例でより詳細に記載される方法を含む、制限酵素媒介クローニング、PCR、及び重複伸長などの酵素プロセスと組み合わせた合成によって、1つ以上のステップで作製することができる。本明細書に開示される方法は、例えば、所望の配列の様々な成分(例えば、CasX及びgRNA)遺伝子をコードするポリヌクレオチドの配列をライゲーションするために使用することができる。ポリペプチド組成物をコードする遺伝子は、遺伝子合成の標準的な技術を使用して、オリゴヌクレオチドから構築される。
いくつかの実施形態では、CasXタンパク質をコードするヌクレオチド配列は、意図された宿主細胞のためにコドン最適化される。このタイプの最適化は、同じCasXタンパク質をコードしながら、意図された宿主生物又は細胞のコドン選好性を模倣するために、コードヌクレオチド配列の変異を伴い得る。したがって、コドンを変化させることはできるが、コードされるタンパク質又はgRNAは変化しないままである。例えば、CasXタンパク質の意図された標的細胞がヒト細胞である場合、ヒトコドン最適化CasXコードヌクレオチド配列を使用することができる。別の非限定的な例として、意図された宿主細胞がマウス細胞である場合、マウスコドン最適化CasXコードヌクレオチド配列を生成することができる。遺伝子設計は、参照CasX又はCasXバリアントの産生において利用される宿主細胞に適切なコドン使用頻度及びアミノ酸組成を最適化するアルゴリズムを使用して行うことができる。本開示の1つの方法において、構築物の成分をコードするポリヌクレオチドのライブラリが作製され、次いで、上記のように構築される。次いで、本明細書に記載されるように、得られた遺伝子を組み立て、得られた遺伝子を使用して宿主細胞を形質転換し、その特性を評価するために、CasXバリアント又はgRNA組成物を産生及び回収する。
本開示は、宿主細胞と適合し、宿主細胞によって認識され、ポリペプチドの制御された発現又はRNAの転写のためにポリペプチドをコードする遺伝子に作動可能に連結されている複製配列及び制御配列を含むプラスミド発現ベクターの使用を提供する。様々な細菌、酵母、及びウイルスについてのかかるベクター配列はよく知られている。使用され得る有用な発現ベクターには、例えば、染色体、非染色体、及び合成DNA配列のセグメントが含まれる。「発現ベクター」とは、好適な宿主においてポリペプチドをコードするDNAの発現をもたらすことができる好適な制御配列に作動可能に連結されているDNA配列を含むDNA構築物を指す。必要条件は、選択された宿主細胞において、ベクターが複製可能かつ生存可能であることである。低コピー数ベクター又は高コピー数ベクターを、所望に応じて使用することができる。ベクターの制御配列は、転写をもたらすプロモーター、かかる転写を制御する任意選択的なオペレーター配列、好適なmRNAリボソーム結合部位をコードする配列、並びに転写及び翻訳の終結を制御する配列を含む。いくつかの実施形態では、gRNAをコードするヌクレオチド配列は、制御エレメント(例えば、プロモーターなどの転写制御エレメント)に作動可能に連結される。いくつかの実施形態では、CasXタンパク質をコードするヌクレオチド配列は、制御エレメント(例えば、プロモーターなどの転写制御エレメント)に作動可能に連結される。他の場合では、CasX及びgRNAをコードするヌクレオチドは連結され、単一の制御エレメントに作動可能に連結される。プロモーターは、選択された宿主細胞において転写活性を示す任意のDNA配列であってもよく、宿主細胞に対して同種又は異種のいずれかのタンパク質をコードする遺伝子に由来してもよい。例示的な調節エレメントとしては、転写プロモーター、転写エンハンサーエレメント、転写終結シグナル、単一の転写物から複数の遺伝子の翻訳を可能にする内部リボソーム進入部位(IRES)又はP2Aペプチド、下流の転写終結を促進するポリアデニル化配列、翻訳の開始の最適化のための配列、及び翻訳終結配列が挙げられる。場合によっては、プロモーターは、構成的に活性なプロモーターである。場合によっては、プロモーターは、調節可能なプロモーターである。場合によっては、プロモーターは、誘導性プロモーターである。場合によっては、プロモーターは、組織特異的プロモーターである。場合によっては、プロモーターは、細胞型特異的プロモーターである。場合によっては、転写制御エレメント(例えば、プロモーター)は、標的化細胞型又は標的化細胞集団において機能的である。例えば、場合によっては、転写制御エレメントは、真核細胞(例えば、ウイルス又はXDPベクターのためのパッケージング細胞、造血幹細胞(hematopoietic stem cell、HSC)、造血前駆細胞(hematopoietic progenitor cell、HPC)、CD34+細胞、間葉系幹細胞(mesenchymal stem cell、MSC)、胚性幹細胞(embryonic stem、ES)、人工多能性幹細胞(induced pluripotent stem cell、iPSC)、骨髄系共通前駆細胞、前赤芽球細胞、及び赤芽球細胞)において機能的であり得る。
pol IIプロモーターの非限定的な例としては、EF-1α、EF-1αコアプロモーター、Jens Tornoe(JeT)、サイトメガロウイルス(cytomegalovirus、CMV)由来のプロモーター、CMV最初期(CMV immediate early、CMVIE)、CMVエンハンサー、単純ヘルペスウイルス(herpes simplex virus、HSV)チミジンキナーゼ、初期及び後期サルウイルス40(simian virus 40、SV40)、SV40エンハンサー、レトロウイルス由来の長鎖末端反復(long terminal repeat、LTR)、マウスメタロチオネイン-I、アデノウイルス主要後期プロモーター(adenovirus major late promoter、Ad MLP)、CMVプロモーター全長プロモーター、最小CMVプロモーター、ニワトリ
(CBA)、CBAハイブリッド(CBA hybrid、CBh)、サイトメガロウイルスエンハンサーを有するニワトリ
(CB7)、ニワトリβ-アクチンプロモーター及びウサギβ-グロビンスプライスアクセプター部位融合体(CAG)、ラウス肉腫ウイルス(rous sarcoma virus、RSV)プロモーター、HIV-Ltrプロモーター、hPGKプロモーター、HSV TKプロモーター、7SKプロモーター、Mini-TKプロモーター、ニューロン特異的発現を付与するヒトシナプシンI(SYN)プロモーター、スーパーコアプロモーター1(super core promoter 1、SCP1)、ニューロンにおける選択的発現のためのMecp2プロモーター、最小IL-2プロモーター、ラウス肉腫ウイルスエンハンサー/プロモーター(単一)、脾臓病巣形成ウイルス長鎖末端反復(long terminal repeat、LTR)プロモーター、TBGプロモーター、ヒトチロキシン結合グロブリン遺伝子由来のプロモーター(肝臓特異的)、PGKプロモーター、ヒトユビキチンCプロモーター(ubiquitin C、UBC)、UCOEプロモーター(HNRPA2B1-CBX3のプロモーター)、合成CAGプロモーター、ヒストンH2プロモーター、ヒストンH3プロモーター、U1a1核内低分子RNAプロモーター(226nt)、U1a1核内低分子RNAプロモーター(226nt)、U1b2核内低分子RNAプロモーター(246nt)26、GUSBプロモーター、CBhプロモーター、ロドプシン(rhodopsin、Rho)プロモーター、サイレンシングプローン脾臓病巣形成ウイルス(spleen focus forming virus、SFFV)プロモーター、ヒトH1プロモーター(H1)、POL1プロモーター、TTR最小エンハンサー/プロモーター、b-キネシンプロモーター、マウス乳がんウイルス長鎖末端反復(LTR)プロモーター、ヒト真核生物翻訳開始因子4A(eukaryotic initiation factor 4A、EIF4A1)プロモーター、ROSA26プロモーター、グリセルアルデヒド3-リン酸デヒドロゲナーゼ(glyceraldehyde 3-phosphate dehydrogenase、GAPDH)プロモーター、tRNAプロモーター、並びに前述の短縮型バージョン及び配列バリアントが挙げられるが、これらに限定されない。特定の実施形態では、pol IIプロモーターは、EF-1αであり、プロモーターが、トランスフェクション効率、CRISPRヌクレアーゼの導入遺伝子の転写又は発現、発現陽性クローンの割合、及び長期培養におけるエピソームベクターのコピー数を増強する。
pol IIIプロモーターの非限定的な例としては、U6、ミニU6、U6短縮型プロモーター、7SK、及びH1バリアント、BiH1(双方向性H1プロモーター)、BiU6、Bi7SK、BiH1(双方向性U6、7SK、及びH1プロモーター)、ゴリラU6、アカゲザルU6、ヒト7SK、ヒトH1プロモーター、及びそれらの配列バリアントが挙げられるが、これらに限定されない。前述の実施形態では、pol IIIプロモーターは、gRNAの転写を増強する。
適切なベクター及びプロモーターの選択は、発現の制御に関連するので(例えば、遺伝子を改変するための)、十分に当業者のレベルの範囲内である。発現ベクターはまた、翻訳開始のためのリボソーム結合部位及び転写ターミネーターを含み得る。発現ベクターはまた、発現を増幅するための適切な配列を含み得る。発現ベクターはまた、CasXタンパク質に融合され得るタンパク質タグ(例えば、6×Hisタグ、赤血球凝集素タグ、蛍光タンパク質など)をコードするヌクレオチド配列を含み、したがって、精製又は検出のために使用されるキメラCasXタンパク質を得ることができる。
本開示の組換え発現ベクターはまた、本開示のCasXタンパク質及びgRNAの強力な発現を促進するエレメントを含むことができる。例えば、組換え発現ベクターは、1つ以上のポリアデニル化シグナル(ポリ(A))、イントロン配列、又は転写後調節エレメント(例えば、ウッドチャック肝炎転写後調節エレメント(woodchuck hepatitis post-transcriptional regulatory element、WPRE))を含むことができる。例示的なポリ(A)配列としては、hGHポリ(A)シグナル(短鎖)、HSV TKポリ(A)シグナル、合成ポリアデニル化シグナル、SV40ポリ(A)シグナル、β-グロビンポリ(A)シグナルなどが挙げられる。当業者は、本明細書に記載の組換え発現ベクターに含まれる好適なエレメントを選択することができるであろう。
いくつかの実施形態では、以下のうちの1つ以上を含む1つ以上の組換え発現ベクターが本明細書に提供される:(i)ドナー鋳型が標的核酸(例えば、標的ゲノム)の標的遺伝子座の配列と相同性を有するヌクレオチド配列を含む、ドナー鋳型核酸のヌクレオチド配列、(ii)真核細胞などの標的細胞において作動可能であるプロモーターに作動可能に連結された標的ゲノムの遺伝子座の標的配列にハイブリダイズする(例えば、シングル又はデュアルガイドRNAとして構成される)、gRNAをコードするヌクレオチド配列、及び(iii)真核細胞などの標的細胞において作動可能であるプロモーターに作動可能に連結された、CasXタンパク質をコードするヌクレオチド配列。いくつかの実施形態では、ドナー鋳型、gRNA、及びCasXタンパク質をコードする配列は、異なる組換え発現ベクター中にあり、他の実施形態では、1つ以上の(ドナー鋳型、CasX、及びgRNAの)ポリヌクレオチド配列は、同じ組換え発現ベクター中にある。
ポリヌクレオチド配列は、様々な手順によってベクターに挿入される。一般に、DNAは、当該技術分野で既知の技術を使用して、適切な制限エンドヌクレアーゼ部位に挿入される。ベクター成分としては、一般に、シグナル配列、複製起点、1つ以上のマーカー遺伝子、エンハンサーエレメント、プロモーター、及び転写終結配列のうちの1つ以上が挙げられるが、これらに限定されない。これらの成分のうちの1つ以上を含む好適なベクターの構築は、当業者に既知の標準的なライゲーション技術を使用する。かかる技術は、当該技術分野で周知であり、科学文献及び特許文献に詳細に記載されている。様々なベクターが公的に入手可能である。ベクターは、例えば、組換えDNA手順に都合よく供され得るプラスミド、コスミド、ウイルス粒子、又はファージの形態であり得、ベクターの選択は、しばしば、ベクターが導入される宿主細胞に依存する。したがって、ベクターは、自律複製ベクター、すなわち、染色体外実体として存在し、その複製が染色体複製とは独立しているベクター(例えば、プラスミド)であってもよい。代替的に、ベクターは、宿主細胞に導入された場合、宿主細胞ゲノムに組み込まれ、それが組み込まれた染色体と一緒に複製されるものであってもよい。好適な宿主細胞に導入されると、抗原プロセシング、抗原提示、抗原認識、及び/又は抗原応答に関与するタンパク質の発現は、当該技術分野で既知の任意の核酸アッセイ又はタンパク質アッセイを使用して決定され得る。例えば、参照CasX又はCasXバリアントの転写されたmRNAの存在は、ポリヌクレオチドの任意の領域に相補的なプローブを使用して、従来のハイブリダイゼーションアッセイ(例えば、ノーザンブロット分析)、増幅手順(例えば、RT-PCR)、SAGE(米国特許第5,695,937号)、及びアレイベース技術(例えば、米国特許第5,405,783号、同第5,412,087号、及び同第5,445,934号を参照)によって検出及び/又は定量化され得る。
ポリヌクレオチド及び組換え発現ベクターは、様々な方法によって標的宿主細胞に送達することができる。かかる方法としては、ウイルス感染、トランスフェクション、リポフェクション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン(PEI)媒介性トランスフェクション、DEAE-デキストラン媒介性トランスフェクション、マイクロインジェクション、リポソーム媒介性トランスフェクション、パーティクルガン技術、ヌクレオフェクション、ドナーDNAに融合された若しくはそれを動員する細胞透過性CasXタンパク質による直接添加、細胞圧搾、リン酸カルシウム沈殿、直接マイクロインジェクション、ナノ粒子媒介性核酸送達、並びにQiagenから市販されているTransMessenger(登録商標)試薬、StemgentからのStemfectTM RNAトランスフェクションキット、及びMirus Bio LLCからのTransIT(登録商標)-mRNAトランスフェクションキット、Lonzaヌクレオフェクション、Maxagenエレクトロポレーションなどを使用することが挙げられるが、これらに限定されない。
組換え発現ベクター配列は、その後のエクスビボ、インビトロ、又はインビボでの細胞の感染及び形質転換のために、ウイルス又はウイルス様粒子(本明細書では「粒子」又は「ビリオン」とも称される)にパッケージングされ得る。かかる粒子又はビリオンは、典型的には、ベクターゲノムをカプシド化又はパッケージングするタンパク質を含む。好適な発現ベクターとしては、以下に基づくウイルス発現ベクターが挙げられ得る:ワクシニアウイルス;ポリオウイルス;アデノウイルス;レトロウイルスベクター(例えば、マウス白血病ウイルス)、脾臓壊死ウイルス、並びにレトロウイルス(例えば、ラウス肉腫ウイルス、ハーベイ肉腫ウイルス、トリ白血病ウイルス、レンチウイルス、ヒト免疫不全ウイルス、骨髄増殖性肉腫ウイルス、及び乳がんウイルス)に由来するベクターなど。いくつかの実施形態では、本開示の組換え発現ベクターは、組換えアデノ随伴ウイルス(AAV)ベクターである。いくつかの実施形態では、本開示の組換え発現ベクターは、組換えレンチウイルスベクターである。いくつかの実施形態では、本開示の組換え発現ベクターは、組換えレトロウイルスベクターである。
いくつかの実施形態では、本開示の組換え発現ベクターは、組換えアデノ随伴ウイルス(AAV)ベクターである。いくつかの実施形態では、本開示の組換え発現ベクターは、組換えレンチウイルスベクターである。いくつかの実施形態では、本開示の組換え発現ベクターは、組換えレトロウイルスベクターである。
AAVは、対象に投与するために調製される細胞のためにインビボ又はエクスビボのいずれかで、真核細胞などの細胞への送達のためにウイルスベクターを用いる状況において、ヒト疾患を治療するのに有用である小さな(20nm)非病原性ウイルスである。構築物(例えば、本明細書に記載される実施形態のCasXタンパク質及び/又はCasX gRNAのいずれかをコードする構築物)が生成され、AAV逆位末端反復(ITR)配列に隣接し、それによって、AAVベクターのAAVウイルス粒子へのパッケージングが可能になる。
「AAV」ベクターは、天然に存在する野生型ウイルス自体又はその誘導体を指し得る。この用語は、別途必要とされる場合を除いて、全てのサブタイプ、血清型、及び偽型、並びに天然に存在する形態及び組換え形態の両方を包含する。本明細書で使用される場合、「血清型」という用語は、規定の抗血清とのカプシドタンパク質の反応性に基づいて他のAAVによって同定されかつそれと区別されるAAVを指す。例えば、霊長類AAVの多くの既知の血清型が存在する。いくつかの実施形態では、AAVベクターは、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV44.9、AAV-Rh74(アカゲザル由来AAV)、及びAAVRh10、並びにこれらの血清型の改変カプシドから選択される。例えば、血清型AAV-2は、AAV-2のcap遺伝子からコードされるカプシドタンパク質と、同じAAV-2血清型由来の5’及び3’ITR配列を含むゲノムと、を含むAAVを指すために使用される。偽型AAVは、1つの血清型由来のカプシドタンパク質と、第2の血清型の5’-3’ITRを含むウイルスゲノムと、を含むAAVを指す。偽型rAAVは、カプシド血清型の細胞表面結合特性と、ITR血清型と一致する遺伝的特性と、を有することが予想される。偽型組換えAAV(rAAV)は、当該技術分野で記載される標準的な技術を使用して産生される。本明細書で使用される場合、例えば、rAAV1は、同じ血清型由来のカプシドタンパク質及び5’-3’ITRの両方を有するAAVを指すために使用され得るか、又はそれは、血清型1由来のカプシドタンパク質及び異なるAAV血清型(例えば、AAV血清型2)由来の5’-3’ITRを有するAAVを指し得る。本明細書に例示される各実施例について、ベクター設計及び産生の記載は、カプシド及び5’-3’ITR配列の血清型を記載する。
「AAVウイルス」又は「AAVウイルス粒子」は、少なくとも1つのAAVカプシドタンパク質(好ましくは野生型AAVのカプシドタンパク質の全てによるもの)と、カプシド化されたポリヌクレオチドと、から構成されるウイルス粒子を指す。粒子が異種ポリヌクレオチド(すなわち、哺乳動物細胞に送達される野生型AAVゲノム以外のポリヌクレオチド)を更に含む場合、それは、典型的には「rAAV」と称される。例示的な異種ポリヌクレオチドは、本明細書に記載の実施形態のいずれかのCasXタンパク質及び/又はsgRNA、並びに任意選択的にドナー鋳型を含むポリヌクレオチドである。
「アデノ随伴ウイルス逆位末端反復」又は「AAV ITR」とは、AAVゲノムの各末端に見出される当該技術分野で認識される領域を意味し、これは、DNAの複製起点として及びウイルスのパッケージングシグナルとして、シスで一緒に機能する。AAV ITRは、AAV repコード領域とともに、哺乳動物細胞ゲノムからの効率的な切除及び救出、並びに哺乳動物細胞ゲノムへの2つの隣接ITR間に挿入されたヌクレオチド配列の組み込みを提供する。
AAV ITR領域のヌクレオチド配列は既知である。例えば、Kotin,R.M.(1994)Human Gene Therapy 5:793-801;Berns,K. I.”Parvoviridae and their Replication”in Fundamental Virology,2nd Edition,(B.N.Fields and D.M.Knipe,eds.)を参照されたい。本明細書で使用される場合、AAV ITRは、示された野生型ヌクレオチド配列を有する必要はないが、例えば、ヌクレオチドの挿入、欠失、又は置換によって改変され得る。追加的に、AAV ITRは、いくつかのAAV血清型(AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV-Rh74、及びAAVRh10が挙げられるが、これらに限定されない)、並びにこれらの血清型の改変カプシドのうちのいずれかに由来し得る。更に、AAVベクターにおける選択されたヌクレオチド配列に隣接する5’及び3’ITRは、それらが意図されるように機能する(すなわち、宿主細胞ゲノム又はベクターからの目的の配列の切除及び救出を可能にし、かつAAV Rep遺伝子産物が細胞に存在する場合、レシピエント細胞のゲノムへの異種配列の組み込みを可能にする限り、必ずしも同一である必要はないか、又は同じAAV血清型若しくは分離株に由来する必要はない。宿主細胞への異種配列の組み込みのためのAAV血清型の使用は、当該技術分野において既知である(例えば、国際公開第2018/195555(A1)号及び米国特許出願公開第2018/0258424(A1)号を参照)。
「AAV repコード領域」とは、複製タンパク質であるRep78、Rep68、Rep52、及びRep40をコードするAAVゲノムの領域を意味する。これらのRep発現産物は、AAVのDNA複製起点の認識、結合、及びニッキング、DNAヘリカーゼ活性、並びにAAV(又は他の異種)プロモーターからの転写の調節を含む多くの機能を有することが示されている。Rep発現産物は、まとめて、AAVゲノムを複製するために必要とされる。「AAV capコード領域」とは、カプシドタンパク質であるVP1、VP2、及びVP3、又はそれらの機能的ホモログをコードするAAVゲノムの領域を意味する。これらのCap発現産物は、まとめて、ウイルスゲノムをパッケージングするために必要とされるパッケージング機能を供給する。
いくつかの実施形態では、CasX及びgRNA、並びに任意選択的にDMPKドナー鋳型ヌクレオチドのコード配列を宿主に送達するために利用されるAAVカプシドは、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV44.9、AAV-Rh74(アカゲザル由来AAV)、及びAAVRh10を含むがこれらに限定されないいくつかのAAV血清型のいずれかに由来することができ、AAV ITRはAAV血清型2に由来する。特定の実施形態では、AAV1、AAV7、AAV6、AAV8、又はAAV9は、CasX、gRNA、及び任意選択的にドナー鋳型ヌクレオチドの宿主筋細胞への送達のために利用される。
rAAVウイルス粒子を産生するために、AAV発現ベクターは、既知の技術(例えば、トランスフェクション)を使用して好適な宿主細胞に導入される。パッケージング細胞は、典型的には、ウイルス粒子を形成するために使用される。かかる細胞には、アデノウイルスをパッケージングするHEK293細胞(及び当該技術分野で既知の他の細胞)が含まれる。多くのトランスフェクション技術が当該技術分野で一般的に既知である。例えば、Sambrook et al.(1989)Molecular Cloning,a laboratory manual,Cold Spring Harbor Laboratories,New Yorkを参照されたい。特に好適なトランスフェクション方法としては、リン酸カルシウム共沈殿、培養細胞への直接マイクロインジェクション、エレクトロポレーション、リポソーム媒介性遺伝子導入、脂質媒介性形質導入、及び高速微粒子銃を使用する核酸送達が挙げられる。
本開示のrAAV構築物の利点では、より小さいサイズのクラス2、CRISPR V型ヌクレアーゼ(例えば、本実施形態のCasXバリアント)は、単一のrAAV粒子が、これらの成分を、標的細胞の標的核酸を効果的に改変することができるCRISPRヌクレアーゼ及びgRNAの発現をもたらす形態で標的細胞に送達及び形質導入することができるように、全ての必要な編集及び補助的発現成分を導入遺伝子に含めることを可能にする。このような構築物の代表的な概略図を、図13に示す。これは、Cas9などの他のCRISPR系とは著しく対照的であり、典型的には、二粒子システムを用いて、必要な編集成分を標的細胞に送達する。したがって、rAAVシステムのいくつかの実施形態では、本開示は、i)ITR、CasXバリアントをコードする配列、1つ以上のgRNAをコードする配列、CasXに作動可能に連結された第1のプロモーター及びgRNAに作動可能に連結された第2のプロモーター、並びに任意選択的に1つ以上のエンハンサーエレメントを含む、第1のプラスミド、ii)rep及びcap遺伝子を含む、第2のプラスミド、並びにiii)ヘルパー遺伝子を含む、第3のプラスミド、を提供し、適切なパッケージング細胞のトランスフェクション時、細胞が、CasXヌクレアーゼを発現することができる配列及び標的細胞の標的核酸を編集する能力を有するgRNAを単一粒子で標的細胞に送達する能力を有するrAAVを産生することができる。rAAVシステムのいくつかの実施形態では、CRISPRタンパク質をコードする配列及び少なくとも第1のgRNAをコードする配列は、約3100未満、約3090未満、約3080未満、約3070未満、約3060未満、約3050未満、又は約3040未満のヌクレオチド長であり、それにより、第1のプロモーター及び第2のプロモーター並びに任意選択的に1つ以上のエンハンサーエレメントをコードする配列が、合わせて、少なくとも約1300、少なくとも約1350、少なくとも約1360、少なくとも約1370、少なくとも約1380、少なくとも約1390、少なくとも約1400、少なくとも約1500、少なくとも約1600ヌクレオチド、少なくとも1650、少なくとも約1700、少なくとも約1750、少なくとも約1800、少なくとも約1850、又は少なくとも約1900ヌクレオチド長を有することができる。rAAVシステムのいくつかの実施形態では、第1及のプロモーター及び少なくとも1つのアクセサリエレメントをコードする配列は、合わせて、少なくとも約1300、少なくとも約1350、少なくとも約1360、少なくとも約1370、少なくとも約1380、少なくとも約1390、少なくとも約1400、少なくとも約1500、少なくとも約1600ヌクレオチド、少なくとも1650、少なくとも約1700、少なくとも約1750、少なくとも約1800、少なくとも約1850、又は少なくとも約1900超のヌクレオチド長を有する。rAAVシステムのいくつかの実施形態では、第1及び第2のプロモーター並びに少なくとも1つのアクセサリエレメントをコードする配列は、合わせて、少なくとも約1300、少なくとも約1350、少なくとも約1360、少なくとも約1370、少なくとも約1380、少なくとも約1390、少なくとも約1400、少なくとも約1500、少なくとも約1600ヌクレオチド、少なくとも1650、少なくとも約1700、少なくとも約1750、少なくとも約1800、少なくとも約1850、又は少なくとも約1900超のヌクレオチド長を有する。
いくつかの実施形態では、上記のAAV発現ベクターでトランスフェクトされた宿主細胞は、AAV ITRに隣接するヌクレオチド配列を複製及びカプシド化してrAAVウイルス粒子を産生するために、AAVヘルパー機能を提供することができるようにされる。AAVヘルパー機能は、一般に、AAV由来コード配列であり、これが発現してAAV遺伝子産物を提供し、それは次に、生産的なAAV複製のためにトランスで機能することができる。AAVヘルパー機能は、本明細書において、AAV発現ベクターに欠けている必要なAAV機能を補完するために使用される。したがって、AAVヘルパー機能は、rep及びcapのコード領域をコードする主要なAAV ORF(オープンリーディングフレーム)の一方又は両方、又はその機能的ホモログを含む。アクセサリ機能は、当業者に既知の方法を使用して宿主細胞に導入され、次いで、宿主細胞で発現され得る。通常、アクセサリ機能は、無関係なヘルパーウイルスによる宿主細胞の感染によって提供される。いくつかの実施形態では、アクセサリ機能は、アクセサリ機能ベクターを使用して提供される。利用される宿主/ベクター系に依存して、構成的プロモーター及び誘導性プロモーター、転写エンハンサーエレメント、転写ターミネーターなどを含むいくつかの好適な転写及び翻訳制御エレメントのいずれかが、発現ベクターにおいて使用され得る。いくつかの実施形態では、本開示は、本明細書に開示される実施形態のAAVベクターを含む宿主細胞を提供する。
他の実施形態では、好適なベクターは、ウイルス様粒子(virus-like particle、VLP)を含み得る。ウイルス様粒子(VLP)は、ウイルスに非常に似ているが、ウイルス性遺伝物質を含まず、したがって、非感染性である粒子である。いくつかの実施形態では、VLPは、1つ以上のウイルス構造タンパク質とともにパッケージングされた、目的の導入遺伝子(例えば、実施形態のCasXタンパク質及び/又はgRNAのいずれか)をコードするポリヌクレオチド、並びに任意選択的に本明細書に記載のドナー鋳型ポリヌクレオチドを含む。
他の実施形態では、本開示は、インビトロで産生されたCasX送達粒子(XDP)を提供し、XDPが、CasX: gRNA RNP複合体と、任意選択的に、ドナー鋳型と、を含む。異なるウイルス由来の構造タンパク質の組み合わせを使用して、XDPを作製することができる。それには、パルボウイルス科(例えば、アデノ随伴ウイルス)、レトロウイルス科(例えば、アルファレトロウイルス、ベータレトロウイルス、ガンマレトロウイルス、デルタレトロウイルス、イプシロンレトロウイルス、又はレンチウイルス)、フラビウイルス科(例えば、C型肝炎ウイルス)、パラミクソウイルス科(例えば、Nipah)、及びバクテリオファージ(例えば、Qβ、AP205)を含むウイルス科由来の成分が含まれる。いくつかの実施形態では、本開示は、レトロウイルス(レンチウイルス(HIVなど)及びアルファレトロウイルス、ベータレトロウイルス、ガンマレトロウイルス、デルタレトロウイルス、イプシロンレトロウイルスを含む)の成分を使用して設計されたXDPシステムを提供し、様々な成分をコードするポリヌクレオチドを含む個々のプラスミドが、パッケージング細胞に導入され、これが次に、XDPを産生する。いくつかの実施形態、本開示は、i)プロテアーゼ、ii)プロテアーゼ切断部位、iii)以下から選択されるGagポリタンパク質の1つ以上の成分:マトリックスタンパク質(matrix protein、MA)、ヌクレオカプシドタンパク質(nucleocapsid protein、NC)、カプシドタンパク質(capsid protein、CA)、p1ペプチド、p6ペプチド、P2Aペプチド、P2Bペプチド、P10ペプチド、p12ペプチド、PP21/24ペプチド、P12/P3/P8ペプチド、及びP20ペプチド、v)CasX、vi)gRNA、並びにvi)標的化糖タンパク質又は抗体断片、のうちの1つ以上の成分を含むXDPを提供し、得られたXDP粒子が、CasX: gRNA RNPをカプシド化する。Gag、CasX、及びgRNAをコードするポリヌクレオチドは、宿主細胞の核から成分の輸送を補助し、複合体化したCasX: gRNAの出芽XDPの動員を容易にするように設計された対の成分を更に含む。このような成分の非限定的な例としては、ヘアピンRNA(例えば、MS2ヘアピン、PP7ヘアピン、Qβヘアピン、並びにU1ヘアピンII(それぞれパッケージングリクルーターMS2コートタンパク質、PP7コートタンパク質、Qβコートタンパク質、及びU1Aシグナル認識粒子に対する結合親和性を有する結合パートナーとしてgRNAに組み込まれ、Gagポリタンパク質に融合されている)を含む。ガイドRNAに挿入された結合パートナー及びパッケージングリクルーターの、Gagポリペプチドを含む核酸への組み込みは、gRNAに対するCasXの親和性に部分的に起因して、XDP粒子のパッケージングを容易にし、RNPをもたらし、それにより、gRNA及びCasXの両方が、XDPのカプシド形成プロセス中にGagと会合し、結合パートナー及びパッケージングリクルーターを欠く構築物と比較して、RNPを含むXDPの割合を増加させることが発見された。他の実施形態では、gRNAは、Rev応答エレメント(RRE)又はRevに対する結合親和性を有するその部分を含むことができ、これはGagポリタンパク質に連結することができる。他の実施形態では、gRNAは、1つ以上のRREと、1つ以上のMS2ヘアピン配列と、を含むことができる。RREは、Rev応答エレメント(RRE)のステムIIB、RREのステムII~V、RREのステムII、ステムIIBのRev結合エレメント(Rev-binding element、RBE)、及び全長RREからなる群から選択され得る。前述の実施形態では、成分は、UGGGCGCAGCGUCAAUGACGCUGACGGUACA(ステムIIB、配列番号1280)、GCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGC(ステムII、配列番号1281)、CAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUG(ステムII-V、配列番号1282)、GCUGACGGUACAGGC(RBE、配列番号1284)、及びAGGAGCUUUGUUCCUUGGGUUCUUGGGAGCAGCAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUGGCUGUGGAAAGAUACCUAAAGGAUCAACAGCUCCU(全長RRE、配列番号1283)の配列を含む。他の実施形態では、gRNAは、1つ以上のRREと、1つ以上のMS2ヘアピン配列と、を含むことができる。特定の実施形態では、gRNAは、MS2ヘアピンバリアントを含み、これは、MS2コートタンパク質に対する結合親和性を増加させ、それによって、出芽XDPへのgRNA及び会合したCasXの組み込みを増強するように最適化される。いくつかの実施形態では、MS2ヘアピンバリアント及びRREを含むgRNAバリアントは、表36に示されるMS2配列を含むgRNAバリアント275~315(配列番号2353~2393)を含む。いくつかの実施形態では、本開示は、1つ以上のMS2ヘアピン配列バリアントを含むgRNAバリアントを提供し、バリアントは、そのMS2コートタンパク質リガンドに対して100nM未満、50nM未満、35nM未満、10nM未満、3nM未満、又は2nM未満のKを示し、gRNAバリアントを含むXDPは、インビトロ細胞アッセイにおいて標的核酸に対する改善された編集活性を示し、50%の細胞における編集を達成するEC50は、10未満、又は10未満、又は10未満である。表面上の標的化糖タンパク質又は抗体断片は、標的細胞へのXDPのトロピズムを提供し、標的細胞への投与及び侵入の際、RNP分子が、細胞の核内に自由に輸送される。エンベロープ糖タンパク質は、XDPにトロピズムを付与することが当該技術分野で既知である任意の以下のエンベロープウイルスに由来し得る:アルゼンチン出血熱ウイルス、オーストラリアコウモリウイルス、Autographa californica核多角体病ウイルス、トリ白血病ウイルス、ヒヒ内在性ウイルス、ボリビア出血熱ウイルス、ボルナ病ウイルス、ブレダウイルス、ブニヤムウェラウイルス、チャンディプラウイルス、チクングニアウイルス、クリミア・コンゴ出血熱ウイルス、デング熱ウイルス、ドゥベンヘイグウィルス、東部ウマ脳炎ウイルス、エボラ出血熱ウイルス、エボラ・ザイールウイルス、腸管アデノウイルス、エフェメロウイルス、エプスタイン・バーウイルス(Epstein-Bar virus、EBV)、ヨーロッパコウモリウイルス1、ヨーロッパコウモリウイルス2、Fug合成gP融合体、テナガザル白血病ウイルス、ハンタウイルス、ヘンドラウイルス、A型肝炎ウイルス、B型肝炎ウイルス、C型肝炎ウイルス、D型肝炎ウイルス、E型肝炎ウイルス、G型肝炎ウイルス(GBウイルスC)、単純ヘルペスウイルス1型、単純ヘルペスウイルス2型、ヒトサイトメガロウイルス(human cytomegalovirus、HHV5)、ヒト泡沫状ウイルス、ヒトヘルペスウイルス(human herpesvirus、HHV)、ヒトヘルペスウイルス7型、ヒトヘルペスウイルス6型、ヒトヘルペスウイルス8型、ヒト免疫不全ウイルス1型(human immunodeficiency virus 1、HIV-1)、ヒトメタニューモウイルス、ヒトTリンパ球向性ウイルス1、インフルエンザA型ウイルス、インフルエンザB型ウイルス、インフルエンザC型ウイルス、日本脳炎ウイルス、カポジ肉腫関連ヘルペスウイルス(Kaposi’s sarcoma-associated herpesvirus、HHV8)、キャサヌール森林病ウイルス、ラクロスウイルス、ラゴスコウモリウイルス、ラッサ熱ウイルス、リンパ球性脈絡髄膜炎ウイルス(lymphocytic choriomeningitis virus、LCMV)、マチュポウイルス、マールブルグ出血熱ウイルス、麻疹ウイルス、中東呼吸器症候群関連コロナウイルス、モコラウイルス、モロニーマウス白血病ウイルス、サル痘、マウス乳がんウイルス、おたふく風邪ウイルス、マウスガンマヘルペスウイルス、ニューカッスル病ウイルス、ニパウイルス、ニパウイルス、ノーウォークウイルス、オムスク出血熱ウイルス、パピローマウイルス、パルボウイルス、仮性狂犬病ウイルス、クアランフィルウイルス、狂犬病ウイルス、RD114ネコ内在性レトロウイルス、呼吸器合胞体ウイルス(RSV)、リフトバレー熱ウイルス、ロスリバーウイルス、rロタウイルス、ラウス肉腫ウイルス、風疹ウイルス、サビア関連出血熱ウイルス、SARS関連コロナウイルス(SARS-associated coronavirus、SARS-CoV)、センダイウイルス、タカリベウイルス、ソゴトウイルス、ダニ媒介性脳炎原因ウイルス、水痘帯状疱疹ウイルス(varicella zoster virus、HHV3)、水痘帯状疱疹ウイルス(HHV3)、大痘瘡ウイルス、小痘瘡ウイルス、ベネズエラウマ脳炎ウイルス、ベネズエラ出血熱ウイルス、水疱性口内炎ウイルス(vesicular stomatitis virus、VSV)、VSV-G、ベシクロウイルス、西ナイルウイルス、西部ウマ脳炎ウイルス、及びジカウイルス。
他の実施形態では、本開示は、前述のXDPを提供し、polポリタンパク質の1つ以上の成分(例えば、プロテアーゼ)、及び任意選択的に、第2のCasX又はドナー鋳型を更に含む。本開示は、コード化された成分のいくつかの複製を含む、コード化された成分の配置の複数の構成を企図する。前述のことは、分裂細胞及び非分裂細胞へのウイルス形質導入が効率的であり、XDPが、さもなければ外来タンパク質を検出する対象の免疫監視機構を回避する強力で短寿命のRNPを送達するという点で、当該技術分野における他のベクターに対する利点を提供する。非限定的な例示的なXDP系は、国際出願PCT/US20/63488号及び国際公開第2021/113772(A1)号に記載されている(参照により本明細書に援用される)。いくつかの実施形態では、本開示は、前述のXDPの実施形態のいずれかをコードするポリヌクレオチド又はベクターを含む宿主細胞を提供する。
本明細書に記載の実施形態のいずれかのCasX:gRNA RNPを含むXDPを生成及び回収する際、XDPは、以下でより詳細に記載されるように、かかるXDPの投与によって対象の標的細胞を編集するための方法において使用され得る。
非ウイルス送達の場合、ベクターも送達することができ、CasXバリアント及びgRNAをコードする1つの又は複数のベクターが、ナノ粒子中に製剤化され、企図されるナノ粒子としては、ナノスフェア、リポソーム、脂質ナノ粒子、量子ドット、ポリエチレングリコール粒子、ヒドロゲル、及びミセルが挙げられるが、これらに限定されない。脂質ナノ粒子は、一般に、イオン化可能なカチオン性脂質と、コレステロール、DOPE、ポリ乳酸-コ-グリコール酸、及びポリエチレングリコール(PEG)含有脂質などの3つ以上の追加成分と、から構成される。いくつかの実施形態では、本明細書に開示される実施形態のCasXバリアントは、脂質ナノ粒子に製剤化される。いくつかの実施形態では、脂質ナノ粒子は、本明細書に開示される実施形態のgRNAを含む。いくつかの実施形態では、脂質ナノ粒子は、gRNAと複合体化したCasXバリアントのRNPを含む。いくつかの実施形態では、システムは、CasXバリアント及びgRNA、並びに任意選択的にドナー鋳型核酸をコードする核酸を含む脂質ナノ粒子を含む。いくつかの実施形態では、CasX: gRNAシステムの成分は、細胞への送達のために、又はそれを必要とする対象への投与のために、別個の脂質ナノ粒子中に製剤化される。
VII.標的核酸の改変のための方法
本明細書に提供されるCRISPRタンパク質、ガイド、核酸、及びそれらのバリアントは、治療、診断、及び研究を含む様々な用途に有用である。
いくつかの実施形態では、細胞における標的核酸の遺伝子編集及び改変のための本開示の方法を実施するために、プログラム可能なクラス2、V型CasXバリアント及びgRNAバリアント編集ペア(CasX: gRNA)が本明細書に提供される。本明細書に提供されるペアのプログラム可能な性質は、遺伝子の標的核酸における所定の目的の1つ以上の領域で所望の改変を達成するための正確な標的化を可能にする。本明細書に提供されるシステムを使用して細胞における標的核酸配列を改変するために、様々な戦略及び方法を使用することができる。本明細書で使用される場合、「改変」としては、切断、ニッキング、編集、欠失、ノックアウト、ノックダウン、変異誘発、修復、エキソンスキッピングなどが挙げられるが、これらに限定されない。本明細書に記載されるように、標的核酸の二本鎖切断を導入するCasXバリアントは、標的鎖上のPAM部位の5’側の18~26ヌクレオチド内及び非標的鎖上の3’側の10~18ヌクレオチド内に二本鎖切断を生成する。得られた改変は、非相同DNA末端結合(NHEJ)修復機構によって、それらの領域における1つ以上のヌクレオチドのランダムな挿入、又は欠失(インデル)、又は置換、重複、フレームシフト、又は逆位をもたらし得る。
いくつかの実施形態では、本開示は、細胞における標的核酸を改変する方法を提供し、本方法は、細胞の標的核酸を、i)本明細書に記載の実施形態のいずれか1つのCasX及びgRNAを含むクラス2、V型CRISPRタンパク質及びgRNA(CasX: gRNA)編集ペア、ii)本明細書に記載の実施形態のいずれか1つのCasX: gRNA編集ペアとドナー鋳型、iii)CasX及びgRNAの編集ペアをコードし、任意選択的にドナー鋳型を含む核酸、iv)上記の(iii)の核酸を含むベクター、v)本明細書に記載の実施形態のいずれか1つのCasX: gRNA編集ペアを含むXDP、又はvi)(i)~(v)のうちの2つ以上の組み合わせ、と接触させることを含み、標的核酸をCasXタンパク質及びgRNAの遺伝子編集ペア並びに任意選択的にドナー鋳型と接触させることにより、標的核酸が改変される。
場合によっては、改変は、細胞における変異の修正又は補償をもたらし、それによって、機能的な遺伝子産物の発現が起こり得るように編集された細胞が作製される。本方法の他の実施形態では、改変は、遺伝子のノックダウン又はノックアウトによって遺伝子産物の発現を抑制又は排除することを含む。
細胞における標的核酸配列を改変する方法のいくつかの実施形態では、本方法は、細胞の標的核酸配列を、CasX: gRNA編集ペアと接触させることを含み、編集ペアが、表3に示される配列番号247~592及び1147~1231からなる群から選択されるCasXバリアント、配列番号270~592及び1147~1231からなる群から選択されるCasXバリアント、配列番号415~592及び1147~1231からなる群から選択されるCasXバリアント、又はそれと少なくとも60%同一、少なくとも70%同一、少なくとも80%同一、少なくとも81%同一、少なくとも82%同一、少なくとも83%同一、少なくとも84%同一、少なくとも85%同一、少なくとも86%同一、少なくとも86%同一、少なくとも87%同一、少なくとも88%同一、少なくとも89%同一、少なくとも89%同一、少なくとも90%同一、少なくとも91%同一、少なくとも92%同一、少なくとも93%同一、少なくとも94%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、若しくは少なくとも99.5%同一のバリアント配列を含み、gRNA足場が、表2に示される配列番号2101~2332及び2353~2398からなる群から選択される配列を含み、gRNA足場が、配列番号2238~2332及び2353~2398からなる群から選択される配列を含み、gRNA足場が、配列番号2281~2332及び2353~2398からなる群から選択される配列、又はそれと少なくとも65%同一、少なくとも70%同一、少なくとも75%同一、少なくとも80%同一、少なくとも81%同一、少なくとも82%同一、少なくとも83%同一、少なくとも84%同一、少なくとも85%同一、少なくとも86%同一、少なくとも86%同一、少なくとも87%同一、少なくとも88%同一、少なくとも89%同一、少なくとも89%同一、少なくとも90%同一、少なくとも91%同一、少なくとも92%同一、少なくとも93%同一、少なくとも94%同一、少なくとも95%同一、少なくとも96%同一、少なくとも97%同一、少なくとも98%同一、少なくとも99%同一、少なくとも99.5%同一の配列を含み、gRNAが、標的核酸に相補的であり、標的核酸とハイブリダイズすることができる標的化配列を含む。
いくつかの実施形態では、CasX: gRNA遺伝子編集ペアは、リボ核タンパク質複合体(RNP)において一緒に会合することができる。いくつかの実施形態では、CasX: gRNA遺伝子編集ペアは、リボ核タンパク質複合体(RNP)において一緒に会合している。いくつかの実施形態では、RNPは、標的核酸に結合し、標的核酸において二本鎖切断を生成することができ、標的核酸において永続的なインデル又は変異をもたらす。他の実施形態では、RNPは、標的核酸に結合し、標的核酸において1つ以上の一本鎖ニックを生成することができ、標的核酸において永続的なインデル又は変異をもたらす。他の実施形態では、RNPは、標的核酸に結合することができるが、標的核酸を切断することができない(すなわち、dCasXバリアントを含有する)。本方法のいくつかの実施形態では、CasXバリアントタンパク質は、任意選択的に、生成物の溶解度を増加させるポリペプチドドメインに融合され得るポリペプチドとして、細胞に提供され得る。ドメインは、規定のプロテアーゼ切断部位、(例えば、TEVプロテアーゼによって切断されるTEV配列)を介してポリペプチドに連結され得る。リンカーはまた、1つ以上の柔軟な配列、(例えば、1~10個のグリシン残基)を含んでもよい。いくつかの実施形態では、融合タンパク質の切断は、産物の溶解度を維持する緩衝液中で行われる、(例えば、0.5~2Mの尿素の存在下、溶解性を増加させるポリペプチド及び/又はポリヌクレオチドの存在下など)。目的のドメインは、エンドソーム分解性(endosomolytic)ドメイン、(例えば、インフルエンザHAドメイン)及び産生を補助する他のポリペプチド(例えば、IF2ドメイン、GSTドメイン、GRPEドメインなど)を含み得る。ポリペプチドは、改善された安定性のために製剤化され得る。例えば、ペプチドは、PEG化されてもよく、ポリエチレンオキシ基が血流中での寿命の延長をもたらす。
細胞において標的核酸配列を改変する方法の他の実施形態では、本方法は、標的核酸配列を、遺伝子の異なる部分又は重複する部分を標的化する第1及び第2のgRNA又は複数のgRNAを有する複数のRNPと接触させることを含み、CasXタンパク質は、本明細書に記載されるように、標的核酸における永続的なインデル若しくは変異をもたらす複数の切断を標的核酸に導入するか、又は対応する遺伝子産物の発現の調節若しくはその機能の変更を伴う切断間の介在配列の切除を導入し、それによって、改変された細胞が作製される。
いくつかの実施形態では、標的核酸を改変する方法は、標的核酸を、本明細書に記載されるCasX: gRNA遺伝子編集ペア及びドナー鋳型と接触させることを含む。したがって、場合によっては、本明細書に提供される方法は、標的核酸をドナーポリヌクレオチドと接触させること(例えば、ドナーポリヌクレオチドを細胞に導入することによって)を含み、ドナーポリヌクレオチド、ドナーポリヌクレオチドの一部、ドナーポリヌクレオチドのコピー、又はドナーポリヌクレオチドのコピーの一部が、標的核酸に組み込まれる。例えば、外因性ドナー鋳型は、細胞における標的核酸配列に導入される上流配列及び下流配列に隣接して組み込まれる修正配列を含んでもよい。他の場合では、ドナー鋳型は、ゲノム配列に関して1つ以上の単一塩基変化、挿入、欠失、逆位又は再編成を含んでもよい。但し、フレームシフト若しくは他の変異をもたらすことができる、標的核酸へのその組み込み、又は細胞における欠陥遺伝子の対応するノックダウン若しくはノックアウトによる、標的核酸配列のその部分の置換を支持するための標的核酸配列との十分な相同性が存在することを条件とする。切断部位に対して上流及び下流の配列は、標的核酸における組み込み部位のいずれかの側と配列類似性を共有し(すなわち、相同アーム)、挿入を容易にする。他の場合では、外因性ドナー鋳型は、相同性非依存性標的化組み込み(HITI)機構によるCasX切断によって生成された末端間に挿入される。HITIによって挿入される外因性配列は、任意の長さ、例えば、10~50ヌクレオチド長の比較的短い配列、又は約50~1000ヌクレオチド長のより長い配列であり得る。相同性の欠如は、例えば、20~50%以下の配列同一性を有すること、及び/又は低い厳密性での特異的なハイブリダイゼーションを欠くことであり得る。他の場合では、相同性の欠如は、5、6、7、8、又は9bp以下の同一性を有するという基準を更に含み得る。いくつかの実施形態では、ドナー鋳型ポリヌクレオチドは、少なくとも約10、少なくとも約50、少なくとも約100、又は少なくとも約200、又は少なくとも約300、又は少なくとも約400、又は少なくとも約500、又は少なくとも約600、又は少なくとも約700、又は少なくとも約800、又は少なくとも約900、又は少なくとも約1000、又は少なくとも約10,000、又は少なくとも約15,000ヌクレオチドを含む。他の実施形態では、ドナー鋳型は、少なくとも約10~約15,000ヌクレオチド、又は少なくとも約100~約10,000ヌクレオチド、又は少なくとも約400~約8,000ヌクレオチド、又は少なくとも約600~約5000ヌクレオチド、又は少なくとも約1000~約2000ヌクレオチドを含む。いくつかの実施形態では、ドナー鋳型は、一本鎖DNA鋳型又は一本鎖RNA鋳型である。他の実施形態では、ドナー鋳型は、二本鎖DNA鋳型である。ドナー鋳型配列は、ゲノム配列と比較して、特定の配列の差異、例えば、制限部位、ヌクレオチド多型、選択マーカー(例えば、薬剤耐性遺伝子、蛍光タンパク質、酵素など)などを含み得、これらは、切断部位でのドナー核酸の挿入の成功を評価するために使用され得るか、又は場合によっては、他の目的のために(例えば、標的ゲノム遺伝子座における発現を示すために)使用され得る。代替的に、これらの配列の差異は、隣接する組換え配列(例えば、FLP配列、loxP配列など)を含み得る。
いくつかの実施形態では、本開示は、細胞の標的核酸配列を改変する方法を提供し、当該細胞の標的核酸を、本明細書に記載の実施形態のいずれかの1つ以上のポリヌクレオチドと接触させることを含み、ポリヌクレオチドが、CasX: gRNA遺伝子編集ペアをコードし、gRNAが、標的核酸配列に相補的であり、したがって、それとハイブリダイズすることができる標的化配列を含み、接触させることが、標的核酸の改変をもたらす。核酸(例えば、ドナーポリヌクレオチド配列を含む核酸、本明細書に記載されるCasXバリアントタンパク質及びgRNAバリアントをコードする1つ以上の核酸)を細胞に導入する方法は、当該技術分野で既知であり、任意の好都合な方法を使用することができる。好適な方法としては、ウイルス感染、トランスフェクション、リポフェクション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン(PEI)媒介性トランスフェクション、DEAE-デキストラン媒介性トランスフェクション、リポソーム媒介性トランスフェクション、パーティクルガン技術、ヌクレオフェクション、エレクトロポレーション、ドナーDNAに融合された又はそれを動員する細胞透過性CasXタンパク質による直接添加、細胞圧搾、リン酸カルシウム沈殿、直接マイクロインジェクション、及びナノ粒子媒介性核酸送達などが挙げられる。核酸は、十分に開発されたトランスフェクション技術、並びに市販のQiagenからのTransMessenger(登録商標)試薬、StemgentからのStemfect(商標)RNAトランスフェクションキット、及びMirus Bio LLCからのTransIT(登録商標)-mRNAトランスフェクションキット、Lonzaヌクレオフェクション、Maxagenエレクトロポレーションなどを使用して細胞に提供され得る。CasXバリアントタンパク質をコードするヌクレオチド配列を含む核酸は、場合によっては、RNAである。したがって、いくつかの実施形態では、CasXバリアントタンパク質は、RNAとして細胞に導入され得る。RNAを細胞に導入する方法は、当該技術分野で既知であり、例えば、直接注入、トランスフェクション、又はDNAの導入に使用される任意の他の方法を含み得る。
他の実施形態では、本開示は、細胞の標的核酸配列を改変する方法を提供し、当該細胞を、本明細書に記載の実施形態のいずれかのCasXバリアントタンパク質及びgRNAバリアント並びに任意選択的にドナー鋳型を含むCasX: gRNA遺伝子編集ペアと接触させることを含み、gRNAが、標的核酸配列に相補的であり、したがって、それとハイブリダイズすることができる標的化配列を含み、接触させることが、標的核酸の改変をもたらす。組換え発現ベクターの細胞への導入は、任意の適切な培養培地中で、細胞の生存を促進する任意の適切な培養条件下で行うことができる。組換え発現ベクターの標的細胞への導入は、インビボ、インビトロ、又はエクスビボで行うことができる。
いくつかの実施形態では、ベクターは、標的宿主細胞に直接提供され得る。例えば、細胞は、ベクターが細胞によって取り込まれるように、対象核酸を含むベクター(例えば、ドナー鋳型配列を有し、gRNAバリアント及びCasXバリアントタンパク質をコードする組換え発現ベクター)と接触させることができる。細胞をプラスミドである核酸ベクターと接触させるための方法は、エレクトロポレーション、塩化カルシウムトランスフェクション、マイクロインジェクション、及びリポフェクションを含み、当該技術分野で周知である。ウイルスベクター送達の場合、細胞を、対象ウイルス発現ベクターを含むウイルス粒子と接触させることができる。例えば、ベクターは、ウイルス粒子、例えば、CasX: gRNA成分をコードするポリヌクレオチドを含むAAV又はVLPである。非ウイルス送達の場合、ベクター又はCasX: gRNA成分はまた、脂質ナノ粒子中での送達のために製剤化することができ、企図される脂質ナノ粒子としては、ナノスフェア、リポソーム、量子ドット、ポリエチレングリコール粒子、ヒドロゲル、及びミセルが挙げられるが、これらに限定されない。
いくつかの実施形態では、標的核酸の編集は、インビトロで、細胞内で、例えば、細胞培養システムで起こる。いくつかの実施形態では、編集は、インビボで、対象の細胞内で、例えば、動物の細胞で起こる。いくつかの実施形態では、細胞は、真核細胞である。例示的な真核細胞は、マウス細胞、ラット細胞、ブタ細胞、イヌ細胞、及び非ヒト霊長類細胞からなる群から選択される細胞を含み得る。いくつかの実施形態では、細胞は、ヒト細胞である。細胞の非限定的な例としては、胚性幹細胞、人工多能性幹細胞、生殖細胞、線維芽細胞、オリゴデンドロサイト、グリア細胞、造血幹細胞、ニューロン前駆細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、網膜細胞、がん細胞、T細胞、B細胞、NK細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植増殖心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液幹細胞、筋芽細胞、成体幹細胞、骨髄細胞、間葉系細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、又は出生後幹細胞が挙げられる。代替的な実施形態では、細胞は、原核細胞である。
標的核酸に対する切断又は任意の所望の改変を誘導するために、細胞の標的核酸をインビトロ又はエクスビボで改変する方法のいくつかの実施形態では、本開示のgRNAバリアント及びCasXバリアントタンパク質、並びに任意選択的にドナー鋳型配列は、核酸又はポリペプチド、複合体化RNP、ベクター、又はXDPとして導入されるかどうかにかかわらず、約30分~約24時間、又は少なくとも約1時間、1.5時間、2時間、2.5時間、3時間、3.5時間、4時間、5時間、6時間、7時間、8時間、12時間、16時間、18時間、20時間、又は約30分~約24時間の任意の他の期間、細胞に提供され、これは、約毎日~約4日毎の頻度、例えば、1.5日毎、2日毎、3日毎、又は約毎日~約4日毎の任意の他の頻度で繰り返され得る。薬剤は、対象細胞に、1回以上、例えば、1回、2回、3回、又は3回超提供され得、細胞は、各接触事象後に一定の時間(例えば、30分~約24時間)、薬剤とインキュベートされ得る。インビトロベースの方法の場合、CasX及びgRNA(及び任意選択的にドナー鋳型)とのインキュベーション期間後、培地を新鮮な培地と交換し、細胞を更に培養する。
いくつかの実施形態では、本方法は、遺伝子の変異を修正又は補償するように改変された細胞集団の治療有効用量を対象に投与することを含む。いくつかの実施形態では、改変された細胞の投与は、対象における野生型又は機能的遺伝子産物の発現をもたらす。本方法のいくつかの実施形態では、全細胞の用量は、約10~約10細胞/キログラム(kg)体重、例えば、10~10細胞/kg体重、例えば、約1×10細胞/kg、1.5×10細胞/kg、2×10細胞/kg、又は1×10細胞/kg体重の範囲内である。例えば、いくつかの実施形態では、細胞は、約10~約10細胞/キログラム(kg)体重、例えば、10~10細胞/kg体重、例えば、約1×10細胞/kg、1.5×10細胞/kg、2×10細胞/kg、若しくは1×10細胞/kg体重で、又はその誤差の特定の範囲内で投与される。一実施形態では、細胞は、細胞を投与される対象に対して同種である。別の実施形態では、細胞は、細胞を投与される対象に対して同種である。場合によっては、対象は、マウス、ラット、ブタ、及び非ヒト霊長類からなる群から選択される。他の場合では、対象は、ヒトである。
VIII.治療方法
別の態様では、本開示は、それを必要とする対象において疾患又は障害を治療する方法に関する。いくつかの治療戦略が、遺伝子変異に関連する疾患又は障害を有する対象の治療方法で使用するためのシステムを設計するために使用されている。いくつかの実施形態では、標的核酸の改変は、遺伝子のアレルに変異を有する対象において起こり、変異が、対象において疾患又は障害を引き起こす。いくつかの実施形態では、標的核酸の改変は、遺伝子の野生型アレルへの変異を変化させるか、又は機能的遺伝子産物の発現をもたらす。いくつかの実施形態では、標的核酸の改変は、対象において疾患又は障害を引き起こす遺伝子のアレルの発現をノックダウン又はノックアウトする。
いくつかの実施形態では、本方法は、本明細書に開示されるクラス2、V型CRISPRヌクレアーゼバリアント及びガイドRNAバリアントの遺伝子編集ペアを含む治療有効用量のシステムを対象に投与することを含む。いくつかの実施形態では、治療方法は、対象に、治療有効用量のi)本明細書に記載の実施形態のいずれかの第1のCasXバリアントと、(改変される標的核酸に相補的な標的化配列を有する)第1のgRNAバリアントと、を含むCasX:gRNAシステム、ii)第1のCasXタンパク質と、標的核酸に相補的な標的化配列を有する第1のgRNAと、ドナー鋳型と、を含むCasX:gRNAシステム、iii)(i)若しくは(ii)のCasX:gRNAシステムをコードする核酸、iv)本明細書に記載の実施形態のいずれかのAAVであり得る、(iii)の核酸を含むベクター、v)(i)若しくは(ii)のCasX:gRNAシステムを含むXDP、又はvi)(i)~(v)のうちの2つ以上の組み合せ、を投与することを含み、1)第1のgRNAによって標的化される対象の細胞の遺伝子が、CasXタンパク質(及び任意選択的にドナー鋳型)によって改変され(例えば、ノックダウン若しくはノックアウトされ)、又は2)第1のgRNAによって標的化される対象の細胞の遺伝子が、機能的な遺伝子産物が発現され得るように、CasXタンパク質(及び任意選択的にドナー鋳型)によって修正若しくは改変される。いくつかの実施形態では、治療方法は、第2のgRNA若しくは複数のgRNA、又は第2のgRNA若しくは複数のgRNAをコードする核酸を投与することを更に含み、第2のgRNA若しくは複数のgRNAが、第1のgRNAと比較して、標的核酸配列の異なる部分又は重複する部分に相補的な標的化配列を有する。前述において、各異なるgRNAは、CasXタンパク質と対になることが理解されるであろう。2つ以上の遺伝子編集ペアが細胞に提供される(例えば、同じ又は異なる標的核酸内の異なる配列に相補的である2つ以上の異なるスペーサーを含む2つのgRNAを含む)実施形態では、遺伝子ペアが、同時に提供されてもよく(例えば、2つのRNP及び/若しくはベクターとして)、又は同時に送達されてもよい。代替的に、それらは連続して提供されてもよく、例えば、まず、第1の遺伝子編集ペアが提供され、続いて、第2の遺伝子編集ペアが提供されるか、又はその逆であってもよい。
いくつかの実施形態では、治療方法は、対象に、治療有効用量のCasX: gRNAシステムをコードするAAVベクターを、少なくとも約1×10ベクターゲノム(vg/kg)、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×1010vg/kg、少なくとも約1×1011vg/kg、少なくとも約1×1012vg/kg、少なくとも約1×1013vg/kg、少なくとも約1×1014vg/kg、少なくとも約1×1015vg/kg、又は少なくとも約1×1016vg/kgの用量で投与することを含む。本方法の他の実施形態では、AAVベクターは、少なくとも約1×10vg/kg~約1×1016vg/kg、少なくとも約1×10vg/kg~約1×1015vg/kg、又は少なくとも約1×10vg/kg~約1×1014vg/kgの用量で対象に投与される。前述において、AAVベクターは、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV-Rh74、又はAAVRh10から選択される。他の実施形態では、治療方法は、対象に、治療有効用量のCasX: gRNAシステムのRNPを含むXDPを投与することを含む。一実施形態では、XDPは、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×1010粒子/kg、少なくとも約1×1011粒子/kg、少なくとも約1×1012粒子/kg、少なくとも約1×1013粒子/kg、少なくとも約1×1014粒子/kg、少なくとも約1×1015粒子/kg、少なくとも約1×1016粒子/kgの用量で対象に投与される。別の実施形態では、XDPは、少なくとも約1×10粒子/kg~約1×1016粒子/kg、又は少なくとも約1×10粒子/kg~約1×1015粒子/kg、又は少なくとも約1×10粒子/kg~約1×1014粒子/kgの用量で対象に投与される。ベクター又はXDPは、実質内、静脈内、動脈内、筋肉内、皮下、脳室内、大槽内、髄腔内、頭蓋内、硝子体内、網膜下、嚢内、及び腹腔内経路、又はそれらの組み合わせからなる群から選択される投与経路によって投与することができ、投与方法は、注射、輸血、又は移植である。投与は、1回、2回であり得るか、又は毎週、2週間毎、毎月、四半期毎、6ヶ月毎、年1回、又は2年毎若しくは3年毎に1回のレジメンスケジュールを使用して、複数回投与され得る。場合によっては、対象は、マウス、ラット、ブタ、及び非ヒト霊長類からなる群から選択される。他の場合では、対象は、ヒトである。
本方法のいくつかの実施形態では、改変することは、対象の標的細胞の標的核酸において一本鎖切断を導入することを含む。他の場合では、改変することは、対象の標的細胞の標的核酸において二本鎖切断を導入することを含む。いくつかの実施形態では、改変することは、遺伝子における1つ以上のヌクレオチドの挿入、欠失、置換、重複、又は逆位などの、標的核酸における1つ以上の変異を導入し、対象の改変された細胞における遺伝子産物の発現が、改変されていない細胞と比較して、少なくとも約10%、少なくとも約20%、少なくとも約30%、少なくとも約40%、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、又は少なくとも約90%減少する。場合によっては、対象の改変された細胞の遺伝子は、改変された細胞の少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、又は少なくとも95%が検出可能なレベルの遺伝子産物を発現しないように改変される。いくつかの実施形態では、疾患を有する対象に、遺伝子産物の発現をノックダウン又はノックアウトするための、治療有効量のCasX: gRNAシステムの投与は、対象が依然として基礎疾患に罹患している可能性があるにもかかわらず、対象において改善が観察されるように、基礎疾患の予防又は改善をもたらす。他の実施形態では、遺伝子は、NHEJ宿主修復機構によって改変され得るか、又はHDR若しくはHITI機構によって挿入されるドナー鋳型と併せて利用されて、改変された細胞における野生型又は機能的遺伝子産物の発現が、改変されていない細胞と比較して、少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、又は少なくとも約95%増加するように、対象の細胞における変異を切除、修正、又は補償することができる。いくつかの実施形態では、治療有効量のCasX-gRNAシステムの投与は、疾患の少なくとも1つの臨床的に関連するパラメータの改善をもたらす。
一部の場合では、本開示の核酸(例えば、本開示の組換え発現ベクター)又はCasXバリアント若しくはgRNAバリアントは、ミセル、リポソーム、又は脂質ナノ粒子のような組織化された構造の脂質で覆われ得る。組織化された構造がDNAと複合体化する場合、それはリポプレックスと呼ばれる。アニオン性(負に帯電)、中性、又はカチオン性(正に帯電)の3つのタイプの脂質が存在する。カチオン性脂質を利用するリポプレックスは、遺伝子導入に有用であることが証明されている。カチオン性脂質は、その正電荷のために、負に帯電したDNAと自然に複合体を形成する。また、それらの電荷の結果として、それらは細胞膜と相互作用する。次いで、リポプレックスのエンドサイトーシスが起こり、DNAが細胞質に放出される。カチオン性脂質はまた、細胞によるDNAの分解から保護する。
場合によっては、本開示の核酸(例えば、発現ベクター)は、目的のガイド配列の挿入部位を含む。例えば、核酸は、目的のガイド配列のための挿入部位を含むことができ、挿入部位は、ガイド配列が所望の標的配列にハイブリダイズするように変更された場合に変化しないgRNAバリアントの部分(例えば、足場領域)をコードするヌクレオチド配列に直接隣接する。したがって、場合によっては、発現ベクターは、gRNAのスペーサー配列部分をコードする部分が挿入配列(挿入部位)であることを除いて、gRNAをコードするヌクレオチド配列を含む。挿入部位は、所望の配列にスペーサーを挿入するために使用される任意のヌクレオチド配列である。様々な技術で使用するための「挿入部位」は、当業者に既知であり、任意の好都合な挿入部位を使用することができる。挿入部位は、核酸配列を操作するための任意の方法のためのものであり得る。例えば、場合によっては、挿入部位は、マルチクローニング部位(MCS)(例えば、1つ以上の制限酵素認識配列を含む部位)、ライゲーション非依存的クローニングのための部位、組換えベースのクローニング(例えば、ATT部位に基づく組換え)のための部位、CRISPR/Cas(例えば、Cas9)ベースの技術によって認識されるヌクレオチド配列などである。
IX.細胞
なお更なる実施形態では、本明細書に記載のCasX: gRNAシステムのいずれかの成分を含む細胞が本明細書に提供される。いくつかの実施形態では、細胞は、本明細書に記載される実施形態のgRNAバリアントのいずれかを含み、標的核酸に相補的であるスペーサーを更に含む。いくつかの実施形態では、細胞は、本明細書に記載されるCasXバリアント(例えば、表3及び表7の配列)を更に含む。他の実施形態では、細胞は、本明細書に記載の実施形態のCasX: gRNAのいずれかのRNPを含む。他の実施形態では、本開示は、本明細書に記載の実施形態のいずれかのCasX: gRNAシステムをコードするベクターを含む細胞を提供する。更に他の実施形態では、細胞は、変異を修正する(ノックインする)ために、又は欠陥遺伝子をノックダウン若しくはノックアウトするために、本明細書に記載の実施形態のいずれかのCasX: gRNAによって編集された標的核酸を含む。
いくつかの実施形態では、細胞は、本開示のCasXバリアントタンパク質をコードするヌクレオチド配列を含む核酸を含む改変された細胞(例えば、遺伝子改変細胞)である。いくつかの実施形態では、遺伝子改変細胞は、CasXバリアントタンパク質をコードするヌクレオチド配列を含むmRNAで遺伝子改変されている。いくつかの実施形態では、細胞は、a)本開示のCasXバリアントタンパク質をコードするヌクレオチド配列及びb)本開示のgRNAをコードするヌクレオチド配列、を含み、任意選択的に、ドナー鋳型を含むヌクレオチド配列を含む、組換え発現ベクターで遺伝子改変されている。場合によっては、このような細胞は、標的核酸の編集に使用するためのCasX: gRNAシステムの個々の成分又はRNPを産生するために使用される。他の場合では、このように遺伝子改変された細胞は、遺伝子療法などの目的のために、(例えば、遺伝子変異又は遺伝子欠陥によって引き起こされる疾患又は状態を治療するために)使用され得る。
本開示のCasXバリアントタンパク質及び/若しくはgRNA、並びに/又はCasXバリアントタンパク質及び/若しくはgRNAバリアントをコードするヌクレオチド配列を含む核酸のレシピエントとして機能し得る細胞は、例えば、インビトロ細胞、インビボ細胞、エクスビボ細胞、初代細胞、不死化細胞株の細胞、がん細胞、動物細胞、植物細胞、藻類細胞、真菌細胞などを含む様々な細胞のうちのいずれかであり得る。細胞は、本開示のCasX RNPのレシピエントであり得る。細胞は、本開示のCasXシステムの単一成分のレシピエントであり得る。細胞は、本明細書に記載の実施形態のいずれかのCasX、gRNA、及び任意選択的にCasX: gRNAシステムをコードするベクターのレシピエントであり得る。
本明細書に記載のCasX: gRNAシステムの産生のための宿主細胞として機能し得る細胞の非限定的な例としては、原核細胞(例えば、E coli)及び真核細胞(例えば、ベビーハムスター腎線維芽(BHK)細胞、ヒト胎児腎臓293(HEK293)細胞、ヒト胎児腎臓293T(HEK293T)細胞、NS0細胞、SP2/0細胞、YO骨髄腫細胞、P3X63マウス骨髄腫細胞、PER細胞、PER.C6細胞、ハイブリドーマ細胞、NIH3T3細胞、SV40遺伝物質を有するCV-1(サル)起源(COS)細胞、HeLa、チャイニーズハムスター卵巣(CHO)細胞、若しくは酵母細胞、又は組換え産物の産生に好適な当該技術分野で既知の他の真核細胞)が挙げられる。
いくつかの実施形態では、本開示は、疾患又は障害の治療のための、対象に投与するために改変された細胞集団を提供する。そのような細胞は、当該細胞を投与される対象に対して自己由来であり得る。他の実施形態では、細胞は、当該細胞を投与される対象に対して同種である。細胞は、動物細胞であってもよく、動物細胞に由来してもよい。細胞は、哺乳動物細胞であってもよく、又は哺乳動物細胞に由来してもよい。細胞は、げっ歯類細胞(例えば、ラット若しくはマウス)であってもよく、又はげっ歯類細胞に由来してもよい。細胞は、非ヒト霊長類細胞であってもよく、又は非ヒト霊長類細胞に由来してもよい。細胞は、ヒト細胞であってもよく、又はヒト細胞に由来してもよい。好適な細胞としては、いくつかの実施形態では、幹細胞(例えば、胚性幹(ES)細胞、人工多能性幹(iPS)細胞)、生殖細胞(例えば、卵母細胞、精子、卵原細胞、精原細胞など)、体細胞(例えば、線維芽細胞、オリゴデンドロサイト、グリア細胞、造血幹細胞、ニューロン前駆細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、網膜細胞、がん細胞、T細胞、B細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植増殖心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液幹細胞、筋芽細胞、成体幹細胞、骨髄細胞、間葉系細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、又は出生後幹細胞)を挙げることができる。いくつかの実施形態では、細胞は免疫細胞である。いくつかの場合では、免疫細胞は、T細胞、B細胞、単球、ナチュラルキラー細胞、樹状細胞、又はマクロファージである。場合によっては、免疫細胞は、細胞傷害性T細胞である。場合によっては、免疫細胞は、ヘルパーT細胞である。場合によっては、免疫細胞は、制御性T細胞(Treg)である。場合によっては、細胞は、キメラ抗原受容体(Car-T)を発現する。場合によっては、細胞は、幹細胞である。幹細胞は、例えば、成体幹細胞を含み得る。成体幹細胞は、体性幹細胞とも称され得る。いくつかの実施形態では、幹細胞は、造血幹細胞(HSC)、神経幹細胞、又は間葉系幹細胞である。他の実施形態では、幹細胞は、間葉系幹細胞(MSC)である。MSCは、元々、胚性中胚葉に由来し、成体の骨髄から単離され、これが分化して、筋肉、骨、軟骨、脂肪、骨髄間質、及び腱を形成することができる。MSCを単離する方法は、当該技術分野で既知であり、任意の既知の方法を使用してMSCを得ることができる。
X.キット及び製造品
別の態様では、本開示の実施形態のいずれかのCasXタンパク質及び1つ以上のgRNA、並びに好適な容器(例えば、チューブ、バイアル、又はプレート)を含むキットが本明細書に提供される。いくつかの実施形態では、キットは、本開示のgRNAバリアント、又は配列番号5若しくは配列番号4の参照gRNAを含む。含まれ得る例示的なgRNAバリアントは、表2に示される配列番号2238~XXのうちのいずれか1つの配列を含む。
いくつかの実施形態は、キットは、本開示のCasXバリアントタンパク質(例えば、表3及び表7の配列)、又は配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質を含む。例示的な実施形態では、本開示のキットは、配列番号247~592及び1147~1231のうちのいずれか1つのCasXバリアントを含む。更なる例示的な実施形態では、本開示のキットは、配列番号270~592及び1147~1231のうちのいずれか1つのCasXバリアントを含む。更なる例示的な実施形態では、本開示のキットは、配列番号415~592及び1147~1231のうちのいずれか1つのCasXバリアントを含む。
いくつかの実施形態では、キットは、gRNA又はgRNAをコードするベクターを含み、gRNAが、配列番号2101~2332及び2353~2398からなる群から選択される配列を含む。いくつかの実施形態では、gRNAは、配列番号2238~2332及び2353~2398からなる群から選択される配列を含む。いくつかの実施形態では、gRNAは、配列番号2281~2332及び2353~2398からなる群から選択される配列を含む。いくつかの実施形態では、gRNAは、配列番号2236、2237、2238、2241、2244、2248、2249、及び2259~2280からなる群から選択される配列を含む。いくつかの実施形態では、gRNAは、表2に示される配列のうちのいずれか1つからなる群から選択される配列を含む。
特定の実施形態では、表3及び表7のCasXバリアントタンパク質並びに本明細書に記載されるgRNAバリアント(例えば、表2の配列)を含むCasXタンパク質及びgRNAの編集ペアを含むキットが本明細書に提供される。例示的な実施形態では、本開示のキットは、CasX及びgRNAの編集ペアを含み、CasXバリアントが、配列番号247~592又は1147~1231のうちのいずれか1つを含む。更なる例示的な実施形態では、本開示のキットは、CasX及びgRNAの編集ペアを含み、CasXバリアントが、配列番号270~592及び1147~1231のうちのいずれか1つを含む。更なる例示的な実施形態では、本開示のキットは、CasX及びgRNAの編集ペアを含み、CasXバリアントが、配列番号415~592及び1147~1231のうちのいずれか1つを含む。いくつかの実施形態では、遺伝子編集ペアのgRNAは、配列番号2101~2332又は2353~2398のうちのいずれか1つを含む。いくつかの実施形態では、遺伝子編集ペアのgRNAは、配列番号2238~2332及び2353~2398のうちのいずれか1つを含む。いくつかの実施形態では、遺伝子編集ペアのgRNAは、配列番号2281~2332又は2353~2398のうちのいずれか1つを含む。いくつかの実施形態では、遺伝子編集ペアのgRNAは、配列番号2236、2237、2238、2241、2244、2248、2249、又は2259~2280のうちのいずれか1つを含む。
いくつかの実施形態では、キットは、緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを更に含む。いくつかの実施形態では、キットは、薬学的に許容される担体、希釈剤、又は賦形剤を更に含む。
いくつかの実施形態では、キットは、遺伝子編集用途のための適切な対照組成物、及び使用説明書を含む。
いくつかの実施形態では、キットは、ベクターを含み、本開示のCasXバリアントタンパク質をコードする配列、本開示のgRNAバリアント、任意選択的にドナー鋳型、又はそれらの組み合わせを含む。
本明細書は、多数の例示的な構成、方法、パラメータなどを記載する。しかしながら、かかる説明は、本開示の範囲に対する限定として意図されるものではなく、代わりに例示的な実施形態の説明として提供されることを認識されたい。上記の本主題の実施形態は、単独で、又は1つ以上の他の態様若しくは実施形態と組み合わせて有益であり得る。前述の説明を限定することなく、本開示の特定の非限定的な実施形態が以下に提供される。本開示を読めば当業者には明らかであるように、個々に番号付けされた実施形態の各々は、先行する若しくは後続する個々に番号付けされた実施形態のいずれかとともに使用され得るか、又はそれと組み合わされ得る。これは、実施形態の全てのそのような組み合わせに対するサポートを提供することを意図しており、以下に明示的に提供される実施形態の組み合わせに限定されない。
列挙された実施形態
本発明は、以下に列挙された例示的な実施形態を参照することによって定義され得る。
セットI
実施形態1.参照CasXタンパク質のバリアント(CasXバリアント)であって、
a.CasXバリアントが、参照CasXタンパク質において少なくとも1つの改変を含み、
b.CasXバリアントが、参照CasXタンパク質と比較して、少なくとも1つの改善された特徴を示し、任意選択的に、バリアントが、表3及び表8に提供される配列から選択される配列を含む、CasXバリアント。
実施形態2.CasXバリアントの改善された特徴が、CasXバリアントのフォールディングの改善、ガイド核酸(gNA)に対する結合親和性の改善、標的DNAに対する結合親和性の改善、標的DNAの編集において、ATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善、標的DNAの巻き戻しの改善、編集活性の増加、編集効率の改善、編集特異性の改善、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、オフターゲット切断の減少、非標的DNA鎖の結合の改善、タンパク質安定性の改善、タンパク質溶解度の改善、タンパク質:gRNA複合体(RNP)の安定性の改善、タンパク質:gRNA複合体の溶解度の改善、タンパク質収量の改善、タンパク質発現の改善、融合体特徴の改善、又はそれらの組み合わせからなる群から選択される、実施形態1に記載のCasXバリアント。
実施形態3.少なくとも1つの改変が、
a.CasXバリアントのドメインにおける少なくとも1つのアミノ酸置換、
b.CasXバリアントのドメインにおける少なくとも1つのアミノ酸欠失、
c.CasXバリアントのドメインにおける少なくとも1つのアミノ酸挿入、
d.異なるCasXからのドメインの全部若しくは一部の置換、
e.CasXバリアントのドメインの全部若しくは一部の欠失、又は
f.(a)~(e)の任意の組み合わせ、を含む、実施形態1又は2に記載のCasXバリアント。
実施形態4.参照CasXタンパク質が、配列番号1、配列番号2、配列番号3、配列番号270、又は配列番号336の配列を含む、実施形態1~3のいずれか1つに記載のCasXバリアント。
実施形態5.少なくとも1つの改変が、
a.非標的鎖結合(NTSB)ドメイン、
b.標的鎖装填(TSL)ドメイン、
c.ヘリックスIドメイン、
d.ヘリックスIIドメイン、
e.オリゴヌクレオチド結合ドメイン(OBD)、又は
f.RuvC DNA切断ドメイン、から選択されるドメインにある、実施形態1~4のいずれか1つに記載のCasXバリアント。
実施形態6.NTSBドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態7.TSLドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態8.ヘリックスIドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態9.ヘリックスIIドメインに少なくとも1つの改変を含む、実施形態5~8のいずれか1つに記載のCasXバリアント。
実施形態10.OBDドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態11.RuvC DNA切断ドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態12.改変が、標的DNAを編集する能力の増加をもたらす、実施形態5~11のいずれか1つに記載のCasXバリアント。
実施形態13.CasXバリアントが、ガイド核酸(gNA)とリボ核タンパク質複合体(RNP)を形成することができる、実施形態1~12のいずれか1つに記載の組成物。
実施形態14.少なくとも1つの改変が、
a.CasXバリアントにおける1~100個の連続した又は連続していないアミノ酸の置換、
b.CasXバリアントにおける1~100個の連続した又は連続していないアミノ酸の欠失、
c.CasXにおける1~100個の連続した又は連続していないアミノ酸の挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態1~13のいずれか1つに記載の組成物。
実施形態15.少なくとも1つの改変が、
a.CasXバリアントにおける5~10個の連続した又は連続していないアミノ酸の置換、
b.CasXバリアントにおける1~5個の連続した又は連続していないアミノ酸の欠失、
c.CasXにおける1~5個の連続した又は連続していないアミノ酸の挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態14に記載のCasXバリアント。
実施形態16.CasXバリアントが、1つのドメインに2つ以上の改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態17.CasXバリアントが、2つ以上のドメインに改変を含む、実施形態1~16のいずれか1つに記載のCasXバリアント。
実施形態18.gNA:標的DNAのCasXバリアントとの複合体化が起こるチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態19.gNAと結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態20.非標的鎖DNAと結合するチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態21.標的DNAのプロトスペーサー隣接モチーフ(PAM)と結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態22.CasXバリアントの連続していない表面露出アミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態23.CasXバリアントのドメインにおける疎水性パッキングを介してコアを形成する連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態24.改変が、領域の1つ以上のアミノ酸の欠失、挿入、又は置換のうちの1つ以上である、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態25.CasXバリアントの領域の2~15個のアミノ酸残基が、帯電アミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態26.CasXバリアントの領域の2~15個のアミノ酸残基が、極性アミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態27.CasXバリアントの領域の2~15個のアミノ酸残基が、DNA又はRNA塩基とスタッキングするアミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態28.CasXバリアントが、表3の配列からなる群から選択される配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を有する、実施形態1~5のいずれか1つに記載のCasXバリアント。
実施形態29.異なるCasX由来のNTSB及び/又はヘリックス1bドメインの置換を更に含む、実施形態1~5のいずれか1つに記載のCasXバリアント。
実施形態30.置換されたNTSBドメイン及び/又はヘリックス1bドメインが、配列番号1の参照CasXに由来する、実施形態29のCasXバリアント。
実施形態31.1つ以上の核局在化シグナル(NLS)を更に含む、実施形態1~30のいずれか1つに記載のCasXバリアント。
実施形態32.1つ以上のNLSが、PKKKRKV(配列番号352)、KRPAATKKAGQAKKKK(配列番号353)、PAAKRVKLD(配列番号354)、RQRRNELKRSP(配列番号355)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号356)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号357)、VSRKRPRP(配列番号358)、PPKKARED(配列番号35()、PQPKKKPL(配列番号360)、SALIKKKKKMAP(配列番号361)、DRLRR(配列番号362)、PKQKKRK(配列番号363)、RKLKKKIKKL(配列番号364)、REKKKFLKRR(配列番号365)、KRKGDEVDGVDEVAKKKSKK(配列番号366)、RKCLQAGMNLEARKTKK(配列番号367)、PRPRKIPR(配列番号368)、PPRKKRTVV(配列番号369)、NLSKKKKRKREK(配列番号370)、RRPSRPFRKP(配列番号371)、KRPRSPSS(配列番号372)、KRGINDRNFWRGENERKTR(配列番号373)、PRPPKMARYDN(配列番号374)、KRSFSKAF(配列番号375)、KLKIKRPVK(配列番号376)、PKKKRKVPPPPAAKRVKLD(配列番号377)、PKTRRRPRRSQRKRPPT(配列番号378)、SRRRKANPTKLSENAKKLAKEVEN(配列番号379)、KTRRRPRRSQRKRPPT(配列番号380)、RRKKRRPRRKKRR(配列番号381)、PKKKSRKPKKKSRK(配列番号382)、HKKKHPDASVNFSEFSK(配列番号383)、QRPGPYDRPQRPGPYDRP(配列番号384)、LSPSLSPLLSPSLSPL(配列番号385)、RGKGGKGLGKGGAKRHRK(配列番号386)、PKRGRGRPKRGRGR(配列番号387)、及びPKKKRKVPPPPKKKRKV(配列番号389)からなる配列の群から選択される、実施形態31に記載のCasXバリアント。
実施形態33.1つ以上のNLSが、CasXタンパク質のC末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態34.1つ以上のNLSが、CasXタンパク質のN末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態35.少なくとも2つのNLSを含み、少なくとも2つのNLSが、CasXタンパク質のN末端又はその近く及びC末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態36.CasXバリアントの改善された特徴のうちの1つ以上が、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質と比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態2~35のいずれか1つに記載のCasXバリアント。
実施形態37.CasXバリアントの改善された特徴のうちの1つ以上が、配列番号1、配列番号2、配列番号3、配列番号270、又は配列番号336の参照CasXタンパク質と比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、少なくとも約100倍、又はそれ以上改善されている、実施形態2~35のいずれか1つに記載のCasXバリアント。
実施形態38.改善された特徴が、編集効率を含み、CasXバリアントが、配列番号270又は配列番号336の参照CasXタンパク質と比較して、1.1~100倍の編集効率の改善を含む、実施形態2~37のいずれか1つに記載のCasXバリアント。
実施形態39.CasXバリアントを含むRNPが、PAM配列TTC、ATC、GTC、又はCTCのうちのいずれか1つが、細胞アッセイシステムにおいてgRNAの標的化配列と同一性を有するプロトスペーサーの非標的鎖に対して1ヌクレオチド5’側に位置する場合、同等のアッセイシステムにおける参照CasXタンパクを含むRNPの編集効率及び/又は結合と比較して、標的DNAにおけるより高い編集効率及び/又は標的配列の結合を示す、実施形態1~38のいずれか1つに記載のCasXバリアント。
実施形態40.PAM配列が、TTCである、実施形態39に記載のCasXバリアント。
実施形態41.PAM配列が、ATCである、実施形態39に記載のCasXバリアント。
実施形態42.PAM配列が、CTCである、実施形態39に記載のCasXバリアント。
実施形態43.PAM配列が、GTCである、実施形態39に記載のCasXバリアント。
実施形態44.CasXバリアントを含むRNPの改善された編集効率及び/又は標的DNAへの結合が、参照CasXを含むRNPと比較して、少なくとも約1.1~約100倍改善されている、実施形態39に記載のCasXバリアント。
実施形態45.CasXバリアントが、400~2000個のアミノ酸を含む、実施形態1~44のいずれか1つに記載のCasXバリアント。
実施形態46.CasXバリアントタンパク質が、ニッカーゼ活性を有するヌクレアーゼドメインを含む、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態47.CasXバリアントタンパク質が、二本鎖切断活性を有するヌクレアーゼドメインを含む、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態48.CasXタンパクが、触媒的に不活性なCasX(dCasX)タンパク質であり、dCasX及びgNAが、標的DNAに結合する能力を保持する、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態49.dCasXが、残基:
a.配列番号1のCasXタンパク質に対応するD672、及び/若しくはE769、及び/若しくはD935、又は
b.配列番号2のCasXタンパク質に対応するD659、及び/若しくはE756、及び/若しくはD922、に変異を含む、実施形態48に記載のCasXバリアント。
実施形態50.変異が、残基のアラニンへの置換である、実施形態49に記載のCasXバリアント。
実施形態51.第1のCasXタンパク質由来の第1のドメインと、第1のCasXタンパク質とは異なる第2のCasXタンパク質由来の第2のドメインと、を含む、実施形態1~50のいずれか1つに記載のCasXバリアント。
実施形態52.第1のドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態51に記載のCasXバリアント。
実施形態53.第2のドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態51に記載のCasXバリアント。
実施形態54.第1及び第2のドメインが、同じドメインではない、実施形態51~53のいずれか1つに記載のCasXバリアント。
実施形態55.CasXバリアントが、第1のCasXタンパク質由来の第1の部分と、第1のCasXタンパク質とは異なる第2のCasXタンパク質由来の第2の部分と、を含む少なくとも1つのキメラドメインを含む、実施形態1~50のいずれか1つに記載のCasXバリアント。
実施形態56.少なくとも1つのキメラドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態55に記載のCasXバリアント。
実施形態57.少なくとも1つのキメラドメインが、キメラRuvCドメインを含む、実施形態56に記載のCasXバリアント。
実施形態58.CasXに融合された異種タンパク質又はそのドメインを含む、実施形態1~57のいずれか1つに記載のCasXバリアント。
実施形態59.異種タンパク質又はそのドメインが、塩基エディターである、実施形態58に記載のCasXバリアント。
実施形態60.塩基エディターが、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼである、実施形態59に記載のCasXバリアント。
実施形態61.参照CasXタンパク質又はCasXバリアントに結合することができる参照ガイド核酸足場のバリアント(gNAバリアント)であって、
a.gNAバリアントが、参照ガイド核酸足場配列と比較して、少なくとも1つの改変を含み、
b.gNAバリアントが、参照ガイド核酸足場と比較して、1つ以上の改善された特徴を示す、gNAバリアント。
実施形態62.1つ以上の改善された特徴が、安定性の改善、溶解度の改善、gNAの転写の改善、ヌクレアーゼ活性に対する耐性の改善、gNAのフォールディング率の増加、フォールディング中の副生成物形成の減少、生産的なフォールディングの増加、CasXタンパク質に対する結合親和性の改善、CasXタンパク質と複合体化した場合の標的DNAに対する結合親和性の改善、CasXタンパク質と複合体化した場合の遺伝子編集の改善、CasXタンパク質と複合体化した場合の編集の特異性の改善、及びCasXタンパク質と複合体化した場合の標的DNAの編集におけるATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善からなる群から選択される、実施形態61に記載のgNAバリアント。
実施形態63.参照ガイド足場が、配列番号4~16又は配列番号2238又は配列番号2239の配列からなる群から選択される配列を含む、実施形態61又は62に記載のgNAバリアント。
実施形態64.少なくとも1つの改変が、
a.gNAバリアントの領域における少なくとも1つのヌクレオチド置換、
b.gNAバリアントの領域における少なくとも1つのヌクレオチド欠失、
c.gNAバリアントの領域における少なくとも1つのヌクレオチド挿入、
d.gNAバリアントの領域の全部若しくは一部の置換、
e.gNAバリアントの領域の全部若しくは一部の欠失、又は
f.(a)~(e)の任意の組み合わせ、を含む、実施形態61~63のいずれか1つに記載のgNAバリアント。
実施形態65.gNAバリアントの領域が、伸長ステムループ、足場ステムループ、三重鎖、及びシュードノットからなる群から選択される、実施形態64に記載のgNAバリアント。
実施形態66.足場ステムが、バブルを更に含む、実施形態65に記載のgNAバリアント。
実施形態67.足場が、三重鎖ループ領域を更に含む、実施形態65又は実施形態66に記載のgNAバリアント。
実施形態68.足場が、5’非構造化領域を更に含む、実施形態65~67のいずれか1つに記載のgNAバリアント。
実施形態69.少なくとも1つの改変が、
a.gNAバリアントの1つ以上の領域における1~15個の連続した若しくは連続していないヌクレオチドの置換、
b.gNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの欠失、
c.gNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの挿入、
d.足場ステムループ若しくは伸長ステムループの、近位の5’末端及び3’末端を有する異種RNA源由来のRNAステムループ配列による置換、又は
e.(a)~(d)の任意の組み合わせ、を含む、実施形態64~68のいずれか1つに記載のgNAバリアント。
実施形態70.少なくとも10、少なくとも100、少なくとも500、少なくとも1000、又は少なくとも10,000ヌクレオチドを含む伸長ステムループ領域を含む、実施形態61~69のいずれか1つに記載のgNAバリアント。
実施形態71.異種RNAステムループ配列が、gNAの安定性を増加させる、実施形態69に記載のgNAバリアント。
実施形態72.異種RNAステムループが、タンパク質、RNA構造、DNA配列、又は小分子に結合することができる、実施形態71に記載のgNAバリアント。
実施形態73.異種RNAステムループ配列が、MS2、Qβ、U1ヘアピンII、Uvsx、又はPP7ステムループから選択される、実施形態71又は実施形態72に記載のgNAバリアント。
実施形態74.gNAバリアントが、1つの領域に2つ以上の改変を含む、実施形態61~73のいずれか1つに記載のgNAバリアント。
実施形態75.gNAバリアントが、2つ以上の領域に改変を含む、実施形態61~74のいずれか1つに記載のgNAバリアント。
実施形態76.gNAバリアントが、標的化配列を更に含み、標的化配列が、標的DNA配列に相補的である、実施形態61~75のいずれか1つに記載のgNAバリアント。
実施形態77.標的化配列が、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、又は35ヌクレオチドを有する、実施形態76に記載のgNAバリアント。
実施形態78.標的化配列が、20ヌクレオチドを有する、実施形態76又は実施形態77に記載のgNAバリアント。
実施形態79.gNAが、標的化配列に連結された足場配列を含むシングルガイドgNAである、実施形態76~78のいずれか1つに記載のgNAバリアント。
実施形態80.CasXバリアントの改善された特徴のうちの1つ以上が、配列番号4又は配列番号5の参照gNAと比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態61~79のいずれか1つに記載のgNAバリアント。
実施形態81.gNAバリアントの改善された特徴のうちの1つ以上が、配列番号4、配列番号5、配列番号2238、配列番号2239、バリアント足場174(表2)、又はバリアント足場175(表2)の参照gNAと比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、若しくは少なくとも約100倍、又はそれ以上改善されている、実施形態61~79のいずれか1つに記載のgNAバリアント。
実施形態82.伸長ステム領域を除いて、配列番号4又は配列番号5と少なくとも60%の配列同一性を有する足場領域を含む、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態83.配列番号14と少なくとも60%の配列同一性を有する足場ステムループを含む、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態84.gNAバリアント配列の足場が、配列番号4、配列番号5、配列番号2238、配列番号2239、バリアント足場174(表2)、又はバリアント足場175(表2)の配列と少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、又は少なくとも70%、少なくとも80%、少なくとも85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態85.gNAバリアント配列の足場が、配列番号2101~2285若しくは4433~4437の配列の群から選択される配列、又はそれと少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する配列を含む、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態86.gNAバリアント配列の足場が、配列番号2101~2285又は4433~4437の配列の群から選択される配列からなる、実施形態85に記載のgNAバリアント。
実施形態87.1つ以上のリボザイムを更に含む、実施形態61~86のいずれか1つに記載のgNAバリアント。
実施形態88.1つ以上のリボザイムが、独立して、gNAバリアントの末端に融合されている、実施形態87に記載のgNAバリアント。
実施形態89.1つ以上のリボザイムのうちの少なくとも1つが、デルタ型肝炎ウイルス(HDV)リボザイム、ハンマーヘッドリボザイム、ピストルリボザイム、ハチェットリボザイム、又はタバコ輪斑ウイルス(TRSV)リボザイムである、実施形態87又は実施形態88に記載のgNAバリアント。
実施形態90.タンパク質結合モチーフを更に含む、実施形態61~89のいずれか1つに記載のgNAバリアント。
実施形態91.熱安定性ステムループを更に含む、実施形態61~90のいずれか1つに記載のgNAバリアント。
実施形態92.gNAが、化学的に改変されている、実施形態61~91のいずれか1つに記載のgNAバリアント。
実施形態93.gNAが、第1のgNA由来の第1の領域と、第1のgNAとは異なる第2のgNA由来の第2の領域と、を含む、実施形態61~92のいずれか1つに記載のgNAバリアント。
実施形態94.第1の領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態93に記載のgNAバリアント。
実施形態95.第2の領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態93又は実施形態94に記載のgNAバリアント。
実施形態96.第1の領域と第2の領域とが、同じ領域ではない、実施形態93~95のいずれか1つに記載のgNAバリアント。
実施形態97.第1のgNAが、配列番号4の配列を含み、第2のgNAが、配列番号5の配列を含む、実施形態93~95のいずれか1つに記載のgNAバリアント。
実施形態98.第1のgNA由来の第1の部分と、第2のgNA由来の第2の部分と、を含む少なくとも1つのキメラ領域を含む、実施形態61~97のいずれか1つに記載のgNAバリアント。
実施形態99.少なくとも1つのキメラ領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態98に記載のgNAバリアント。
実施形態100.配列番号2101~2285のうちのいずれか1つのいずれか1つの配列を含む、実施形態61に記載のgNAバリアント。
実施形態101.CasXタンパク質及び第1のgNAを含む、遺伝子編集ペア。
実施形態102.CasX及びgNAが、リボ核タンパク質複合体(RNP)中で一緒に会合することができる、実施形態101に記載の遺伝子編集ペア。
実施形態103.CasX及びgNAが、リボ核タンパク質複合体(RNP)において一緒に会合している、実施形態101に記載の遺伝子編集ペア。
実施形態104.第1のgNAが、実施形態76~100のいずれか1つに記載のgNAバリアントと、標的DNAに相補的である標的化配列と、を含む、実施形態101~103のいずれか1つに記載の遺伝子編集ペア。
実施形態105.CasXが、実施形態1~60のいずれか1つに記載のCasXバリアントを含む、実施形態101~104のいずれか1つに記載の遺伝子編集ペア。
実施形態106.
a.実施形態76~100のいずれか1つに記載のgNAバリアントと、
b.実施形態1~60のいずれか1つに記載のCasXバリアントと、を含む、実施形態101~105のいずれか1つに記載の遺伝子編集ペア。
実施形態107.CasXバリアント及びgNAバリアントの遺伝子編集ペアが、配列番号1、配列番号2、配列番号3、配列番号270、又は配列番号336の参照CasXタンパク質、及び配列番号4、5、2238、又は2239の参照ガイド核酸を含む遺伝子編集ペアと比較して、1つ以上の改善された特徴を有する、実施形態106に記載の遺伝子編集ペア。
実施形態108.1つ以上の改善された特徴が、CasX: gNA(RNP)複合体安定性の改善、CasXとgNAとの間の結合親和性の改善、RNP複合体形成の動態の改善、より高い割合の切断コンピテントRNP、標的DNAに対するRNP結合親和性の改善、増加した範囲のPAM配列を利用する能力、標的DNAの巻き戻しの改善、編集活性の増加、編集効率の改善、編集特異性の改善、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、オフターゲット切断の減少、DNAの非標的鎖の結合の改善、又はヌクレアーゼ活性に対する耐性の改善、を含む、実施形態107に記載の遺伝子編集ペア。
実施形態109.改善された特徴のうちの少なくとも1つ以上が、参照CasXタンパク質及び参照ガイド核酸の遺伝子編集ペアと比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態107又は実施形態108に記載の遺伝子編集ペア。
実施形態110.CasXバリアントの改善された特徴のうちの1つ以上が、参照CasXタンパク質及び参照ガイド核酸の遺伝子編集ペアと比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、若しくは少なくとも約100倍、又はそれ以上改善されている、実施形態107又は108に記載の遺伝子編集ペア。
実施形態111.改善された特徴が、配列番号2及び配列番号5の参照編集ペアと比較して、4~9倍の編集活性の増加を含む、実施形態107又は実施形態108に記載の遺伝子編集ペア。
実施形態112.実施形態101~111のいずれか1つに記載の遺伝子編集ペアを含む組成物であって、
a.実施形態1~60のいずれか1つに記載のCasXバリアントを含む第2の遺伝子編集ペアと、
b.実施形態61~100のいずれか1つに記載の第2のgNAバリアントと、を含み、第2のgNAバリアントが、第1のgNAの標的化配列と比較して、標的DNAの異なる部分又は重複する部分に相補的な標的化配列を有する、組成物。
実施形態113.CasXバリアント及びgNAバリアントのRNPが、参照CasXタンパク質及び参照ガイド核酸のRNPと比較して、より高い割合の切断コンピテントRNPを有する、実施形態101~112のいずれか1つに記載の遺伝子編集ペア。
実施形態114.RNPが、標的DNAに結合して切断することができる、実施形態101~113のいずれか1つに記載の遺伝子編集ペア。
実施形態115.RNPが、標的DNAに結合することができるが、標的DNAを切断することができない、実施形態101~112のいずれか1つに記載の遺伝子編集ペア。
実施形態116.RNPが、標的DNAに結合し、標的DNAにおける1つ以上の一本鎖ニックを生成することができる、実施形態101~112のいずれか1つに記載の遺伝子編集ペア。
実施形態117.配列番号4416~4432のうちのいずれか1つのアミノ酸配列を含む、CasXバリアント。
実施形態118.配列番号4433~4437のうちのいずれか1つのアミノ酸配列を含む、gNAバリアント。
セットII
実施形態1.参照CasXタンパク質のバリアント(CasXバリアント)であって、
a.CasXバリアントが、参照CasXタンパク質において少なくとも1つの改変を含み、
b.CasXバリアントが、参照CasXタンパク質と比較して、少なくとも1つの改善された特徴を示し、任意選択的に、バリアントが、表3及び表8に提供される配列から選択される配列を含む、CasXバリアント。
実施形態2.CasXバリアントの改善された特徴が、CasXバリアントのフォールディングの改善、ガイド核酸(gNA)に対する結合親和性の改善、標的DNAに対する結合親和性の改善、標的DNAの編集において、ATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善、標的DNAの巻き戻しの改善、編集活性の増加、編集効率の改善、編集特異性の改善、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、オフターゲット切断の減少、非標的DNA鎖の結合の改善、タンパク質安定性の改善、タンパク質溶解度の改善、タンパク質:gNA複合体(RNP)の安定性の改善、タンパク質:gNA複合体の溶解度の改善、タンパク質収量の改善、タンパク質発現の改善、融合体特徴の改善、又はそれらの組み合わせからなる群から選択される、実施形態1に記載のCasXバリアント。
実施形態3.少なくとも1つの改変が、
a.CasXバリアントのドメインにおける少なくとも1つのアミノ酸置換、
b.CasXバリアントのドメインにおける少なくとも1つのアミノ酸欠失、
c.CasXバリアントのドメインにおける少なくとも1つのアミノ酸挿入、
d.異なるCasXからのドメインの全部若しくは一部の置換、
e.CasXバリアントのドメインの全部若しくは一部の欠失、又は
f.(a)~(e)の任意の組み合わせ、を含む、実施形態1又は2に記載のCasXバリアント。
実施形態4.参照CasXタンパク質が、配列番号1、配列番号2、又は配列番号3の配列を含む、実施形態1~3のいずれか1つに記載のCasXバリアント。
実施形態5.少なくとも1つの改変が、
a.非標的鎖結合(NTSB)ドメイン、
b.標的鎖装填(TSL)ドメイン、
c.ヘリックスIドメイン、
d.ヘリックスIIドメイン、
e.オリゴヌクレオチド結合ドメイン(OBD)、又は
f.RuvC DNA切断ドメイン、から選択されるドメインにある、実施形態1~4のいずれか1つに記載のCasXバリアント。
実施形態6.NTSBドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態7.TSLドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態8.ヘリックスIドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態9.ヘリックスIIドメインに少なくとも1つの改変を含む、実施形態5~8のいずれか1つに記載のCasXバリアント。
実施形態10.OBDドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態11.RuvC DNA切断ドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態 改変が、標的DNAを編集する能力の増加をもたらす、実施形態5~11のいずれか1つに記載のCasXバリアント。
実施形態13.CasXバリアントが、ガイド核酸(gNA)とリボ核タンパク質複合体(RNP)を形成することができる、実施形態1~12のいずれか1つに記載のCasXバリアント。
実施形態14.少なくとも1つの改変が、
a.CasXバリアントにおける1~100個の連続した又は連続していないアミノ酸の置換、
b.CasXバリアントにおける1~100個の連続した又は連続していないアミノ酸の欠失、
c.CasXにおける1~100個の連続した又は連続していないアミノ酸の挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態1~13のいずれか1つに記載のCasXバリアント。
実施形態15.少なくとも1つの改変が、
a.CasXバリアントにおける5~10個の連続した又は連続していないアミノ酸の置換、
b.CasXバリアントにおける1~5個の連続した又は連続していないアミノ酸の欠失、
c.CasXにおける1~5個の連続した又は連続していないアミノ酸の挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態14に記載のCasXバリアント。
実施形態16.CasXバリアントが、1つのドメインに2つ以上の改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態17.CasXバリアントが、2つ以上のドメインに改変を含む、実施形態1~16のいずれか1つに記載のCasXバリアント。
実施形態18.gNA:標的核酸のCasXバリアントとの複合体化が起こるチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態19.gNAと結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態20.非標的鎖DNAと結合するチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態21.標的DNAのプロトスペーサー隣接モチーフ(PAM)と結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態22.CasXバリアントの連続していない表面露出アミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態23.CasXバリアントのドメインにおける疎水性パッキングを介してコアを形成する連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態24.改変が、領域の1つ以上のアミノ酸の1つ以上の欠失、挿入、又は置換のうちの1つ以上である、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態25.CasXバリアントの領域の2~15個のアミノ酸残基が、帯電アミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態26.CasXバリアントの領域の2~15個のアミノ酸残基が、極性アミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態27.CasXバリアントの領域の2~15個のアミノ酸残基が、DNA又はRNA塩基とスタッキングするアミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態28.CasXバリアントが、表3の配列からなる群から選択される配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を有する、実施形態1~5のいずれか1つに記載のCasXバリアント。
実施形態29.異なるCasX由来のNTSB及び/又はヘリックス1bドメインの置換を更に含む、実施形態1~5のいずれか1つに記載のCasXバリアント。
実施形態30.置換されたNTSBドメイン及び/又はヘリックス1bドメインが、配列番号1の参照CasXに由来する、実施形態29のCasXバリアント。
実施形態31.1つ以上の核局在化シグナル(NLS)を更に含む、実施形態1~30のいずれか1つに記載のCasXバリアント。
実施形態32.1つ以上のNLSが、PKKKRKV(配列番号352)、KRPAATKKAGQAKKKK(配列番号353)、PAAKRVKLD(配列番号354)、RQRRNELKRSP(配列番号355)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号356)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号357)、VSRKRPRP(配列番号358)、PPKKARED(配列番号35()、PQPKKKPL(配列番号360)、SALIKKKKKMAP(配列番号361)、DRLRR(配列番号362)、PKQKKRK(配列番号363)、RKLKKKIKKL(配列番号364)、REKKKFLKRR(配列番号365)、KRKGDEVDGVDEVAKKKSKK(配列番号366)、RKCLQAGMNLEARKTKK(配列番号367)、PRPRKIPR(配列番号368)、PPRKKRTVV(配列番号369)、NLSKKKKRKREK(配列番号370)、RRPSRPFRKP(配列番号371)、KRPRSPSS(配列番号372)、KRGINDRNFWRGENERKTR(配列番号373)、PRPPKMARYDN(配列番号374)、KRSFSKAF(配列番号375)、KLKIKRPVK(配列番号376)、PKKKRKVPPPPAAKRVKLD(配列番号377)、PKTRRRPRRSQRKRPPT(配列番号378)、SRRRKANPTKLSENAKKLAKEVEN(配列番号379)、KTRRRPRRSQRKRPPT(配列番号380)、RRKKRRPRRKKRR(配列番号381)、PKKKSRKPKKKSRK(配列番号382)、HKKKHPDASVNFSEFSK(配列番号383)、QRPGPYDRPQRPGPYDRP(配列番号384)、LSPSLSPLLSPSLSPL(配列番号385)、RGKGGKGLGKGGAKRHRK(配列番号386)、PKRGRGRPKRGRGR(配列番号387)、PKKKRKVPPPPKKKRKV(配列番号389)、PAKRARRGYKC(配列番号4599)、KLGPRKATGRW(配列番号4600)、PRRKREE(配列番号4601)、PYRGRKE(配列番号4602)、PLRKRPRR(配列番号4603)、PLRKRPRRGSPLRKRPRR(配列番号4604)、PAAKRVKLDGGKRTADGSEFESPKKKRKV(配列番号4605)、PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(配列番号4606)、PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(配列番号4607)、PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(配列番号4608)、KRKGSPERGERKRHW(配列番号4609)、KRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号4610)、及びPKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号4611)からなる配列の群から選択される、実施形態31に記載のCasXバリアント。
実施形態33.1つ以上のNLSが、CasXタンパク質のC末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態34.1つ以上のNLSが、CasXタンパク質のN末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態35.少なくとも2つのNLSを含み、少なくとも2つのNLSが、CasXタンパク質のN末端又はその近く及びC末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態36.CasXバリアントの改善された特徴のうちの1つ以上が、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質と比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態2~35のいずれか1つに記載のCasXバリアント。
実施形態37.CasXバリアントの改善された特徴のうちの1つ以上が、配列番号1、配列番号2、配列番号3、配列番号270、又は配列番号336のCasXタンパク質と比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、少なくとも約100倍、又はそれ以上改善されている、実施形態2~35のいずれか1つに記載のCasXバリアント。
実施形態38.改善された特徴が、編集効率を含み、CasXバリアントが、配列番号270又は配列番号336のCasXタンパク質と比較して、1.1~100倍の編集効率の改善を含む、実施形態2~37のいずれか1つに記載のCasXバリアント。
実施形態39.CasXバリアントを含むRNPが、PAM配列TTC、ATC、GTC、又はCTCのうちのいずれか1つが、細胞アッセイシステムにおいてgNAの標的化配列と同一性を有するプロトスペーサーの非標的鎖に対して1ヌクレオチド5’側に位置する場合、同等のアッセイシステムにおける参照CasXタンパクを含むRNPの編集効率及び/又は結合と比較して、標的DNAにおけるより高い編集効率及び/又は標的配列の結合を示す、実施形態1~38のいずれか1つに記載のCasXバリアント。
実施形態40.PAM配列が、TTCである、実施形態39に記載のCasXバリアント。
実施形態41.PAM配列が、ATCである、実施形態39に記載のCasXバリアント。
実施形態42.PAM配列が、CTCである、実施形態39に記載のCasXバリアント。
実施形態43.PAM配列が、GTCである、実施形態39に記載のCasXバリアント。
実施形態44.CasXバリアントを含むRNPの改善された編集効率及び/又は標的DNAへの結合が、参照CasXを含むRNPと比較して、少なくとも約1.1~約100倍改善されている、実施形態39のいずれか1つに記載のCasXバリアント。
実施形態45.CasXバリアントが、400~2000個のアミノ酸を含む、実施形態1~44のいずれか1つに記載のCasXバリアント。
実施形態46.CasXバリアントタンパク質が、ニッカーゼ活性を有するヌクレアーゼドメインを含む、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態47.CasXバリアントタンパク質が、二本鎖切断活性を有するヌクレアーゼドメインを含む、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態48.CasXタンパクが、触媒的に不活性なCasX(dCasX)タンパク質であり、dCasX及びgNAが、標的DNAに結合する能力を保持する、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態49.dCasXが、残基:
a.配列番号1のCasXタンパク質に対応するD672、及び/若しくはE769、及び/若しくはD935、又は
b.配列番号2のCasXタンパク質に対応するD659、及び/若しくはE756、及び/若しくはD922、に変異を含む、実施形態48に記載のCasXバリアント。
実施形態50.変異が、残基のアラニンへの置換である、実施形態49に記載のCasXバリアント。
実施形態51.第1のCasXタンパク質由来の第1のドメインと、第1のCasXタンパク質とは異なる第2のCasXタンパク質由来の第2のドメインと、を含む、実施形態1~50のいずれか1つに記載のCasXバリアント。
実施形態52.第1のドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態51に記載のCasXバリアント。
実施形態53.第2のドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態51に記載のCasXバリアント。
実施形態54.第1及び第2のドメインが、同じドメインではない、実施形態51~53のいずれか1つに記載のCasXバリアント。
実施形態55.CasXバリアントが、第1のCasXタンパク質由来の第1の部分と、第1のCasXタンパク質とは異なる第2のCasXタンパク質由来の第2の部分と、を含む少なくとも1つのキメラドメインを含む、実施形態1~50のいずれか1つに記載のCasXバリアント。
実施形態56.少なくとも1つのキメラドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態55に記載のCasXバリアント。
実施形態57.少なくとも1つのキメラドメインが、キメラRuvCドメインを含む、実施形態56に記載のCasXバリアント。
実施形態58.CasXに融合された異種タンパク質又はそのドメインを含む、実施形態1~57のいずれか1つに記載のCasXバリアント。
実施形態59.異種タンパク質又はそのドメインが、塩基エディターである、実施形態58に記載のCasXバリアント。
実施形態60.塩基エディターが、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼである、実施形態59に記載のCasXバリアント。
実施形態61.参照CasXタンパク質又はCasXバリアントに結合することができる参照ガイド核酸足場のバリアント(gNAバリアント)であって、
a.gNAバリアントが、参照ガイド核酸足場配列と比較して、少なくとも1つの改変を含み、
b.gNAバリアントが、参照ガイド核酸足場と比較して、1つ以上の改善された特徴を示す、gNAバリアント。
実施形態62.1つ以上の改善された特徴が、安定性の改善、溶解度の改善、gNAの転写の改善、ヌクレアーゼ活性に対する耐性の改善、gNAのフォールディング率の増加、フォールディング中の副生成物形成の減少、生産的なフォールディングの増加、CasXタンパク質に対する結合親和性の改善、CasXタンパク質と複合体化した場合の標的DNAに対する結合親和性の改善、CasXタンパク質と複合体化した場合の遺伝子編集の改善、CasXタンパク質と複合体化した場合の編集の特異性の改善、及びCasXタンパク質と複合体化した場合の標的DNAの編集におけるATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善からなる群から選択される、実施形態61に記載のgNAバリアント。
実施形態63.参照ガイド足場が、配列番号4~16の配列からなる群から選択される配列を含む、実施形態61又は62に記載のgNAバリアント。
実施形態64.少なくとも1つの改変が、
a.gNAバリアントの領域における少なくとも1つのヌクレオチド置換、
b.gNAバリアントの領域における少なくとも1つのヌクレオチド欠失、
c.gNAバリアントの領域における少なくとも1つのヌクレオチド挿入、
d.gNAバリアントの領域の全部若しくは一部の置換、
e.gNAバリアントの領域の全部若しくは一部の欠失、又は
f.(a)~(e)の任意の組み合わせ、を含む、実施形態61~63のいずれか1つに記載のgNAバリアント。
実施形態65.gNAバリアントの領域が、伸長ステムループ、足場ステムループ、三重鎖、及びシュードノットからなる群から選択される、実施形態64に記載のgNAバリアント。
実施形態66.足場ステムが、バブルを更に含む、実施形態65に記載のgNAバリアント。
実施形態67.足場が、三重鎖ループ領域を更に含む、実施形態65又は実施形態66に記載のgNAバリアント。
実施形態68.足場が、5’非構造化領域を更に含む、実施形態65~67のいずれか1つに記載のgNAバリアント。
実施形態69.少なくとも1つの改変が、
a.gNAバリアントの1つ以上の領域における1~15個の連続した若しくは連続していないヌクレオチドの置換、
b.gNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの欠失、
c.gNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの挿入、
d.足場ステムループ若しくは伸長ステムループの、近位の5’末端及び3’末端を有する異種RNA源由来のRNAステムループ配列による置換、又は
e.(a)~(d)の任意の組み合わせ、を含む、実施形態64~68のいずれか1つに記載のgNAバリアント。
実施形態70.少なくとも10、少なくとも100、少なくとも500、少なくとも1000、又は少なくとも10,000ヌクレオチドを含む伸長ステムループ領域を含む、実施形態61~69のいずれか1つに記載のgNAバリアント。
実施形態71.異種RNAステムループ配列が、gNAの安定性を増加させる、実施形態69に記載のgNAバリアント。
実施形態72.異種RNAステムループが、タンパク質、RNA構造、DNA配列、又は小分子に結合することができる、実施形態71に記載のgNAバリアント。
実施形態73.異種RNAステムループ配列が、MS2、Qβ、U1ヘアピンII、Uvsx、又はPP7ステムループから選択される、実施形態71又は実施形態72に記載のgNAバリアント。
実施形態74.gNAバリアントが、1つの領域に2つ以上の改変を含む、実施形態61~73のいずれか1つに記載のgNAバリアント。
実施形態75.gNAバリアントが、2つ以上の領域に改変を含む、実施形態61~74のいずれか1つに記載のgNAバリアント。
実施形態76.gNAバリアントが、標的化配列を更に含み、標的化配列が、標的DNA配列に相補的である、実施形態61~75のいずれか1つに記載のgNAバリアント。
実施形態77.標的化配列が、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、又は35ヌクレオチドを有する、実施形態76に記載のgNAバリアント。
実施形態78.標的化配列が、20ヌクレオチドを有する、実施形態76又は実施形態77に記載のgNAバリアント。
実施形態79.gNAが、標的化配列に連結された足場配列を含むシングルガイドgNAである、実施形態76~78のいずれか1つに記載のgNAバリアント。
実施形態80.CasXバリアントの改善された特徴のうちの1つ以上が、配列番号4又は配列番号5の参照gNAと比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態61~79のいずれか1つに記載のgNAバリアント。
実施形態81.gNAバリアントの改善された特徴のうちの1つ以上が、配列番号4の参照gNA、配列番号5の参照gNA、配列番号2238のバリアント足場、又は配列番号2239のバリアント足場と比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、若しくは少なくとも約100倍、又はそれ以上改善されている、実施形態61~79のいずれか1つに記載のgNAバリアント。
実施形態82.伸長ステム領域を除いて、配列番号4又は配列番号5と少なくとも60%の配列同一性を有する足場領域を含む、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態83.配列番号14と少なくとも60%の配列同一性を有する足場ステムループを含む、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態84.gNAバリアント配列の足場が、配列番号4、配列番号5、配列番号2238、又は配列番号2239の配列と少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、又は少なくとも70%、少なくとも80%、少なくとも85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態85.gNAバリアント配列の足場が、配列番号2101~2280若しくは4433~4446の配列の群から選択される配列、又はそれと少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する配列を含む、実施形態61~81のいずれか1つに記載のgNAバリアント。
実施形態86.gNAバリアント配列の足場が、配列番号2101~2280又は4433~4446の配列の群から選択される配列からなる、実施形態85に記載のgNAバリアント。
実施形態87.1つ以上のリボザイムを更に含む、実施形態61~86のいずれか1つに記載のgNAバリアント。
実施形態88.1つ以上のリボザイムが、独立して、gNAバリアントの末端に融合されている、実施形態87に記載のgNAバリアント。
実施形態89.1つ以上のリボザイムのうちの少なくとも1つが、デルタ型肝炎ウイルス(HDV)リボザイム、ハンマーヘッドリボザイム、ピストルリボザイム、ハチェットリボザイム、又はタバコ輪斑ウイルス(TRSV)リボザイムである、実施形態87又は実施形態88に記載のgNAバリアント。
実施形態90.タンパク質結合モチーフを更に含む、実施形態61~89のいずれか1つに記載のgNAバリアント。
実施形態91.熱安定性ステムループを更に含む、実施形態61~90のいずれか1つに記載のgNAバリアント。
実施形態92.gNAが、化学的に改変されている、実施形態61~91のいずれか1つに記載のgNAバリアント。
実施形態93.gNAが、第1のgNA由来の第1の領域と、第1のgNAとは異なる第2のgNA由来の第2の領域と、を含む、実施形態61~92のいずれか1つに記載のgNAバリアント。
実施形態94.第1の領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態93に記載のgNAバリアント。
実施形態95.第2の領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態93又は実施形態94に記載のgNAバリアント。
実施形態96.第1の領域と第2の領域とが、同じ領域ではない、実施形態93~95のいずれか1つに記載のgNAバリアント。
実施形態97.第1のgNAが、配列番号4の配列を含み、第2のgNAが、配列番号5の配列を含む、実施形態93~95のいずれか1つに記載のgNAバリアント。
実施形態98.第1のgNA由来の第1の部分と、第2のgNA由来の第2の部分と、を含む少なくとも1つのキメラ領域を含む、実施形態61~97のいずれか1つに記載のgNAバリアント。
実施形態99.少なくとも1つのキメラ領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態98に記載のgNAバリアント。
実施形態100.配列番号2101~2280又は4433~4446のうちのいずれか1つの配列を含む、実施形態61に記載のgNAバリアント。
実施形態101.CasXタンパク質及び第1のgNAを含む、遺伝子編集ペア。
実施形態102.CasX及びgNAが、リボ核タンパク質複合体(RNP)中で一緒に会合することができる、実施形態101に記載の遺伝子編集ペア。
実施形態103.CasX及びgNAが、リボ核タンパク質複合体(RNP)において一緒に会合している、実施形態101に記載の遺伝子編集ペア。
実施形態104.第1のgNAが、実施形態76~100のいずれか1つに記載のgNAバリアントと、標的DNAに相補的である標的化配列と、を含む、実施形態101~103のいずれか1つに記載の遺伝子編集ペア。
実施形態105.CasXが、実施形態1~60のいずれか1つに記載のCasXバリアントを含む、実施形態101~104のいずれか1つに記載の遺伝子編集ペア。
実施形態106.
a.実施形態76~100のいずれか1つに記載のgNAバリアントと、
b.実施形態1~60のいずれか1つに記載のCasXバリアントと、を含む、実施形態101~105のいずれか1つに記載の遺伝子編集ペア。
実施形態107.CasXバリアント及びgNAバリアントの遺伝子編集ペアが、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質、及び配列番号4又は5の参照ガイド核酸を含む遺伝子編集ペアと比較して、1つ以上の改善された特徴を有する、実施形態106に記載の遺伝子編集ペア。
実施形態108.1つ以上の改善された特徴が、CasX: gNA(RNP)複合体安定性の改善、CasXとgNAとの間の結合親和性の改善、RNP複合体形成の動態の改善、より高い割合の切断コンピテントRNP、標的DNAに対するRNP結合親和性の改善、増加した範囲のPAM配列を利用する能力、標的DNAの巻き戻しの改善、編集活性の増加、編集効率の改善、編集特異性の改善、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、オフターゲット切断の減少、DNAの非標的鎖の結合の改善、又はヌクレアーゼ活性に対する耐性の改善、を含む、実施形態107に記載の遺伝子編集ペア。
実施形態109.改善された特徴のうちの少なくとも1つ以上が、参照CasXタンパク質及び参照ガイド核酸の遺伝子編集ペアと比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態107又は実施形態108に記載の遺伝子編集ペア。
実施形態110.CasXバリアントの改善された特徴のうちの1つ以上が、参照CasXタンパク質及び参照ガイド核酸の遺伝子編集ペアと比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、若しくは少なくとも約100倍、又はそれ以上改善されている、実施形態107又は108に記載の遺伝子編集ペア。
実施形態111.改善された特徴が、配列番号2及び配列番号5の参照編集ペアと比較して、4~9倍の編集活性の増加を含む、実施形態107又は実施形態108に記載の遺伝子編集ペア。
実施形態112.実施形態101~111のいずれか1つに記載の遺伝子編集ペアを含む組成物であって、
a.実施形態1~60のいずれか1つに記載のCasXバリアントを含む第2の遺伝子編集ペアと、
b.実施形態61~100のいずれか1つに記載の第2のgNAバリアントと、を含み、第2のgNAバリアントが、第1のgNAの標的化配列と比較して、標的DNAの異なる部分又は重複する部分に相補的な標的化配列を有する、組成物。
実施形態113.CasXバリアント及びgNAバリアントのRNPが、参照CasXタンパク質及び参照ガイド核酸のRNPと比較して、より高い割合の切断コンピテントRNPを有する、実施形態101~112のいずれか1つに記載の遺伝子編集ペア。
実施形態114.RNPが、標的DNAに結合して切断することができる、実施形態101~113のいずれか1つに記載の遺伝子編集ペア。
実施形態115.RNPが、標的DNAに結合することができるが、標的DNAを切断することができない、実施形態101~112のいずれか1つに記載の遺伝子編集ペア。
実施形態116.RNPが、標的DNAに結合し、標的DNAにおける1つ以上の一本鎖ニックを生成することができる、実施形態101~112のいずれか1つに記載の遺伝子編集ペア。
実施形態117.配列番号4416~4432又は4597~4598のうちのいずれか1つのアミノ酸配列を含む、CasXバリアント。
実施形態118.配列番号4433~4446のうちのいずれか1つのアミノ酸配列を含む、gNAバリアント。
セットIII
実施形態1.参照CasXタンパク質のバリアント(CasXバリアント)であって、
a.CasXバリアントが、参照CasXタンパク質において少なくとも1つの改変を含み、
b.CasXバリアントが、参照CasXタンパク質と比較して、少なくとも1つの改善された特徴を示し、
任意選択的に、バリアントが、配列番号89~101、247~337、411~592、及び760~982からなる群から選択される配列を含む、CasXバリアント。
実施形態2.CasXバリアントの改善された特徴が、CasXバリアントのフォールディングの改善、ガイド核酸(gNA)に対する結合親和性の改善、標的核酸に対する結合親和性の改善、標的核酸の編集において、ATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善、標的核酸の巻き戻しの改善、編集活性の増加、編集効率の改善、編集特異性の改善、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、オフターゲット切断の減少、非標的核酸鎖の結合の改善、タンパク質安定性の改善、タンパク質溶解度の改善、タンパク質:gNA複合体(RNP)の安定性の改善、タンパク質:gNA複合体の溶解度の改善、タンパク質収量の改善、タンパク質発現の改善、融合体特徴の改善、又はそれらの組み合わせからなる群から選択される、実施形態1に記載のCasXバリアント。
実施形態3.少なくとも1つの改変が、
a.CasXバリアントのドメインにおける少なくとも1つのアミノ酸置換、
b.CasXバリアントのドメインにおける少なくとも1つのアミノ酸欠失、
c.CasXバリアントのドメインにおける少なくとも1つのアミノ酸挿入、
d.異なるCasXからのドメインの全部若しくは一部の置換、
e.CasXバリアントのドメインの全部若しくは一部の欠失、又は
f.(a)~(e)の任意の組み合わせ、を含む、実施形態1又は2に記載のCasXバリアント。
実施形態4.参照CasXタンパク質が、配列番号1、配列番号2、又は配列番号3の配列を含む、実施形態1~3のいずれか1つに記載のCasXバリアント。
実施形態5.少なくとも1つの改変が、
a.非標的鎖結合(NTSB)ドメイン、
b.標的鎖装填(TSL)ドメイン、
c.ヘリックスIドメイン、
d.ヘリックスIIドメイン、
e.オリゴヌクレオチド結合ドメイン(OBD)、又は
f.RuvC DNA切断ドメイン、から選択されるドメインにある、実施形態1~4のいずれか1つに記載のCasXバリアント。
実施形態6.NTSBドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態7.TSLドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態8.ヘリックスIドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態9.ヘリックスIIドメインに少なくとも1つの改変を含む、実施形態5~8のいずれか1つに記載のCasXバリアント。
実施形態10.OBDドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態11.RuvC DNA切断ドメインに少なくとも1つの改変を含む、実施形態5に記載のCasXバリアント。
実施形態12.改変が、標的核酸を編集する能力の増加をもたらす、実施形態5~11のいずれか1つに記載のCasXバリアント。
実施形態13.CasXバリアントが、ガイド核酸(gNA)とリボ核タンパク質複合体(RNP)を形成することができる、実施形態1~12のいずれか1つに記載のCasXバリアント。
実施形態14.少なくとも1つの改変が、
a.CasXバリアントにおける1~100個の連続した又は連続していないアミノ酸の置換、
b.CasXバリアントにおける1~100個の連続した又は連続していないアミノ酸の欠失、
c.CasXにおける1~100個の連続した又は連続していないアミノ酸の挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態1~13のいずれか1つに記載のCasXバリアント。
実施形態15.少なくとも1つの改変が、
a.CasXバリアントにおける5~10個の連続した又は連続していないアミノ酸の置換、
b.CasXバリアントにおける1~5個の連続した又は連続していないアミノ酸の欠失、
c.CasXにおける1~5個の連続した又は連続していないアミノ酸の挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態14に記載のCasXバリアント。
実施形態16.CasXバリアントが、1つのドメインに2つ以上の改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態17.CasXバリアントが、2つ以上のドメインに改変を含む、実施形態1~16のいずれか1つに記載のCasXバリアント。
実施形態18.gNA:標的DNAのCasXバリアントとの複合体化が起こるチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態19.gNAと結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態20.非標的鎖DNAと結合するチャネルを形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態21.標的核酸のプロトスペーサー隣接モチーフ(PAM)と結合する界面を形成するCasXバリアントの連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態22.CasXバリアントの連続していない表面露出アミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態23.CasXバリアントのドメインにおける疎水性パッキングを介してコアを形成する連続していないアミノ酸残基の領域の少なくとも1つの改変を含む、実施形態1~15のいずれか1つに記載のCasXバリアント。
実施形態24.改変が、領域の1つ以上のアミノ酸の1つ以上の欠失、挿入、又は置換のうちの1つ以上である、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態25.CasXバリアントの領域の2~15個のアミノ酸残基が、帯電アミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態26.CasXバリアントの領域の2~15個のアミノ酸残基が、極性アミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態27.CasXバリアントの領域の2~15個のアミノ酸残基が、DNA又はRNA塩基とスタッキングするアミノ酸で置換されている、実施形態18~23のいずれか1つに記載のCasXバリアント。
実施形態28.異なるCasX由来のNTSB及び/又はヘリックス1bドメインの置換を更に含む、実施形態1~5のいずれか1つに記載のCasXバリアント。
実施形態29.置換されたNTSBドメイン及び/又はヘリックス1bドメインが、配列番号1の参照CasXに由来する、実施形態28のCasXバリアント。
実施形態30.CasXバリアントが、配列番号89~101、247~337、411~592、及び760~982からなる群から選択される配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を有する、実施形態1~29のいずれか1つに記載のCasXバリアント。
実施形態31.1つ以上の核局在化シグナル(NLS)を更に含む、実施形態1~30のいずれか1つに記載のCasXバリアント。
実施形態32.1つ以上のNLSが、PKKKRKV(配列番号352)、KRPAATKKAGQAKKKK(配列番号353)、PAAKRVKLD(配列番号354)、RQRRNELKRSP(配列番号355)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号356)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号357)、VSRKRPRP(配列番号358)、PPKKARED(配列番号(359)、PQPKKKPL(配列番号360)、SALIKKKKKMAP(配列番号361)、DRLRR(配列番号362)、PKQKKRK(配列番号363)、RKLKKKIKKL(配列番号364)、REKKKFLKRR(配列番号365)、KRKGDEVDGVDEVAKKKSKK(配列番号366)、RKCLQAGMNLEARKTKK(配列番号367)、PRPRKIPR(配列番号368)、PPRKKRTVV(配列番号369)、NLSKKKKRKREK(配列番号370)、RRPSRPFRKP(配列番号371)、KRPRSPSS(配列番号372)、KRGINDRNFWRGENERKTR(配列番号373)、PRPPKMARYDN(配列番号374)、KRSFSKAF(配列番号375)、KLKIKRPVK(配列番号376)、PKKKRKVPPPPAAKRVKLD(配列番号377)、PKTRRRPRRSQRKRPPT(配列番号378)、SRRRKANPTKLSENAKKLAKEVEN(配列番号379)、KTRRRPRRSQRKRPPT(配列番号380)、RRKKRRPRRKKRR(配列番号381)、PKKKSRKPKKKSRK(配列番号382)、HKKKHPDASVNFSEFSK(配列番号383)、QRPGPYDRPQRPGPYDRP(配列番号384)、LSPSLSPLLSPSLSPL(配列番号385)、RGKGGKGLGKGGAKRHRK(配列番号386)、PKRGRGRPKRGRGR(配列番号387)、PKKKRKVPPPPKKKRKV(配列番号389)、PAKRARRGYKC(配列番号63)、KLGPRKATGRW(配列番号64)、PRRKREE(配列番号65)、PYRGRKE(配列番号66)、PLRKRPRR(配列番号67)、PLRKRPRRGSPLRKRPRR(配列番号68)、PAAKRVKLDGGKRTADGSEFESPKKKRKV(配列番号69)、PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(配列番号70)、PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(配列番号71)、PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(配列番号72)、KRKGSPERGERKRHW(配列番号73)、KRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号74)、及びPKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号75)からなる配列の群から選択され、任意選択的に、1つ以上のNLSが、リンカーペプチドを用いて、CasXバリアント又は隣接するNLSに連結され、リンカーペプチドが、(G)n(配列番号1023)、(GS)n(配列番号1024)、(GSGGS)n(配列番号399)、(GGSGGS)n(配列番号400)、(GGGS)n(配列番号401)、GGSG(配列番号402)、GGSGG(配列番号403)、GSGSG(配列番号404)、GSGGG(配列番号405)、GGGSG(配列番号406)、GSSSG(配列番号407)、GPGP(配列番号408)、GGP、PPP、PPAPPA(配列番号409)、PPPG(配列番号24)、PPPGPPP(配列番号410)、PPP(GGGS)n(配列番号25)、(GGGS)nPPP(配列番号26)、AEAAAKEAAAKEAAAKA(配列番号1025)、及びTPPKTKRKVEFE(配列番号27)(式中、nは1~5である)からなる群から選択される、実施形態31に記載のCasXバリアント。
実施形態33.1つ以上のNLSが、CasXタンパク質のC末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態34.1つ以上のNLSが、CasXタンパク質のN末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態35.少なくとも2つのNLSを含み、少なくとも2つのNLSが、CasXタンパク質のN末端又はその近く及びC末端又はその近くに位置する、実施形態31又は実施形態32に記載のCasXバリアント。
実施形態36.CasXバリアントの改善された特徴のうちの1つ以上が、同等の条件下でインビトロで比較した場合、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質と比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態2~35のいずれか1つに記載のCasXバリアント。
実施形態37.CasXバリアントの改善された特徴のうちの1つ以上が、同等の条件下でインビトロアッセイにおいて比較した場合、配列番号1、配列番号2、配列番号3、配列番号270、又は配列番号336のCasXタンパク質と比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、少なくとも約100倍、又はそれ以上改善されている、実施形態2~35のいずれか1つに記載のCasXバリアント。
実施形態38.改善された特徴が、編集効率を含み、CasXバリアントが、同等の条件下でインビトロアッセイにおいて比較した場合、配列番号270又は配列番号336のCasXタンパク質と比較して、標的核酸の編集効率における1.1~100倍の改善を含む、実施形態2~37のいずれか1つに記載のCasXバリアント。
実施形態39.CasXバリアントを含むRNPが、PAM配列TTC、ATC、GTC、又はCTCのうちのいずれか1つが、インビトロ細胞アッセイシステムにおいてgNAの標的化配列と同一性を有するプロトスペーサーの非標的鎖に対して1ヌクレオチド5’側に位置する場合、同等のアッセイシステムにおける参照CasXタンパクを含むRNPの編集効率及び/又は結合と比較して、標的核酸における配列のより高い編集効率及び/又は結合を示す、実施形態1~38のいずれか1つに記載のCasXバリアント。
実施形態40.PAM配列が、TTCである、実施形態39に記載のCasXバリアント。
実施形態41.PAM配列が、ATCである、実施形態39に記載のCasXバリアント。
実施形態42.PAM配列が、CTCである、実施形態39に記載のCasXバリアント。
実施形態43.PAM配列が、GTCである、実施形態39に記載のCasXバリアント。
実施形態44.CasXバリアントを含むRNPによる改善された編集効率及び/又は標的核酸への結合が、参照CasXを含むRNPと比較して、少なくとも約1.1~約100倍改善されている、実施形態39~43のいずれか1つに記載のCasXバリアント。
実施形態45.CasXバリアントが、400~2000個のアミノ酸を含む、実施形態1~44のいずれか1つに記載のCasXバリアント。
実施形態46.CasXバリアントタンパク質が、ニッカーゼ活性を有するヌクレアーゼドメインを含む、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態47.CasXバリアントタンパク質が、二本鎖切断活性を有するヌクレアーゼドメインを含む、実施形態1~45のいずれか1つに記載のCasXバリアント。
実施形態48.CasXタンパクが、触媒的に不活性なCasX(dCasX)タンパクであり、dCasX及びgNAが、標的核酸に結合する能力を保持しており、任意選択的に、dCasXタンパクが、配列番号44~62の配列を含む、実施形態1~37のいずれか1つに記載のCasXバリアント。
実施形態49.dCasXが、残基:
a.配列番号1のCasXタンパク質に対応するD672、及び/若しくはE769、及び/若しくはD935、又は
b.配列番号2のCasXタンパク質に対応するD659、及び/若しくはE756、及び/若しくはD922、に変異を含む、実施形態48に記載のCasXバリアント。
実施形態50.変異が、残基のアラニンへの置換である、実施形態49に記載のCasXバリアント。
実施形態51.第1のCasXタンパク質由来の第1のドメインと、第1のCasXタンパク質とは異なる第2のCasXタンパク質由来の第2のドメインと、を含む、実施形態1~50のいずれか1つに記載のCasXバリアント。
実施形態52.第1のドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態51に記載のCasXバリアント。
実施形態53.第2のドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態51に記載のCasXバリアント。
実施形態54.第1及び第2のドメインが、同じドメインではない、実施形態51~53のいずれか1つに記載のCasXバリアント。
実施形態55.CasXバリアントが、第1のCasXタンパク質由来の第1の部分と、第1のCasXタンパク質とは異なる第2のCasXタンパク質由来の第2の部分と、を含む少なくとも1つのキメラドメインを含む、実施形態1~50のいずれか1つに記載のCasXバリアント。
実施形態56.少なくとも1つのキメラドメインが、NTSB、TSL、ヘリックスI、ヘリックスII、OBD、及びRuvCドメインからなる群から選択される、実施形態55に記載のCasXバリアント。
実施形態57.少なくとも1つのキメラドメインが、キメラRuvCドメインを含む、実施形態56に記載のCasXバリアント。
実施形態58.CasXに融合された異種タンパク質又はそのドメインを含む、実施形態1~57のいずれか1つに記載のCasXバリアント。
実施形態59.異種タンパク質又はそのドメインが、塩基エディターである、実施形態58に記載のCasXバリアント。
実施形態60.塩基エディターが、アデノシンデアミナーゼ、シトシンデアミナーゼ、又はグアニンオキシダーゼである、実施形態59に記載のCasXバリアント。
実施形態61.参照CasXタンパク質又はCasXバリアントに結合することができる参照ガイド核酸足場のバリアント(gNAバリアント)であって、
a.gNAバリアントが、参照ガイド核酸足場配列と比較して、少なくとも1つの改変を含み、
b.gNAバリアントが、参照ガイド核酸足場と比較して、1つ以上の改善された特徴を示し、
任意選択的に、バリアントが、配列番号2101~2332からなる群から選択される配列を含む、gNAバリアント。
実施形態62.1つ以上の改善された特徴が、安定性の改善、溶解度の改善、gNAの転写の改善、ヌクレアーゼ活性に対する耐性の改善、gNAのフォールディング率の増加、フォールディング中の副生成物形成の減少、生産的なフォールディングの増加、CasXタンパク質に対する結合親和性の改善、CasXタンパク質と複合体化した場合の標的核酸に対する結合親和性の改善、CasXタンパク質と複合体化した場合の遺伝子編集の改善、CasXタンパク質と複合体化した場合の編集の特異性の改善、及びCasXタンパク質と複合体化した場合の切断コンピテントRNPを形成する能力の改善からなる群から選択される配列を含む、実施形態61に記載のgNAバリアント。
実施形態63.参照ガイド足場が、配列番号4~16の配列からなる群から選択される配列を含む、実施形態61又は62に記載のgNAバリアント。
実施形態64.少なくとも1つの改変が、
a.gNAバリアントの領域における少なくとも1つのヌクレオチド置換、
b.gNAバリアントの領域における少なくとも1つのヌクレオチド欠失、
c.gNAバリアントの領域における少なくとも1つのヌクレオチド挿入、
d.gNAバリアントの領域の全部若しくは一部の置換、
e.gNAバリアントの領域の全部若しくは一部の欠失、又は
f.(a)~(e)の任意の組み合わせ、を含む、実施形態61~63のいずれか1つに記載のgNAバリアント。
実施形態65.gNAバリアントの領域が、伸長ステムループ、足場ステムループ、三重鎖、及びシュードノットからなる群から選択される、実施形態64に記載のgNAバリアント。
実施形態66.足場ステムが、バブルを更に含む、実施形態65に記載のgNAバリアント。
実施形態67.足場が、三重鎖ループ領域を更に含む、実施形態65又は実施形態66に記載のgNAバリアント。
実施形態68.足場が、5’非構造化領域を更に含む、実施形態65~67のいずれか1つに記載のgNAバリアント。
実施形態69.少なくとも1つの改変が、
a.gNAバリアントの1つ以上の領域における1~15個の連続した若しくは連続していないヌクレオチドの置換、
b.gNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの欠失、
c.gNAバリアントの1つ以上の領域における1~10個の連続した若しくは連続していないヌクレオチドの挿入、
d.足場ステムループ若しくは伸長ステムループの、近位の5’末端及び3’末端を有する異種RNA源由来のRNAステムループ配列による置換若しくは挿入、又は
e.(a)~(d)の任意の組み合わせ、を含む、実施形態64~68のいずれか1つに記載のgNAバリアント。
実施形態70.gNAバリアントが、1つの領域に2つ以上の改変を含む、実施形態61~69のいずれか1つに記載のgNAバリアント。
実施形態71.gNAバリアントが、2つ以上の領域に改変を含む、実施形態61~69のいずれか1つに記載のgNAバリアント。
実施形態72.少なくとも10、少なくとも100、少なくとも500、少なくとも1000、又は少なくとも10,000ヌクレオチドを含む伸長ステムループ領域を含む、実施形態61~71のいずれか1つに記載のgNAバリアント。
実施形態73.異種RNAステムループ配列が、gNAの安定性を増加させる、実施形態72に記載のgNAバリアント。
実施形態74.異種RNAステムループが、タンパク質、RNA構造、DNA配列、又は小分子に結合することができる、実施形態72又は実施形態73に記載のgNAバリアント。
実施形態75.伸長ステムループに挿入された異種RNAステムループ配列が、MS2ヘアピン、Qβヘアピン、U1ヘアピンII、Uvsxヘアピン、又はPP7ヘアピンから選択され、異種ステムループが、それぞれ、MS2コートタンパク質、Qβコートタンパク質、U1Aシグナル認識粒子、T4ファージのUvsxタンパク質、又はPP7コートタンパク質に結合することができる、実施形態74に記載のgNAバリアント。
実施形態76.改変が、伸長ステムループにおける、
a.Rev応答エレメント(RRE)のステムIIB、
b.RREのステムII-V、
c.RREのステムII、
d.ステムIIBのRev結合エレメント(RBE)、及び
e.全長RRE、からなる群から選択される1つ以上の成分の挿入を含み、
1つ以上の成分が、Revに結合することができる、実施形態61~75のいずれか1つに記載のgNAバリアント。
実施形態77.gNAバリアントが、標的化配列を更に含み、標的化配列が、標的核酸配列に相補的である、実施形態61~76のいずれか1つに記載のgNAバリアント。
実施形態78.標的化配列が、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、又は35ヌクレオチドを有する、実施形態77に記載のgNAバリアント。
実施形態79.標的化配列が、18、19、又は20ヌクレオチドを有する、実施形態78に記載のgNAバリアント。
実施形態80.18ヌクレオチドの標的化配列を有するgNAバリアントを含むRNPが、同等の条件下でインビトロ細胞ベースアッセイにおいてアッセイした場合、20ヌクレオチドの標的化配列を有するgNAバリアントを含むRNPと比較して、少なくとも2倍、少なくとも3倍、又は少なくとも4倍大きい編集効率を示す、実施形態79に記載のgNAバリアント。
実施形態81.19ヌクレオチドの標的化配列を有するgNAバリアントを含むRNPが、同等の条件下でインビトロ細胞ベースアッセイにおいてアッセイした場合、20ヌクレオチドの標的化配列を有するgNAバリアントを含むRNPと比較して、少なくとも2倍、少なくとも3倍、又は少なくとも4倍大きい編集効率を示す、実施形態79に記載のgNAバリアント。
実施形態82.標的化配列が、20ヌクレオチドを有する、実施形態77~79のいずれか1つに記載のgNAバリアント。
実施形態83.gNAが、標的化配列に連結された足場配列を含むシングルガイドgNAである、実施形態77~80のいずれか1つに記載のgNAバリアント。
実施形態84.gNAバリアントの改善された特徴のうちの1つ以上が、配列番号4又は配列番号5の参照gNAと比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態61~83のいずれか1つに記載のgNAバリアント。
実施形態85.gNAバリアントの改善された特徴のうちの1つ以上が、配列番号4の参照gNA、配列番号5の参照gNA、配列番号2238のバリアント足場、配列番号2239のバリアント足場、バリアント足場174(配列番号2238)、又はバリアント足場175(配列番号2239)と比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、若しくは少なくとも約100倍、又はそれ以上改善されている、実施形態61~83のいずれか1つに記載のgNAバリアント。
実施形態86.伸長ステム領域を除いて、配列番号4又は配列番号5と少なくとも60%の配列同一性を有する足場領域を含む、実施形態61~85のいずれか1つに記載のgNAバリアント。
実施形態87.配列番号14と少なくとも60%の配列同一性を有する足場ステムループを含む、実施形態61~85のいずれか1つに記載のgNAバリアント。
実施形態88.gNAバリアント配列の足場が、配列番号4、配列番号5、配列番号2238、又は配列番号2239の配列と少なくとも20%、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、又は少なくとも70%、少なくとも80%、少なくとも85%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、又は少なくとも約99%の同一性を有する、実施形態61~85のいずれか1つに記載のgNAバリアント。
実施形態89.gNAバリアント配列の足場が、配列番号2101~2332の配列の群から選択される配列、又はそれと少なくとも約80%、少なくとも約90%、少なくとも約95%、少なくとも約96%、少なくとも約97%、少なくとも約98%、少なくとも約99%の同一性を有する配列を含む、実施形態61~85のいずれか1つに記載のgNAバリアント。
実施形態90.gNAバリアント配列の足場が、配列番号2101~2332からなる群から選択される配列からなる、実施形態89に記載のgNAバリアント。
実施形態91.1つ以上のリボザイムを更に含む、実施形態61~90のいずれか1つに記載のgNAバリアント。
実施形態92.1つ以上のリボザイムが、独立して、gNAバリアントの末端に融合されている、実施形態91に記載のgNAバリアント。
実施形態93.1つ以上のリボザイムのうちの少なくとも1つが、デルタ型肝炎ウイルス(HDV)リボザイム、ハンマーヘッドリボザイム、ピストルリボザイム、ハチェットリボザイム、又はタバコ輪斑ウイルス(TRSV)リボザイムである、実施形態91又は実施形態92に記載のgNAバリアント。
実施形態94.熱安定性ステムループを更に含む、実施形態61~93のいずれか1つに記載のgNAバリアント。
実施形態95.gNAが、化学的に改変されている、実施形態61~94のいずれか1つに記載のgNAバリアント。
実施形態96.gNAが、第1のgNA由来の第1の領域と、第1のgNAとは異なる第2のgNA由来の第2の領域と、を含む、実施形態61~95のいずれか1つに記載のgNAバリアント。
実施形態97.第1の領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態96に記載のgNAバリアント。
実施形態98.第2の領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態96又は実施形態97に記載のgNAバリアント。
実施形態99.第1の領域と第2の領域とが、同じ領域ではない、実施形態96~98のいずれか1つに記載のgNAバリアント。
実施形態100.第1のgNAが、配列番号4の配列を含み、第2のgNAが、配列番号5の配列を含む、実施形態96~98のいずれか1つに記載のgNAバリアント。
実施形態101.第1のgNA由来の第1の部分と、第2のgNA由来の第2の部分と、を含む少なくとも1つのキメラ領域を含む、実施形態61~100のいずれか1つに記載のgNAバリアント。
実施形態102.少なくとも1つのキメラ領域が、三重鎖領域、足場ステムループ、及び伸長ステムループからなる群から選択される、実施形態101に記載のgNAバリアント。
実施形態103.配列番号2101~2332のうちのいずれか1つのいずれか1つの配列を含む、実施形態61に記載のgNAバリアント。
実施形態104.CasXバリアントタンパク質及び第1のgNAバリアントを含む、遺伝子編集ペア。
実施形態105.CasXバリアントタンパク質及びgNAバリアントが、リボ核タンパク質複合体(RNP)中で一緒に会合することができる、実施形態104に記載の遺伝子編集ペア。
実施形態106.CasXバリアント及びgNAバリアントが、リボ核タンパク質複合体(RNP)において一緒に会合している、実施形態104に記載の遺伝子編集ペア。
実施形態107.第1のgNAが、実施形態77~103のいずれか1つに記載のgNAバリアントと、標的核酸に相補的である標的化配列と、を含む、実施形態104~107のいずれか1つに記載の遺伝子編集ペア。
実施形態108.CasXバリアントが、実施形態1~60のいずれか1つに記載のCasXバリアントを含む、実施形態104~107のいずれか1つに記載の遺伝子編集ペア。
実施形態109.
a.実施形態77~103のいずれか1つに記載のgNAバリアントと、
b.実施形態1~60のいずれか1つに記載のCasXバリアントと、を含む、実施形態104~108のいずれか1つに記載の遺伝子編集ペア。
実施形態110.CasXバリアント及びgNAバリアントの遺伝子編集ペアが、配列番号1、配列番号2、又は配列番号3の参照CasXタンパク質、及び配列番号4又は5の参照ガイド核酸を含む遺伝子編集ペアと比較して、1つ以上の改善された特徴を有する、実施形態109に記載の遺伝子編集ペア。
実施形態111.1つ以上の改善された特徴が、CasX: gNA(RNP)複合体安定性の改善、CasXとgNAとの間の結合親和性の改善、RNP複合体形成の動態の改善、より高い割合の切断コンピテントRNP、標的核酸に対するRNP結合親和性の改善、増加した範囲のPAM配列を利用する能力、標的核酸の巻き戻しの改善、編集活性の増加、編集効率の改善、編集特異性の改善、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、オフターゲット切断の減少、DNAの非標的鎖の結合の改善、又はヌクレアーゼ活性に対する耐性の改善、を含む、実施形態110に記載の遺伝子編集ペア。
実施形態112.改善された特徴が、配列番号1、配列番号2、若しくは配列番号3の参照CasXタンパク質、又はCasXバリアント119若しくは491、及び配列番号4若しくは5の参照ガイド核酸、又は174のgNAバリアント(配列番号2238)を含む遺伝子編集ペアと比較して、ATC、GTC、又はCTCの非標準PAM配列を利用する標的核酸の編集効率の増強である、実施形態110又は実施形態111に記載の遺伝子編集ペア。
実施形態113.改善された特徴のうちの少なくとも1つ以上が、参照CasXタンパク質及び参照ガイド核酸の遺伝子編集ペアと比較して、少なくとも約1.1~約100倍又はそれ以上改善されている、実施形態110に記載の遺伝子編集ペア。
実施形態114.CasXバリアントの改善された特徴のうちの1つ以上が、参照CasXタンパク質及び参照ガイド核酸又は174のgNAバリアント(配列番号2238)の遺伝子編集ペアと比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約4倍、少なくとも約6倍、少なくとも約6倍、少なくとも約10倍、若しくは少なくとも約100倍、又はそれ以上改善されている、実施形態110に記載の遺伝子編集ペア。
実施形態115.改善された特徴が、同等の条件下でインビトロアッセイにおいてアッセイした場合、配列番号2及び配列番号5又は174のgNAバリアント(配列番号2238)の参照編集ペアと比較して、編集効率の4~9倍の増加を含む、実施形態110に記載の遺伝子編集ペア。
実施形態116.CasXバリアント及びgNAバリアントのRNPが、参照CasXタンパク質及び参照ガイド核酸のRNPと比較して、より高い割合の切断コンピテントRNPを有する、実施形態104~115のいずれか1つに記載の遺伝子編集ペア。
実施形態117.CasXバリアント及びgNAバリアントのRNPが、参照CasXタンパク質及び参照ガイド核酸のRNPと比較して、少なくとも2倍、少なくとも3倍、少なくとも4倍、又は少なくとも5倍高い割合の切断コンピテントRNPを有する、実施形態116に記載の遺伝子編集ペア。
実施形態118.RNPが、標的核酸に結合して切断することができる、実施形態104~117のいずれか1つに記載の遺伝子編集ペア。
実施形態119.CasXバリアント及びgNAバリアントのRNPが、同等の条件下でオンターゲット/オフターゲット編集についてのインビトロアッセイにおいてアッセイした場合、配列番号2及び配列番号5又は174のgNAバリアント(配列番号2238)の参照編集ペアと比較して、少なくとも10%、又は少なくとも15%、又は少なくとも20%以内の特異度を示す、実施形態104~118のいずれか1つに記載の遺伝子編集ペア。
実施形態120.RNPが、標的核酸に結合することができるが、標的核酸を切断することができない、実施形態104~111のいずれか1つに記載の遺伝子編集ペア。
実施形態121.RNPが、標的核酸に結合し、標的核酸において1つ以上の一本鎖ニックを生成することができる、実施形態104~117のいずれか1つに記載の遺伝子編集ペア。
実施形態122.実施形態104~119のいずれか1つに記載の遺伝子編集ペアを含む組成物であって、
a.実施形態1~60のいずれか1つに記載のCasXバリアントを含む第2の遺伝子編集ペアと、
b.実施形態61~103のいずれか1つに記載の第2のgNAバリアントと、を含み、第2のgNAバリアントが、第1のgNAの標的化配列と比較して、標的核酸の異なる部分又は重複する部分に相補的な標的化配列を有する、組成物。
実施形態123.配列番号89~101、247~337、411~592、又は760~982のうちのいずれか1つのアミノ酸配列を含む、CasXバリアント。
実施形態124.配列番号2101~2332のうちのいずれか1つのアミノ酸配列を含む、gNAバリアント。
実施形態125.疾患を有する対象の治療のための医薬品として使用するための、実施形態104~121のいずれか1つに記載の遺伝子編集ペア。
セットIV
実施形態1.配列番号2292、2291、2307、2281~2290、2293~2306、2308~2332、及び23530~2398からなる群から選択される配列のうちのいずれかと少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、又は100%の配列同一性を有する配列を含む、ガイドRNA(gRNA)足場。
実施形態2.配列番号2292、2291、2307、2281~2290、2293~2306、2308~2332、及び23530~2398からなる群から選択される配列を含む、実施形態1に記載のgRNA足場。
実施形態3.配列番号2238に対して1つ以上の改変を有する配列を含み、1つ以上の改変が、改善された特徴をもたらす、実施形態1に記載のgRNA足場。
実施形態4.1つ以上の改変が、表19に示される1つ以上のヌクレオチドの置換、挿入、及び/又は欠失を含む、実施形態3に記載のgRNA足場。
実施形態5.改善された特徴が、任意選択的にインビトロアッセイにおける、編集活性の増加、シュードノットステム安定性の増加、三重鎖領域安定性の増加、足場ステム安定性の増加、伸長ステム安定性、オフターゲットフォールディング中間体の減少、及びクラス2、V型CRISPRタンパク質に対する結合親和性の増加からなる群から選択される1つ以上の機能特性である、実施形態3又は実施形態4に記載のgRNA足場。
実施形態6.gRNA足場が、インビトロアッセイにおいて、配列番号2238のgRNA足場のスコアと比較して、少なくとも約2.0、少なくとも約2.5、少なくとも約3、又は少なくとも約3.5大きい改善された濃縮スコア(log)を示す、実施形態3~5のいずれか1つに記載のgRNA足場。
実施形態7.配列番号2239に対して1つ以上の改変を有する配列を含み、1つ以上の改変が、改善された特徴をもたらす、実施形態1に記載のgRNA足場。
実施形態8.1つ以上の改変が、表20に示される1つ以上のヌクレオチドの置換、挿入、及び/又は欠失を含む、実施形態7に記載のgRNA足場。
実施形態9.改善された特徴が、任意選択的にインビトロアッセイにおける、編集活性の増加、シュードノットステム安定性の増加、三重鎖領域安定性の増加、足場ステム安定性の増加、伸長ステム安定性、オフターゲットフォールディング中間体の減少、及びクラス2、V型CRISPRタンパク質に対する結合親和性の増加からなる群から選択される1つ以上の機能特性である、実施形態7又は実施形態8に記載のgRNA足場。
実施形態10.gRNA足場が、インビトロアッセイにおいて、配列番号2239のgRNA足場のスコアと比較して、少なくとも約1.2、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、又は少なくとも約3.5大きい改善された濃縮スコア(log2)を示す、実施形態7~9のいずれか1つに記載のgRNA足場。
実施形態11.配列番号2239の配列に対して、C9、U11、C17、U24、A29、U54、G64、A88、及びA95からなる群から選択される位置に1つ以上の改変を含む、実施形態1に記載のgRNA足場。
実施形態12.配列番号2239の配列に対して、C9U、U11C、C17G、U24C、A29C、54位でのGの挿入、64位でのCの挿入、A88G、及びA95Gからなる群から選択される1つ以上の改変を含む、実施形態11に記載のgRNA足場。
実施形態13.配列番号2239の配列に対して、C9U、U11C、C17G、U24C、A29C、54位でのGの挿入、64位でのCの挿入、A88G、及びA95Gからなる改変を含む、実施形態12に記載のgRNA足場。
実施形態14.改善された特徴が、シュードノットステム安定性、三重鎖領域安定性、足場バブル安定性、伸長ステム安定性、及びクラス2、V型CRISPRタンパク質に対する結合親和性からなる群から選択される、実施形態7~13のいずれか1つに記載のgRNA足場。
実施形態15.配列番号2239の配列に対する64位でのCの挿入及びA88Gの置換が、伸長ステムの非対称バルジエレメントを解消し、gRNA足場の伸長ステムの安定性を増強する、実施形態14に記載のgRNA足場。
実施形態16.U11C、U24C、及びA95Gの置換が、gRNA足場の三重鎖領域の安定性を増加させる、実施形態14に記載のgRNA足場。
実施形態17.A29Cの置換が、シュードノットステムの安定性を増加させる、実施形態14に記載のgRNA足場。
実施形態18.gRNA足場が、伸長ステムにおいて1つ以上の異種RNA配列を含む、実施形態1又は実施形態2に記載のgRNA足場。
実施形態19.異種RNAが、MS2ヘアピン、Qβヘアピン、U1ヘアピンII、Uvsxヘアピン、及びPP7ステムループ、又はそれらの配列バリアントからなる群から選択される、実施形態18に記載のgRNA足場。
実施形態20.異種RNA配列が、gRNAの安定性を増加させる、実施形態18又は実施形態19に記載のgRNA足場。
実施形態21.異種RNAが、タンパク質、RNA、DNA、又は小分子に結合することができる、実施形態18又は実施形態19に記載のgRNA足場。
実施形態22.gRNA足場が、Rev応答エレメント(RRE)又はその一部を含む、実施形態18~21のいずれか1つに記載のgRNA足場。
実施形態23.RRE又はその一部が、配列UGGGCGCAGCGUCAAUGACGCUGACGGUACA(配列番号1280)を有するRREのステムIIB、配列CAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUG(配列番号1282)を有するRREのステムII-V、配列GCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGC(配列番号1281)を有するRREのステムII、配列GCUGACGGUACAGGC(配列番号1284)を有するステムIIBのRev結合エレメント(RBE)、及び配列AGGAGCUUUGUUCCUUGGGUUCUUGGGAGCAGCAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUGGCUGUGGAAAGAUACCUAAAGGAUCAACAGCUCCU(配列番号1283)を有する全長RREからなる群から選択される、実施形態22に記載のgRNA足場。
実施形態24.gRNA足場が、1つ以上のチミン(T)を含む、実施形態1~23のいずれか1つに記載のgRNA。
実施形態25.実施形態1~24のいずれか1つに記載のgRNA足場と、gRNA足場の3’末端の、標的核酸配列に相補的である標的化配列と、を含む、gRNA。
実施形態26.標的化配列が、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、又は30ヌクレオチドを有する、実施形態25に記載のgRNA。
実施形態27.標的化配列が、18、19、又は20ヌクレオチドを有する、実施形態26に記載のgRNA。
実施形態28.gRNAが、クラス2、V型CRISPRタンパク質とリボ核タンパク質(RNP)複合体を形成することができる、実施形態25~27のいずれか1つに記載のgRNA。
実施形態29.操作されたクラス2、V型CRISPRタンパク質であって、
a.QPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPEKDSDEAVTYSLGKFGQ(配列番号2335)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むNTSBドメインと、
b.RALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSF(配列番号2336)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むヘリックスI-IIドメインと、
c.PLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALRPYLSSEEDRKKGKKFARYQLGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAE(配列番号2351)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むヘリックスIIドメインと、
d.SSNIKPMNLIGVDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAKKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTC(配列番号2352)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むRuvC-Iドメインと、を含む、操作されたクラス2、V型CRISPRタンパク質。
実施形態30.CRISPRタンパク質が、QEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQ(配列番号2342)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むOBD-Iドメインを含む、実施形態29に記載のクラス2、V型CRISPRタンパク質。
実施形態31.CRISPRタンパク質が、NSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLD(配列番号2347)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むOBD-IIドメインを含む、実施形態29又は実施形態30に記載のクラス2、V型CRISPRタンパク質。
実施形態32.CRISPRタンパク質が、PISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVA(配列番号2343)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むヘリックスI-Iドメインを含む、実施形態29~31のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態33.CRISPRタンパク質が、SNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETH(配列番号2349)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むTSLドメインを含む、実施形態29~32のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態34.CRISPRタンパク質が、ADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV(配列番号2350)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むRuvC-IIドメインを含む、実施形態29~33のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態35.配列番号416の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含む、実施形態34に記載のクラス2、V型CRISPRタンパク質。
実施形態36.クラス2、V型CRISPRタンパク質が、1つ以上のドメインに少なくとも1つの改変を含む、実施形態29~35のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態37.少なくとも1つの改変が、
a.ドメインにおける少なくとも1つのアミノ酸置換、
b.ドメインにおける少なくとも1つのアミノ酸欠失、
c.ドメインにおける少なくとも1つのアミノ酸挿入、又は
d.(a)~(c)の任意の組み合わせ、を含む、実施形態36に記載のクラス2、V型CRISPRタンパク質。
実施形態38.配列番号2335に対して、P2、S4、Q9、E15、G20、G33、L41、Y51、F55、L68、A70、E75、K88、及びG90からなる群から選択されるNTSBドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36又は実施形態37に記載のクラス2、V型CRISPRタンパク質。
実施形態39.NTSBドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2335に対する、2位でのGの挿入、4位でのIの挿入、4位でのLの挿入、Q9P、E15S、G20D、30位でのSの欠失、G33T、L41A、Y51T、F55V、L68D、L68E、L68K、A70Y、A70S、E75A、E75D、E75P、K88Q、及びG90Qからなる群から選択される、実施形態38に記載のクラス2、V型CRISPRタンパク質。
実施形態40.配列番号2336に対して、I24、A25、Y29G32、G44、S48、S51、Q54、I56、V63、S73、L74、K97、V100、M112、L116、G137、F138、及びS140からなる群から選択されるヘリックスI-IIドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36~39のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態41.ヘリックスI-IIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2336に対する、24位でのTの挿入、25位でのCの挿入、Y29F、G32Y、G32N、G32H、G32S、G32T、G32A、G32V、32位でのGの欠失、G32S、G32T、G44L、G44H、S48H、S48T、S51T、Q54H、I56T、V63T、S73H、L74Y、K97G、K97S、K97D、K97E、V100L、M112T、M112W、M112R、M112K、L116K、G137R、G137K、G137N、138位でのQの挿入、及びS140Qからなる群から選択される、実施形態40に記載のクラス2、V型CRISPRタンパク質。
実施形態42.配列番号2351に対して、L2、V3、E4、R5、Q6、A7、E9、V10、D11、W12、W13、D14、M15、V16、C17、N18、V19、K20、L22、I23、E25、K26、K31、Q35、L37、A38、K41、R 42、Q43、E44、L46、K57、Y65、G68、L70、L71、L72、E75、G79、D81、W82、K84、V85、Y86、D87、I93、K95、K96、E98、L100、K102、I104、K105、E109、R110、D114、K118、A120、L121、W124、L125、R126、A127、A129、I133、E134、G135、L136、E138、D140、K141、D142、E143、F144、C145、C147、E148、L149、K150、L151、Q152、K153、L158、E166、及びA167からなる群から選択されるヘリックスIIドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36~41のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態43.ヘリックスIIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2351に対する、2位でのAの挿入、2位でのHの挿入、2位でのLの欠失、及び3位でのVの欠失、V3E、V3Q、V3F、3位でのVの欠失、3位でのDの挿入、V3P、E4P、4位でのEの欠失、E4D、E4L、E4R、R5N、Q6V、6位でのQの挿入、7位でのGの挿入、9位でのHの挿入、9位でのAの挿入、VD10、0位でのT1の挿入、10位でのVの欠失、10位でのFの挿入、11位でのDの挿入、11位でのDの欠失、D11S、12位でのWの欠失、W12T、W12H、12位でのPの挿入、13位でのQの挿入、12位でのGの挿入、13位でのRの挿入、W13P、W13D、13位でのDの挿入、W13L、14位でのPの挿入、14位でのDの挿入、14位でのDの欠失、及び15位でのMの欠失、15位でのMの欠失、16位でのTの挿入、17位でのPの挿入、N18I、V19N、V19H、K20D、L22D、I23S、E25C、E25P、25位でのGの挿入、K26T、K27E、K31L、K31Y、Q35D、Q35P、37位でのSの挿入、37位でのLの欠失、及び38位でのAの欠失、K41L、42位でのRの挿入、43位でのQの欠失、及び44位でのEの欠失、L46N、K57Q、Y65T、G68M、L70V、L71C、L72D、L72N、L72W、L72Y、E75F、E75L、E75Y、G79P、79位でのEの挿入、81位でのTの挿入、81位でのRの挿入、81位でのWの挿入、81位でのYの挿入、82位でのWの挿入、82位でのYの挿入、W82G、W82R、K84D、K84H、K84P、K84T、V85L、V85A、85位でのLの挿入、Y86C、D87G、D87M、D87P、I93C、K95T、K96R、E98G、L100A、K102H、I104T、I104S、I104Q、K105D、109位でのKの挿入、E109L、R110D、110位でのRの欠失、D114E、114位でのDの挿入、K118P、A120R、L121T、W124L、L125C、R126D、A127E、A127L、A129T、A129K、I133E、133位でのCの挿入、134位でのSの挿入、134位でのGの挿入、135位でのRの挿入、G135P、L136K、L136D、L136S、L136H、138位でのEの欠失、D140R、140位でのDの挿入、141位でのPの挿入、142位でのDの挿入、143+位でのEの欠失、144位でのFの欠失、143位でのQの挿入、F144K、144位でのFの欠失、144位でのFの欠失、及び145位でのCの欠失、C145R、145位でのGの挿入、C145K、C147D、148位でのVの挿入、E148D、149位でのHの挿入、L149R、K150R、L151H、Q152C、K153P、L158S、E166L、及び167位でのFの挿入からなる群から選択される、実施形態42に記載のクラス2、V型CRISPRタンパク質。
実施形態44.配列番号2352に対して、I4、K5、P6、M7、N8、L9、V12、G49、K63、K80、N83、R90、M125、及びL146からなる群から選択されるRuvC-Iドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36~43のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態45.RuvC-Iドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2351に対する、4位でのIの挿入、5位でのSの挿入、6位でのTの挿入、6位でのNの挿入、7位でのRの挿入、7位でのKの挿入、8位でのHの挿入、8位でのSの挿入、V12L、G49W、G49R、S51R、S51K、K62S、K62T、K62E、V65A、K80E、N83G、R90H、R90G、M125S、M125A、L137Y、137位でのPの挿入、141位でのLの欠失、L141R、L141D、142位でのQの挿入、143位でのRの挿入、143位でのNの挿入、E144N、146位でのPの挿入、L146F、P147A、K149Q、T150V、152位でのRの挿入、H153の挿入、T155Q、155位でのHの挿入、155位でのRの挿入、156位でのLの挿入、156位でのLの欠失、156位でのWの挿入、157位でのAの挿入、157位でのFの挿入、A157S、Q158K、159位でのYの欠失、T160Y、T160F、161位でのIの挿入、S161P、T163P、163位でのNの挿入、C164K、及びC164Mからなる群から選択される、実施形態44に記載のクラス2、V型CRISPRタンパク質。
実施形態46.配列番号2342に対して、I3、K4、R5、I6、N7、K8、K15、D16、N18、P27、M28、V33、R34、M36、R41、L47、R48、E52、P55、及びQ56からなる群から選択されるOBD-Iドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36~45のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態47.OBD-Iドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2342に対する、3位でのGの挿入、I3G、I3E、4位でのGの挿入、K4G、K4P、K4S、K4W、K4W、R5P、5位でのPの挿入、5位でのGの挿入、R5S、5位でのSの挿入、R5A、R5P、R5G、R5L、I6A、I6L、6位でのGの挿入、N7Q、N7L、N7S、K8G、K15F、D16W、16位でのFの挿入、F18の挿入、27位でのPの挿入、M28P、M28H、V33T、R34P、M36Y、R41P、L47P、48位でのPの挿入、E52P、55位でのPの挿入、55位でのPの欠失、及び欠失56位でのQの欠失、Q56S、Q56P、56位でのDの挿入、56位でのTの挿入、及びQ56Pからなる群から選択される、実施形態46に記載のクラス2、V型CRISPRタンパク質。
実施形態48.配列番号2347に対して、S2、I3、L4、K11、V24、K37、R42、A53、T58、K63、M70、I82、Q92、G93、K110、L121、R124、R141、E143、V144、及びL145からなる群から選択されるOBD-IIドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36~47のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態49.OBD-IIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2342に対する、2位でのSの欠失、I3R、I3K、3位でのIの欠失、及びL4の欠失、4位でのLの欠失、K11T、24位でのPの挿入、K37G、R42E、53位でのSの挿入、58位でのRの挿入、63位でのKの欠失、M70T、I82T、Q92I、Q92F、Q92V、Q92A、93位でのAの挿入、K110Q、R115Q、L121T、124位でのAの挿入、141位でのRの挿入、143位でのDの挿入、143位でのAの挿入、144位でのWの挿入、及び145位でのAの挿入からなる群から選択される、実施形態48に記載のクラス2、V型CRISPRタンパク質。
実施形態50.配列番号2349に対して、S1、N2、C3、G4、F5、I7、K18、V58、S67、T76、G78、S80、G81、E82、S85、V96、及びE98からなる群から選択されるTSLドメインにおける1つ以上のアミノ酸位置で改変を含む、実施形態36~49のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態51.OBD-IIドメインにおける1つ以上のアミノ酸位置での1つ以上の改変が、配列番号2349に対する、1位でのMの挿入、2位でのNの欠失、2位でのVの挿入、C3S、4位でのGの挿入、4位でのWの挿入、F5P、7位でのWの挿入、K18G、V58D、67位でのAの挿入、T76E、T76D、T76N、G78D、80位でのSの欠失、81位でのGの欠失、82位でのEの挿入、82位でのNの挿入、S85I、V96C、V96T、及びE98Dからなる群から選択される、実施形態50に記載のクラス2、V型CRISPRタンパク質。
実施形態52.配列番号2と比較して改善された特徴を示し、改善された特徴が、gRNAに対する結合親和性の増加、標的核酸に対する結合親和性の増加、標的核酸の編集においてより広範囲のPAM配列を利用する能力の改善、標的核酸の巻き戻しの改善、編集活性の増加、編集効率の改善、標的核酸の切断に対する編集特異性の改善、オフターゲット編集又は標的核酸の切断の減少、編集され得る真核生物ゲノムの割合の増加、ヌクレアーゼの活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、DNAの非標的鎖の結合の増加、タンパク質安定性の改善、タンパク質: gRNA(RNP)複合体の安定性の増加、並びに改善された融合体特徴を含む、実施形態29~51のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態53.改善された特徴が、TTC、ATC、GTC、又はCTC PAM配列を含む標的核酸配列での切断活性の増加を含む、実施形態52に記載のクラス2、V型CRISPRタンパク質。
実施形態54.改善された特徴が、配列番号416の配列の切断活性と比較して、ATC又はCTC PAM配列を含む標的核酸配列での切断活性の増加を含む、実施形態53に記載のクラス2、V型CRISPRタンパク質。
実施形態55.改善された切断活性が、インビトロアッセイにおいて、配列番号416の配列のスコアと比較して、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、少なくとも約6、少なくとも約7、少なくとも約8、又はそれ以上大きい濃縮スコア(log)である、実施形態54に記載のクラス2、V型CRISPRタンパク質。
実施形態56.改善された特徴が、配列番号416の配列と比較して、CTC PAM配列を含む標的核酸配列での切断活性の増加を含む、実施形態54に記載のクラス2、V型CRISPRタンパク質。
実施形態57.改善された切断活性が、インビトロアッセイにおいて、配列番号416の配列のスコアと比較して、少なくとも約2、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、若しくは少なくとも約6、又はそれ以上大きい濃縮スコア(log)である、実施形態56に記載のクラス2、V型CRISPRタンパク質。
実施形態58.改善された特徴が、配列番号416の配列と比較して、TTC PAM配列を含む標的核酸配列での切断活性の増加を含む、実施形態53に記載のクラス2、V型CRISPRタンパク質。
実施形態59.改善された切断活性が、インビトロアッセイにおいて、配列番号416の配列と比較して、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、若しくは少なくとも約6、又はそれ以上大きい濃縮スコア(log)である、実施形態58に記載のクラス2、V型CRISPRタンパク質。
実施形態60.改善された特徴が、配列番号416の配列と比較して、標的核酸配列の切断に対する特異性の増加を含む、実施形態52に記載のクラス2、V型CRISPRタンパク質。
実施形態61.増加した特異性が、インビトロアッセイにおいて、配列番号416の配列と比較して、少なくとも約2.0、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、若しくは少なくとも約6、又はそれ以上大きい濃縮スコア(log)である、実施形態60に記載のクラス2、V型CRISPRタンパク質。
実施形態62.改善された特徴が、標的核酸配列のオフターゲット切断の減少を含む、実施形態52に記載のクラス2、V型CRISPRタンパク質。
実施形態63.クラス2 V型CRISPRタンパク質が、表3に示される配列番号415~592及び1147~1231の配列からなる群から選択される配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を有する、実施形態29~62のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態64.表3に示される配列番号415~592及び1147~1231からなる群から選択される配列を含む、実施形態29~62のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態65.1つ以上の核局在化シグナル(NLS)を含む、実施形態29~64のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態66.1つ以上のNLSが、PKKKRKV(配列番号352)、KRPAATKKAGQAKKKK(配列番号353)、PAAKRVKLD(配列番号354)、RQRRNELKRSP(配列番号355)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号356)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号357)、VSRKRPRP(配列番号358)、PPKKARED(配列番号359)、PQPKKKPL(配列番号360)、SALIKKKKKMAP(配列番号361)、DRLRR(配列番号362)、PKQKKRK(配列番号363)、RKLKKKIKKL(配列番号364)、REKKKFLKRR(配列番号365)、KRKGDEVDGVDEVAKKKSKK(配列番号366)、RKCLQAGMNLEARKTKK(配列番号367)、PRPRKIPR(配列番号368)、PPRKKRTVV(配列番号369)、NLSKKKKRKREK(配列番号370)、RRPSRPFRKP(配列番号371)、KRPRSPSS(配列番号372)、KRGINDRNFWRGENERKTR(配列番号373)、PRPPKMARYDN(配列番号374)、KRSFSKAF(配列番号375)、KLKIKRPVK(配列番号376)、PKKKRKVPPPPAAKRVKLD(配列番号377)、PKTRRRPRRSQRKRPPT(配列番号378)、SRRRKANPTKLSENAKKLAKEVEN(配列番号379)、KTRRRPRRSQRKRPPT(配列番号380)、RRKKRRPRRKKRR(配列番号381)、PKKKSRKPKKKSRK(配列番号382)、HKKKHPDASVNFSEFSK(配列番号383)、QRPGPYDRPQRPGPYDRP(配列番号384)、LSPSLSPLLSPSLSPL(配列番号385)、RGKGGKGLGKGGAKRHRK(配列番号386)、PKRGRGRPKRGRGR(配列番号387)、PKKKRKVPPPPKKKRKV(配列番号389)、PAKRARRGYKC(配列番号63)、KLGPRKATGRW(配列番号64)、PRRKREE(配列番号65)、PYRGRKE(配列番号66)、PLRKRPRR(配列番号67)、PLRKRPRRGSPLRKRPRR(配列番号68)、PAAKRVKLDGGKRTADGSEFESPKKKRKV(配列番号69)、PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(配列番号70)、PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(配列番号71)、PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(配列番号72)、KRKGSPERGERKRHW(配列番号73)、KRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号74)、及びPKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号75)からなる配列の群から選択され、任意選択的に、1つ以上のNLSが、リンカーペプチドを用いて、クラス2、V型CRISPRタンパク質又は隣接するNLSに連結され、リンカーペプチドが、SR、RS、(G)n(配列番号1023)、(GS)n(配列番号1024)、(GSGGS)n(配列番号399)、(GGSGGS)n(配列番号400)、(GGGS)n(配列番号401)、GGSG(配列番号402)、GGSGG(配列番号403)、GSGSG(配列番号404)、GSGGG(配列番号405)、GGGSG(配列番号406)、GSSSG(配列番号407)、GPGP(配列番号408)、GGP、PPP、PPAPPA(配列番号409)、PPPG(配列番号24)、PPPGPPP(配列番号410)、PPP(GGGS)n(配列番号25)、(GGGS)nPPP(配列番号26)、AEAAAKEAAAKEAAAKA(配列番号1025)、及びTPPKTKRKVEFE(配列番号27)(式中、nは1~5である)からなる群から選択される、実施形態65に記載のクラス2、V型CRISPRタンパク質。
実施形態67.1つ以上のNLSが、タンパク質のC末端又はその近くに位置する、実施形態65又は実施形態66に記載のクラス2、V型CRISPRタンパク質。
実施形態68.1つ以上のNLSが、タンパク質のN末端又はその近くに位置する、実施形態65又は実施形態66に記載のクラス2、V型CRISPRタンパク質。
実施形態69.少なくとも2つのNLSを含み、少なくとも2つのNLSが、タンパク質のN末端又はその近く及びC末端又はその近くに位置する、実施形態65又は実施形態66に記載のクラス2、V型CRISPRタンパク質。
実施形態70.クラス2、V型CRISPRタンパク質が、gRNAとリボ核タンパク質複合体(RNP)を形成することができる、実施形態29~69のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態71.RNPが、配列番号1~3のうちのいずれか1つの参照タンパク質及び配列番号4又は配列番号5のgRNAのRNPと比較して、少なくとも1つ以上の改善された特徴を示す、実施形態70に記載のクラス2、V型CRISPRタンパク質。
実施形態72.改善された特徴が、ガイド核酸(gRNA)に対する結合親和性の増加、標的核酸に対する結合親和性の増加、標的核酸の編集において、ATC、CTC、GTC、若しくはTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善、標的核酸の巻き戻しの増加、編集活性の増加、編集効率の増加、標的核酸の編集特異性の増加、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、標的核酸のオフターゲット切断の減少、非標的核酸鎖の結合の増加、及びタンパク質: gRNA複合体(RNP)の安定性の増加からなる群から選択される、実施形態71に記載のクラス2、V型CRISPRタンパク質。
実施形態73.RNPの改善された特徴が、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5のgRNAのRNPと比較して、少なくとも約1.1~約100,000倍増加している、実施形態71又は実施形態72に記載のクラス2、V型CRISPRタンパク質。
実施形態74.RNPの改善された特徴が、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5のgRNAのRNPと比較して、少なくとも約10倍、少なくとも約100倍、少なくとも約1,000倍、又は少なくとも約10,000倍増加している、実施形態71又は実施形態72に記載のクラス2、V型CRISPRタンパク質。
実施形態75.RNPの改善された特徴が、配列番号2の参照タンパク質、及び配列番号4又は5を含むgRNAのRNPと比較して、編集効率の1.1~100倍の改善を含む、実施形態71~74のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
実施形態76.gRNA及びクラス2、V型CRISPRタンパク質を含む遺伝子編集ペアであって、ペアが、
a.実施形態25~28のいずれか1つに記載のgRNAと、
b.実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質と、を含む、遺伝子編集ペア。
実施形態77.gRNA及びクラス2、V型CRISPRタンパク質が、リボ核タンパク質複合体(RNP)を形成することができる、実施形態76に記載の遺伝子編集ペア。
実施形態78.gRNA及びクラス2、V型CRISPRタンパク質が、リボ核タンパク質複合体(RNP)として一緒に会合している、実施形態76又は実施形態77に記載の遺伝子編集ペア。
実施形態79.クラス2、V型CRISPRタンパク質及びgRNAのRNPが、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5の配列を含むgRNAのRNPと比較して、少なくとも1つ以上の改善された特徴を示す、実施形態77又は実施形態78に記載の遺伝子編集ペア。
実施形態80.改善された特徴が、gRNAに対するクラス2、V型CRISPRタンパク質の結合親和性の増加、標的核酸に対する結合親和性の増加、標的核酸の編集において、ATC、CTC、GTC、又はTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の増加、標的核酸の巻き戻しの増加、編集活性の増加、編集効率の増加、標的核酸の編集特異性の増加、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、標的核酸のオフターゲット切断の減少、非標的核酸鎖の結合の増加、タンパク質: gRNA複合体(RNP)の安定性の増加、及び融合体特徴の増加からなる群のうちの1つ以上から選択される、実施形態79に記載の遺伝子編集ペア。
実施形態81.クラス2、V型CRISPRタンパク質及びgRNAのRNPの改善された特徴が、同等のインビトロアッセイシステムにおいて、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5の配列を含むgRNAのRNPと比較して、少なくとも約1.1~約100倍又はそれ以上増加している、実施形態79又は実施形態80に記載の遺伝子編集ペア。
実施形態82.クラス2、V型CRISPRタンパク質の改善された特徴が、同等のインビトロアッセイシステムにおいて、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5の配列を含むgNAと比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、少なくとも約100倍、又はそれ以上増加している、実施形態79又は実施形態80に記載の遺伝子編集ペア。
実施形態83.PAM配列TTC、ATC、GTC、又はCTCのうちのいずれか1つが、細胞アッセイシステムにおいてgRNAの標的化配列と同一性を有するプロトスペーサーの非標的鎖に対して1ヌクレオチド5’側に位置する場合、クラス2、V型CRISPRタンパク質及びgRNAを含むRNPが、同等のアッセイシステムにおいて、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び参照gRNAを含むRNPの編集効率及び/又は結合と比較して、標的核酸におけるより高い編集効率及び/又は標的核酸配列の結合を示す、実施形態77~82のいずれか1つに記載の遺伝子編集ペア。
実施形態84.PAM配列が、TTCである、実施形態83に記載の遺伝子編集ペア。
実施形態85.PAM配列が、ATCである、実施形態83に記載の遺伝子編集ペア。
実施形態86.PAM配列が、CTCである、実施形態83に記載の遺伝子編集ペア。
実施形態87.PAM配列が、GTCである、実施形態83に記載の遺伝子編集ペア。
実施形態88.クラス2、V型CRISPR及びgRNAを含むRNPが、同等のインビトロアッセイシステムで評価した場合、配列番号1~3の参照タンパク質及び配列番号4又は配列番号5のgRNAのうちのいずれか1つのRNPの結合親和性と比較して、少なくとも1.5倍、少なくとも2倍、少なくとも4倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、又は少なくとも40倍大きい、1つ以上のPAM配列に対する結合親和性の増加を示す、実施形態83~87のいずれか1つに記載の遺伝子編集ペア。
実施形態89.クラス2、V型CRISPR及びgRNAを含むRNPが、同等のインビトロアッセイシステムで評価した場合、配列番号1~3の参照タンパク質及び配列番号4又は配列番号5のgRNAのうちのいずれか1つのRNPの編集効率と比較して、少なくとも1.5倍、少なくとも2倍、少なくとも4倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、又は少なくとも40倍高い編集効率の増加を示す、実施形態77~88のいずれか1つに記載の遺伝子編集ペア。
実施形態90.クラス2、V型CRISPR及びgRNAが、同等のインビトロアッセイシステムで評価した場合、配列番号1~3の参照タンパク質及び配列番号4又は配列番号5のgRNAのうちのいずれか1つのRNPと比較して、少なくとも約5%、少なくとも約10%、少なくとも約15%、又は少なくとも約20%高い割合の切断コンピテントコンフォメーションを有するRNPを形成することができる、実施形態77~89のいずれか1つに記載の遺伝子編集ペア。
実施形態91.クラス2、V型CRISPR及びgRNAを含むRNPが、時限インビトロアッセイにおいて、同等のインビトロアッセイシステムで評価した場合の配列番号1~3の参照タンパク質及び配列番号4又は配列番号5のgRNAのうちのいずれか1つのRNPと比較して、少なくとも約5倍、少なくとも約10倍、又は少なくとも約20倍高い標的核酸の切断速度を示す、実施形態77~90のいずれか1つに記載の遺伝子編集ペア。
実施形態92.クラス2、V型CRISPR及びgRNAを含むRNPが、時限インビトロアッセイにおいて、同等のインビトロアッセイシステムで評価した場合の配列番号1~3の参照タンパク質及び配列番号4又は配列番号5のgRNAのうちのいずれか1つのRNPと比較して、少なくとも約5倍、少なくとも約10倍、少なくとも約20倍、又は少なくとも約100倍高い標的核酸のより高い割合の編集を示す、実施形態77~91のいずれか1つに記載の遺伝子編集ペア。
実施形態93.表7に示される配列番号44~62及び1232~1235からなる群から選択される配列、又はそれと少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%を有する配列を含む、触媒的に不活性なクラス2、V型CRISPRタンパク質。
実施形態94.表7に示される配列番号44~62及び1232~1235からなる群から選択される配列を含む、触媒的に不活性なクラス2、V型CRISPRタンパク質。
実施形態95.触媒的に不活性なクラス2、V型CRISPRタンパク質及び実施形態25~28のいずれか1つ記載のgRNAのRNPが、標的核酸に結合する能力を保持する、実施形態93又は実施形態94に記載のクラス2、V型CRISPRタンパク質。
実施形態96.実施形態1~24のいずれか1つに記載のgRNA足場又は実施形態25~28のいずれか1つに記載のgRNAをコードする配列を含む、核酸。
実施形態97.実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質をコードする配列を含む、核酸。
実施形態98.クラス2、V型CRISPRタンパク質をコードする配列が、真核細胞における発現のためにコドン最適化されている、実施形態97に記載の核酸。
実施形態99.実施形態25~28のいずれか1つに記載のgRNA、実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質、又は実施形態96~98のいずれか1つに記載の核酸を含む、ベクター。
実施形態100.ベクターが、プロモーターを含む、実施形態99に記載のベクター。
実施形態101.ベクターが、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、単純ヘルペスウイルス(HSV)ベクター、CasX送達粒子(XDP)、プラスミド、ミニサークル、ナノプラスミド、DNAベクター、及びRNAベクターからなる群から選択される、実施形態99又は実施形態100に記載のベクター。
実施形態102.ベクターが、AAVベクターである、実施形態101に記載のベクター。
実施形態103.AAVベクターが、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-Rh74、又はAAVRh10から選択される、実施形態102に記載のベクター。
実施形態104.ベクターが、レトロウイルスベクターである、実施形態101に記載のベクター。
実施形態105.ベクターが、gagポリタンパク質の1つ以上の成分を含むXDPである、実施形態101に記載のベクター。
実施形態106.gagポリタンパク質の1つ以上の成分が、マトリックスタンパク質(MA)、ヌクレオカプシドタンパク質(NC)、カプシドタンパク質(CA)、p1ペプチド、p6ペプチド、P2Aペプチド、P2Bペプチド、P10ペプチド、p12ペプチド、PP21/24ペプチド、P12/P3/P8ペプチド、P20ペプチド、及びプロテアーゼ切断部位からなる群から選択される、実施形態105に記載のベクター。
実施形態107.クラス2、V型CRISPR及びgRNAが、RNPにおいて一緒に会合している、実施形態105又は実施形態106に記載のベクター。
実施形態108.糖タンパク質トロピズム因子を含む、実施形態105~107のいずれか1つに記載のベクター。
実施形態109.糖タンパク質トロピズム因子が、標的細胞の細胞表面マーカーに対する結合親和性を有し、XDPの標的細胞への侵入を促進する、実施形態108に記載のベクター。
実施形態110.ドナー鋳型を更に含む、実施形態99~109のいずれか1つに記載のベクター。
実施形態111.実施形態99~110のいずれか1つに記載のベクターを含む、宿主細胞。
実施形態112.宿主細胞が、ベビーハムスター腎線維芽細胞(BHK)細胞、ヒト胎児腎臓293(HEK293)細胞、ヒト胎児腎臓293T(HEK293T)細胞、NS0細胞、SP2/0細胞、YO骨髄腫細胞、P3X63マウス骨髄腫細胞、PER細胞、PER.C6細胞、ハイブリドーマ細胞、NIH3T3細胞、SV40遺伝物質を有するCV-1(サル)起源(COS)細胞、HeLa、チャイニーズハムスター卵巣(CHO)細胞、又は酵母細胞からなる群から選択される、実施形態111に記載の宿主細胞。
実施形態113.細胞における標的核酸を改変する方法であって、細胞の標的核酸を、i)実施形態76~92のいずれか1つに記載の遺伝子編集ペア、ii)実施形態76~92のいずれか1つに記載の遺伝子編集ペアとドナー鋳型、iii)(i)若しくは(ii)の遺伝子編集ペアをコードする1つ以上の核酸、iv)(iii)の核酸を含むベクター、v)(i)若しくは(ii)の遺伝子編集ペアを含むXDP、又はvi)(i)~(v)のうちの2つ以上の組み合わせ、と接触させることを含み、標的核酸の接触が、標的核酸を改変する、方法。
実施形態114.標的を、標的核酸の異なる領域又は重複する領域に相補的な標的化配列を含む第1及び第2のgRNA又は複数のgRNAを含む複数の遺伝子編集ペアと接触させることを含む、実施形態113に記載の方法。
実施形態115.標的を、標的核酸の異なる領域又は重複する領域に相補的な標的化配列を含む第1及び第2のgRNA又は複数のgRNAを含む遺伝子編集ペアをコードする複数の核酸と接触させることを含む、実施形態113に記載の方法。
実施形態116.標的を、標的核酸の異なる領域又は重複する領域に相補的な標的化配列を含む第1及び第2のgRNA又は複数のgRNAを含む遺伝子編集ペアを含む複数のXDPと接触させることを含む、実施形態113に記載の方法。
実施形態117.接触させることが、標的核酸を遺伝子編集ペアと結合させることと、標的核酸に1つ以上の一本鎖切断を導入することと、を含み、改変することが、標的核酸に変異、挿入、又は欠失を導入することを含む、実施形態113に記載の方法。
実施形態118.接触させることが、標的核酸を結合させることと、標的核酸に1つ以上の二本鎖切断を導入することと、を含み、改変することが、標的核酸に変異、挿入、又は欠失を導入することを含む、実施形態113~116のいずれか1つに記載の方法。
実施形態119.標的核酸をドナー鋳型核酸のヌクレオチド配列と接触させることを含み、ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、実施形態113~118のいずれか1つに記載の方法。
実施形態120.ドナー鋳型が、ドナー鋳型の5’末端及び3’末端に相同アームを含む、実施形態119に記載の方法。
実施形態121.ドナー鋳型が、相同組換え修復によって切断部位で標的核酸に挿入される、実施形態119又は実施形態120に記載の方法。
実施形態122.ドナー鋳型が、非相同末端結合(NHEJ)又はマイクロホモロジー末端結合(MMEJ)によって切断部位で標的核酸に挿入される、実施形態121に記載の方法。
実施形態123.細胞の改変が、インビトロで起こる、実施形態113~122のいずれか1つに記載の方法。
実施形態124.細胞の改変が、インビボで起こる、実施形態113~122のいずれか1つに記載の方法。
実施形態125.細胞が、真核細胞である、実施形態113~124のいずれか1つに記載の方法。
実施形態126.真核細胞が、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、及び非ヒト霊長類細胞からなる群から選択される、実施形態125に記載の方法。
実施形態127.真核細胞が、ヒト細胞である、実施形態125に記載の方法。
実施形態128.細胞が、胚性幹細胞、人工多能性幹細胞、生殖細胞、線維芽細胞、オリゴデンドロサイト、グリア細胞、造血幹細胞、ニューロン前駆細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、網膜細胞、がん細胞、T細胞、B細胞、NK細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植増殖心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液幹細胞、筋芽細胞、成体幹細胞、骨髄細胞、間葉系細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、自己細胞、又は出生後幹細胞からなる群から選択される、実施形態113~127のいずれか1つに記載の方法。
実施形態129.細胞が、対象内にある、実施形態124~128のいずれか1つに記載の方法。
実施形態130.改変が、遺伝子のアレルに変異を有する対象の細胞において起こり、変異が、対象において疾患又は障害を引き起こす、実施形態129に記載の方法。
実施形態131.改変が、変異を遺伝子の野生型アレルに変化させるか、又は機能的遺伝子産物の発現をもたらす、実施形態130に記載の方法。
実施形態132.改変が、対象において疾患又は障害を引き起こす遺伝子のアレルをノックダウン又はノックアウトする、実施形態130に記載の方法。
実施形態133.細胞が、対象に対して自己由来である、実施形態129~132のいずれか1つに記載の方法。
実施形態134.細胞が、対象に対して同種自己由来である、実施形態129~132のいずれか1つに記載の方法。
実施形態135.ベクターが、アデノ随伴ウイルス(AAV)ベクターである、実施形態113~134のいずれか1つに記載の方法。
実施形態136.AAVが、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV-Rh74、又はAAVRh10である、実施形態135に記載の方法。
実施形態137.ベクターが、レンチウイルスベクターである、実施形態113に記載の方法。
実施形態138.ベクターが、治療有効用量を使用して、必要とする対象に投与される、実施形態113~137のいずれか1つに記載の方法。
実施形態139.対象が、マウス、ラット、ブタ、及び非ヒト霊長類からなる群から選択される、実施形態138に記載の方法。
実施形態140.対象が、ヒトである、実施形態138に記載の方法。
実施形態141.ベクターが、少なくとも約1×10ベクターゲノム/kg(vg/kg)、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×1010vg/kg、少なくとも約1×1011vg/kg、少なくとも約1×1012vg/kg、少なくとも約1×1013vg/kg、少なくとも約1×1014vg/kg、少なくとも約1×1015vg/kg、又は少なくとも約1×1016vg/kgの用量で対象に投与される、実施形態138~140のいずれか1つに記載の方法。
実施形態142.ベクターが、少なくとも約1×10vg/kg~約1×1016vg/kg、少なくとも約1×10vg/kg~約1×1015vg/kg、又は少なくとも約1×10vg/kg~約1×1014vg/kgの用量で対象に投与される、実施形態138~140のいずれか1つに記載の方法。
実施形態143.ベクターが、XDPである、実施形態113に記載の方法。
実施形態144.XDPが、治療有効用量を使用して、必要とする対象に投与される、実施形態143に記載の方法。
実施形態145.XDPが、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×1010粒子/kg、少なくとも約1×1011粒子/kg、少なくとも約1×1012粒子/kg、少なくとも約1×1013粒子/kg、少なくとも約1×1014粒子/kg、少なくとも約1×1015粒子/kg、少なくとも約1×1016粒子/kgの用量で対象に投与される、実施形態144に記載の方法。
実施形態146.XDPが、少なくとも約1×10粒子/kg~約1×1016粒子/kg、又は少なくとも約1×10粒子/kg~約1×1015粒子/kg、又は少なくとも約1×10粒子/kg~約1×1014粒子/kgの用量で対象に投与される、実施形態143に記載の方法。
実施形態147.ベクターが、実質内、静脈内、動脈内、脳室内、大槽内、髄腔内、頭蓋内、及び腹腔内経路からなる群から選択される投与経路によって投与され、投与方法が、注射、輸血、又は移植である、実施形態138~146のいずれか1つに記載の方法。
実施形態148.ベクターが、治療有効用量のベクターを使用して、1回以上の連続用量を含む治療レジメンに従って対象に投与される、実施形態141~147のいずれか1つに記載の方法。
実施形態149.治療有効用量が、少なくとも2週間、又は少なくとも1ヶ月間、若しくは少なくとも2ヶ月間、若しくは少なくとも3ヶ月間、若しくは少なくとも4ヶ月間、若しくは少なくとも5ヶ月間、若しくは少なくとも6ヶ月間の期間にわたって、あるいは年1回、又は2年毎若しくは3年毎に1回、2回以上の用量として対象に投与される、実施形態148に記載の方法。
実施形態150.実施形態76~92のいずれか1つに記載の遺伝子編集ペアによって改変された標的核酸を含む、細胞。
実施形態151.実施形態113~149のいずれか1つに記載の方法によって編集された、細胞。
実施形態152.細胞が、原核細胞である、実施形態150又は151に記載の細胞。
実施形態153.細胞が、真核細胞である、実施形態150又は151に記載の細胞。
実施形態154.真核細胞が、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、及び非ヒト霊長類細胞からなる群から選択される、実施形態153に記載の細胞。
実施形態155.真核細胞が、ヒト細胞である、実施形態153に記載の細胞。
実施形態156.実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質を含む、組成物。
実施形態157.実施形態25~28のいずれか1つに記載のgRNAを含む、実施形態156に記載の組成物。
実施形態158.タンパク質及びgRNAが、リボ核タンパク質複合体(RNP)において一緒に会合している、実施形態157に記載の組成物。
実施形態159.ドナー鋳型核酸を含み、ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、実施形態156~158のいずれか1つに記載の組成物。
実施形態160.緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、実施形態156~159のいずれか1つに記載の組成物。
実施形態161.実施形態1~24のいずれか1つに記載のgRNA足場、又は実施形態25~28のいずれか1つに記載のgRNAを含む、組成物。
実施形態162.実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質を含む、実施形態161に記載の組成物。
実施形態163.クラス2、V型CRISPRタンパク質及びgRNAが、リボ核タンパク質複合体(RNP)において一緒に会合している、実施形態162に記載の組成物。
実施形態164.ドナー鋳型核酸を含み、ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、実施形態161~163のいずれか1つに記載の組成物。
実施形態165.緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、実施形態161~164のいずれか1つに記載の組成物。
実施形態166.実施形態76~92のいずれか1つに記載の遺伝子編集ペアを含む、組成物。
実施形態167.ドナー鋳型核酸を含み、ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、実施形態166に記載の組成物。
実施形態168.緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、実施形態166又は実施形態167に記載の組成物。
実施形態169.実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質及び容器を含む、キット。
実施形態170.実施形態1~24のいずれか1つに記載のgRNA足場、又は実施形態25~28のいずれか1つに記載のgRNAを含む、実施形態169に記載のキット。
実施形態171.ドナー鋳型核酸を含み、ドナー鋳型が、標的核酸の標的核酸配列と相同性を有するヌクレオチド配列を含む、実施形態169又は実施形態170に記載のキット。
実施形態172.緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、実施形態169~171のいずれか1つに記載のキット。
実施形態173.実施形態1~24のいずれか1つに記載のgRNA足場、又は実施形態25~28のいずれか1つに記載のgRNAを含む、キット。
実施形態174.実施形態29~75のいずれか1つに記載のクラス2、V型CRISPRタンパク質を含む、実施形態173に記載のキット。
実施形態175.ドナー鋳型核酸を含み、ドナー鋳型が、標的核酸の標的核酸配列と相同性を有するヌクレオチド配列を含む、実施形態173又は実施形態174に記載のキット。
実施形態176.緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、実施形態173~175のいずれか1つに記載のキット。
実施形態177.実施形態76~92のいずれか1つに記載の遺伝子編集ペアを含む、キット。
実施形態178.ドナー鋳型核酸を含み、ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、実施形態177に記載のキット。
実施形態179.緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、実施形態177又は実施形態178に記載のキット。
実施形態180.表3に列挙される配列のうちのいずれか1つを含む、操作されたクラス2、V型CRISPRタンパク質。
実施形態181.表2に列挙されるgRNA足場バリアント配列のうちのいずれか1つを含む、gRNA。
実施形態182.表2の配列のgRNA足場バリアントの1つ以上のウラシル(U)が、チミン(T)で置換されている、実施形態181に記載のgRNA。
実施形態183.標的核酸に相補的な少なくとも10~30ヌクレオチドの標的化配列を含む、実施形態182に記載のgRNA。
実施形態184.標的化配列が、20ヌクレオチドを有する、実施形態183に記載のgRNA。
実施形態185.標的化配列が、19ヌクレオチドを有する、実施形態183に記載のgRNA。
実施形態186.標的化配列が、18ヌクレオチドを有する、実施形態183に記載のgRNA。
実施形態187.標的化配列が、17ヌクレオチドを有する、実施形態183に記載のgRNA。
実施形態188.標的化配列が、16ヌクレオチドを有する、実施形態183に記載のgRNA。
実施形態189.標的化配列が、15ヌクレオチドを有する、実施形態183に記載のgRNA。
実施形態190.疾患の治療を必要とする対象においてそれを行う方法であって、治療有効量の、(a)実施形態29~75及び180のいずれか1つに記載の操作されたクラス2、V型CRISPRタンパク質と、(b)実施形態25~28及び181~189のいずれか1つに記載のgRNAと、を含む組成物を、対象に投与することを含む、方法。
実施形態191.疾患を有する対象の治療のための医薬品として使用するための、(a)実施形態29~75及び180のいずれか1つに記載の操作されたクラス2、V型CRISPRタンパク質と、(b)実施形態25~28及び181~189のいずれか1つに記載のgRNAと、を含む、組成物。
以下の実施例は、単に例示的なものであり、本開示のいかなる態様をいかなる形でも限定することを意味するものではない。
実施例1:CasXバリアント構築物の生成
CasX488構築物(表9の配列)を生成するために、コドン最適化CasX119構築物(Planctomycetes CasX(配列番号2)をコードし、アミノ酸置換及び欠失を有するCasX Stx2構築物に基づく)を、標準的なクローニング方法を使用して目的のプラスミド(pStX)にクローニングした。CasX491構築物(表9の配列)を生成するために、コドン最適化CasX484構築物(Planctomycetes CasX配列番号2をコードし、特定のアミノ酸の置換及び欠失を有し、NLSに融合され、ガイド配列及び非標的化配列に連結された、CasX Stx2構築物に基づく)を、標準的なクローニング方法を使用して目的のプラスミド(pStX)にクローニングした。標準的なクローニング方法を使用して、構築物CasX 1(CasX配列番号1)を目的のベクターにクローニングした。CasX488を構築するために、CasX 119構築物DNAを、適切なユニバーサルプライマーを使用して、製造業者のプロトコルに従ってQ5 DNAポリメラーゼを使用して、2つの反応でPCR増幅した。CasX491を構築するために、コドン最適化CasX484構築物DNAを、適切なプライマーを使用して、製造業者のプロトコルに従ってQ5 DNAポリメラーゼを使用して、2つの反応でPCR増幅した。CasX 1構築物を、適切なユニバーサルプライマーを使用して、製造業者のプロトコルに従ってQ5 DNAポリメラーゼを使用して、2つの反応でPCR増幅した。各PCR産物を、製造業者のプロトコルに従ってZymocleanゲルDNA回収キットを使用して、1%アガロースゲル(Gold Bio カタログ番号A-201-500)からのゲル抽出によって精製した。次いで、製造業者のプロトコルに従って、Gibsonアセンブリ(New England BioLabs カタログ番号E2621S)を使用して、対応する断片をつなぎ合わせた。pStx1において構築された産物を、化学的にコンピテントなTurboコンピテントE.coli細菌細胞に形質転換し、カナマイシンを含有するLB寒天プレート上にプレーティングした。個々のコロニーを採取し、製造業者のプロトコルに従ってQiagenスピンミニプレップキットを使用してミニプレップした。得られたプラスミドを、サンガー配列決定を使用して配列決定して、正しい構築を確認した。次いで、正しいクローンを、制限酵素クローニングを使用して、哺乳動物発現ベクターpStx34にサブクローニングした。pStx1におけるpStx34骨格、並びにCasX488及び491クローンを、それぞれXbaI及びBamHIで消化した。消化した骨格及びそれぞれの挿入断片を、製造業者のプロトコルに従ってZymocleanゲルDNA回収キットを使用して、1%アガロースゲル(Gold Bioカタログ番号A-201-500)からのゲル抽出によって精製した。次いで、製造業者のプロトコルに従ってT4リガーゼ(New England Biolabs カタログ番号M0202L)を使用して、きれいな骨格及びインサートを一緒にライゲーションした。ライゲーション産物を、化学的にコンピテントなTurboコンピテントE.coli細菌細胞に形質転換し、カルベニシリンを含有するLB寒天プレート上にプレーティングした。個々のコロニーを採取し、製造業者のプロトコルに従ってQiagenスピンミニプレップキットを使用してミニプレップした。得られたプラスミドを、サンガー配列決定を使用して配列決定して、正しい構築を確認した。
CasX515(表9の配列)を構築するために、CasX491構築物DNAを、適切なプライマーを使用して、製造業者のプロトコルに従ってQ5 DNAポリメラーゼを使用して、2つの反応でPCR増幅した。CasX527(表9の配列)を構築するために、CasX491構築物DNAを、適切なプライマーを使用して、製造業者のプロトコルに従ってQ5 DNAポリメラーゼを使用して、2つの反応でPCR増幅した。PCR産物を、製造業者のプロトコルに従ってZymocleanゲルDNA回収キットを使用して、1%アガロースゲルからのゲル抽出によって精製した。pStX骨格を、プラスミドpStx56における2部位間のDNAの2931塩基対断片を除去するために、XbaI及びSpeIを使用して消化した。消化した骨格断片を、製造業者のプロトコルに従ってZymocleanゲルDNA回収キットを使用して、1%アガロースゲルからのゲル抽出によって精製した。次いで、製造業者のプロトコルに従ってGibsonアセンブリ(New England BioLabs カタログ番号E2621S)を使用して、挿入断片及び骨格断片をつなぎ合わせた。pStx56において構築された産物を、化学的にコンピテントなTurboコンピテントE.coli細菌細胞に形質転換し、カナマイシンを含有するLB寒天プレート上にプレーティングした。個々のコロニーを採取し、製造業者のプロトコルに従ってQiagenスピンミニプレップキットを使用してミニプレップした。得られたプラスミドを、サンガー配列決定を使用して配列決定して、正しい構築を確認した。pStX34は、タンパク質マーカー並びにピューロマイシン及びカルベニシリンの両方の選択マーカーのためのEF-1αプロモーターを含む。pStX56は、タンパク質マーカー並びにピューロマイシン及びカナマイシンの両方の選択マーカーのためのEF-1αプロモーターを含む。目的の遺伝子を標的化する標的化配列をコードする配列を、CasX PAMの位置に基づいて設計した。標的配列及びこの配列の逆相補体からなる、一本鎖DNA(single-stranded DNA、ssDNA)オリゴ(Integrated DNA Technologies)としての標的配列DNAを注文した。これらの2つのオリゴを、一緒にアニールし、プラスミドのためのT4 DNAリガーゼ及び適切な制限酵素を使用して、Golden Gateアセンブリによって、個々に又はバルクで、pStXにクローニングした。Golden Gate産物を、NEB TurboコンピテントE.coli(NEB カタログ番号C2984I)などの化学的又は電気的にコンピテントな細胞に形質転換し、適切な抗生物質を含有するLB寒天プレートにプレーティングした。個々のコロニーを採取し、製造業者のプロトコルに従ってQiaprepスピンミニプレップキットを使用してミニプレップした。得られたプラスミドを、サンガー配列決定を使用して配列決定して、正しいライゲーションを確認した。
CasX535~537(表9の配列)を構築するために、CasX515構築物DNAを、製造業者のプロトコルに従ってQ5 DNAポリメラーゼを使用して、各構築物について2つの反応でPCR増幅した。CasX535については、適切なプライマーを増幅に使用した。CasX536については、適切なプライマーを使用した。CasX537については、適切なプライマーを使用した。PCR産物を、製造業者のプロトコルに従ってZymocleanゲルDNA回収キットを使用して、1%アガロースゲルからのゲル抽出によって精製した。pStX骨格を、プラスミドpStx56における2部位間のDNAの2931塩基対断片を除去するために、XbaI及びSpeIを使用して消化した。消化した骨格断片を、製造業者のプロトコルに従ってZymocleanゲルDNA回収キットを使用して、1%アガロースゲルからのゲル抽出によって精製した。次いで、製造業者のプロトコルに従ってGibsonアセンブリを使用して、挿入断片及び骨格断片をつなぎ合わせた。pStx56において構築された産物を、化学的にコンピテントなTurboコンピテントE.coli細菌細胞に形質転換し、カナマイシンを含有するLB寒天プレート上にプレーティングした。個々のコロニーを採取し、製造業者のプロトコルに従ってQiagenスピンミニプレップキットを使用してミニプレップした。得られたプラスミドを、サンガー配列決定を使用して配列決定して、正しい構築を確認した。pStX34は、タンパク質マーカー並びにピューロマイシン及びカルベニシリンの両方の選択マーカーのためのEF-1αプロモーターを含む。pStX56は、タンパク質マーカー並びにピューロマイシン及びカルベニシリンの両方の選択マーカーのためのEF-1αプロモーターを含む。目的の遺伝子を標的化する標的化配列をコードする配列を、CasX PAMの位置に基づいて設計した。標的配列及びこの配列の逆相補体からなる、一本鎖DNA(ssDNA)オリゴ(Integrated DNA Technologies)としての標的配列DNAを注文した。これらの2つのオリゴを、一緒にアニールし、プラスミドのためのT4 DNAリガーゼ及び適切な制限酵素を使用して、Golden Gateアセンブリによって、個々に又はバルクで、pStXにクローニングした。Golden Gate産物を、NEB TurboコンピテントE.coliなどの化学的又は電気的にコンピテントな細胞に形質転換し、適切な抗生物質を含有するLB寒天プレートにプレーティングした。個々のコロニーを採取し、製造業者のプロトコルに従ってQiaprepスピンミニプレップキットを使用してミニプレップした。得られたプラスミドを、サンガー配列決定を使用して配列決定して、正しいライゲーションを確認した。
全てのその後のCasXバリアント、例えば、CasX544及びCasX660~664、668、670、672、676、及び677を、変異特異的内部プライマー並びにユニバーサルフォワード及びリバースプライマー(設計された変異特異的プライマー並びに使用されたCasX基本構築物がそれらの間の違いであった)を用いるGibsonアセンブリを使用して、上記と同じ方法論を使用してクローニングした。SaCas9及びSpyCas9対照プラスミドを、pStXのタンパク質及びガイド領域をそれぞれのタンパク質及びガイドに交換して、上記のpStXプラスミドと同様に調製した。SaCas9及びSpyCas9の標的化配列は、文献から得たか、又は確立された方法に従って合理的に設計した。
CasX構築物の発現及び回収を、標準的な方法論を使用して実施し、以下のように要約する。
精製
凍結試料を、磁気撹拌しながら4℃で一晩解凍した。得られた溶解物の粘度を音波処理によって低下させ、NanoDeBEE(BEE International)を使用して、20,000PSIで2回通してホモジナイズすることによって溶解を完了させた。溶解物を、50,000×g、4℃で30分間の遠心分離によって清澄化し、上清を回収した。清澄化した上清を、AKTA Pure FPLC(Cytiva)を使用して、ヘパリン6 Fast Flowカラム(Cytiva)に適用した。カラムを、5カラム体積(CV)のヘパリン緩衝液A(50mM HEPES-NaOH、250mM NaCl、5mM MgCl2、0.5mM TCEP、10%グリセロール、pH8)で洗浄し、次いで、3CVのヘパリン緩衝液B(NaCl濃度を500mMに調整した緩衝液A)で洗浄した。タンパク質を、1.75CVのヘパリン緩衝液C(NaCl濃度を1Mに調整した緩衝液A)で溶出した。溶出液を、FPLCを使用して、StrepTactin HPカラム(Cytiva)に適用した。カラムを、10 CVのStrep緩衝液(50mM HEPES-NaOH、500mM NaCl、5mM MgCl2、0.5mM TCEP、10%グリセロール、pH8)で洗浄した。タンパク質を、2.5mMデスチオビオチンを添加した1.65CVのStrep緩衝液を使用して、カラムから溶出した。CasX含有画分をプールし、50kDaカットオフの遠心濃縮器(Amicon)を使用して4℃で濃縮し、Superdex 200pgカラム(Cytiva)でのサイズ排除クロマトグラフィーによって精製した。カラムを、SEC緩衝液(25mM リン酸ナトリウム、300mM NaCl、1mM TCEP、10%グリセロール、pH7.25)で平衡化し、FPLCによって操作した。適切な分子量で溶出したCasX含有画分をプールし、50kDaカットオフ遠心濃縮器を使用して4℃で濃縮し、アリコートし、液体窒素中で急速凍結した後、-80℃で保存した。
CasXバリアント488:平均収量は、コロイドクーマシー染色によって評価して、98.8%純度で、培養物1リットル当たり2.7mgの精製CasXタンパク質であった。
CasXバリアント491:平均収量は、コロイドクーマシー染色によって評価して、99.4%純度で、培養物1リットル当たり12.4mgの精製CasXタンパク質であった。
CasXバリアント515:平均収量は、コロイドクーマシー染色によって評価して、純度90%で培養物1リットル当たり7.8mgの精製CasXタンパク質であった。
CasXバリアント526:平均収量は、93%純度で、培養物1リットル当たり13.79mgであった。純度は、コロイドクーマシー染色によって評価した。
CasXバリアント668:平均収量は、93%純度で、培養物1リットル当たり3.32mgであった。純度は、コロイドクーマシー染色によって評価した。
CasXバリアント672:平均収量は、88%純度で、培養物1リットル当たり6.50mgであった。純度は、コロイドクーマシー染色によって評価した。
CasXバリアント676:平均収量は、92%純度で、培養物1リットル当たり5.05mgであった。純度は、コロイドクーマシー染色によって評価した。
CasXバリアント677:平均収量は、81%純度で、培養物1リットル当たり2.93mgであった。純度は、コロイドクーマシー染色によって評価した。
実施例2:RNAガイドの生成
RNAシングルガイド及び標的化配列を生成するために、Q5ポリメラーゼ、各骨格に対する鋳型プライマー、並びにT7プロモーター及び標的化配列を有する増幅プライマーを用いてPCRを行うことによって、インビトロ転写のための鋳型を生成した。T7プロモーターに対するDNAプライマー配列、ガイド及び標的化配列のためのガイド及び標的化配列を、以下の表10に示す。sg1、sg2、sg32、sg64、sg174、及びsg235は、それぞれ配列番号4、5、2104、2106、2238、及び2292に対応するが、但し、sg2、sg32、及びsg64は、転写効率を増加させるために追加の5’Gで改変した(表10の配列を表2と比較されたい)。7.37標的化配列は、β2-ミクログロブリン(beta2-microglobulin、B2M)を標的化する。PCR増幅後、鋳型をきれいにし、フェノール-クロロホルム-イソアミルアルコール抽出によって単離し、続いて、エタノール沈殿を行った。
インビトロ転写を、50mM Tris pH8.0、30mM MgCl、0.01%Triton X-100、2mMスペルミジン、20mM DTT、5mM NTP、0.5μM鋳型、及び100μg/mL T7 RNAポリメラーゼを含有する緩衝液中で行った。反応物を、37℃で一晩インキュベートした。1mLの転写容量当たり20単位のDNase I(Promega #M6101)を添加し、1時間インキュベートした。RNA産物を、変性PAGEによって精製し、エタノール沈殿し、1×リン酸緩衝生理食塩水に再懸濁した。sgRNAをフォールディングするために、試料を、5分間70℃に加熱し、次いで、室温に冷却した。反応物に最終濃度が1mMになるようにMgClを補充し、5分間50℃に加熱し、次いで、室温に冷却した。最終RNAガイド産物を、-80℃で保存した。
実施例3:ガイドRNAに対する結合親和性の評価
精製された野生型及び改良型CasXを、塩化マグネシウム並びに非特異的結合及び凝集を防止するためのヘパリンを含有する低塩緩衝液中で、3’側にCy7.5部分を含有する合成シングルガイドRNAとインキュベートする。sgRNAは、10pMの濃度で維持し、タンパク質は、別個の結合反応で、1pMから100μMまで滴定する。反応を平衡に到達させた後、試料を、それぞれタンパク質及び核酸に結合するニトロセルロース膜及び正に荷電したナイロン膜を用いた真空マニホールド膜結合アッセイにかける。膜を画像化して、ガイドRNAを同定し、結合RNA対非結合RNAの割合を、各タンパク質濃度についてニトロセルロース膜対ナイロン膜上の蛍光量によって決定して、タンパク質-sgRNA複合体の解離定数を計算する。実験はまた、これらの変異が野生型及び変異体タンパク質に対するガイドの親和性にも影響を及ぼすかどうかを判定するために、sgRNAの改良型バリアントを用いて実施される。本発明者らはまた、電気移動度シフトアッセイを実施して、膜結合アッセイと定性的に比較し、凝集ではなく可溶性結合が、タンパク質-RNA会合への主要な寄与因子であることを確認する。
実施例4:標的DNAに対する結合親和性の評価
精製された野生型及び改良CasXは、標的核酸に相補的な標的化配列を有するシングルガイドRNAと複合体化する。RNP複合体を、塩化マグネシウム並びに非特異的結合及び凝集を防止するためのヘパリンを含有する低塩緩衝液中で、PAM及び標的鎖上の5’側にCy7.5部分を有する適切な標的核酸配列を含有する二本鎖標的DNAとインキュベートする。標的DNAは、1nMの濃度で維持し、一方、RNPは、別個の結合反応で、1pMから100μMまで滴定する。反応を平衡に到達させた後、試料を、未変性5%ポリアクリルアミドゲル上で泳動して、結合及び非結合標的DNAを分離する。ゲルを画像化して、標的DNAの移動度シフトを同定し、結合対非結合DNAの割合を、各タンパク質濃度について計算して、RNP-標的DNA三元複合体の解離定数を決定する。
実施例5:インビトロでの差次的PAM認識の評価。[図の番号にはSCRB-038を使用]
1.参照バリアント及びCasXバリアントの比較
本質的に実施例8に記載されるように、インビトロ切断アッセイを、sg174.7.37と複合体化したCasX2、CasX119、及びCasX438を使用して実施した。7.37スペーサー及びTTC、CTC、GTC、又はATC PAMのいずれかを有する蛍光標識されたdsDNA標的を使用した(配列は表11)。0.25、0.5、1、2、5、10、30、及び60分の時点をとった。ゲルをCytiva Typhoonで画像化し、IQTL 8.2ソフトウェアを使用して定量化した。各標的上の各CasX: sgRNA複合体について、非標的鎖切断の見かけの一次速度定数(k切断-)を決定した。非TTC PAMを有する標的についての速度定数を、TTC PAM標的と比較して、各PAMについての相対優先度が所与のタンパク質バリアントにおいて変化したかどうかを決定した。
全てのバリアントについて、TTC標的が最も高い切断速度を支持し、続いてATC標的、次いでCTC標的、最後にGTC標的であった(図10A~図10D、表12)。CasXバリアント及びNTC PAMの各組み合わせについての切断速度k切断を示す。全ての非NTC PAMについて、そのバリアントのTTC速度と比較した相対切断速度を括弧内に示す。全ての非TTC PAMは、切断速度の大幅な減少(全てについて>10倍)を示した。特定のバリアントについての所与の非TTC PAMの切断速度とTTC PAMの切断速度との間の比は、全てのバリアントにわたって概して一貫したままであった。CTC標的は、TTC標的の3.5~4.3%の速さで切断を支持し、GTC標的は、1.0~1.4%の速さで切断を支持し、ATC標的は、6.5~8.3%の速さで切断を支持した。例外は491であり、ここでは、TTC PAMでの切断速度が速すぎて正確な測定ができず、これは、TTCと非TTC PAMとの間の見かけの差を人為的に減少させる。測定可能な範囲内に入るGTC、CTC、及びATC PAMに対する491の相対速度を比較すると、非TTC PAM間で比較した場合、他のバリアントのものと同等の比が得られ、これは、タンデムで増加する速度と一致する。全体として、バリアント間の差異は、様々なNTC PAMに対する相対優先度が変化していることを示唆するほど大きくはない。しかしながら、バリアントの基底切断速度がより高いため、ATC又はCTC PAMを有する標的が10分以内にほぼ完全に切断され、見かけのk切断は、TTC PAM上のCasX2のk切断と同等か、又はそれよりも大きい(表12)。この切断速度の増加は、ヒト細胞における有効なゲノム編集に必要な閾値を超えている可能性があり、これらのバリアントに対するPAMの柔軟性が明らかに増加していることを説明する。
各々のPAM配列は太字である。TS-標的鎖。NTS-非標的鎖。
2.単一CasXバリアントを使用したPAM認識の比較
材料及び方法:7.37スペーサー及びTTC、CTC、GTC、ATC、TTT、CTT、GTT、又はATT PAMのいずれかを有する蛍光標識されたdsDNA標的を使用した(配列は表13)。5’アミノ改変を有するオリゴを注文し、標的鎖オリゴについてはCy7.5 NHSエステルで標識し、非標的鎖オリゴについてはCy5.5 NHSエステルで標識した。オリゴを1:1の比で1×切断緩衝液(20mM Tris HCl pH7.5、150mM NaCl、1mM TCEP、5%グリセロール、10mM MgCl2)中で混合し、10分間95℃に加熱し、溶液を室温に冷却することによって、dsDNA標的を形成した。
CasXバリアント491を、sg174.7.37と複合体化した。ガイドを、1×切断緩衝液で1.5μMの最終濃度に希釈し、次いで、タンパク質を、1μMの最終濃度に添加した。RNPを、37°Cで10分間インキュベートし、次いで、氷上に置いた。
切断アッセイは、RNPを切断緩衝液で200nMの最終濃度に希釈し、dsDNA標的を10nMの最終濃度に添加することによって行った。0.25、0.5、1、2、5、及び10分の時点をとり、等量の95%ホルムアミド及び20mM EDTAを添加することによってクエンチした。切断産物を、10%尿素-PAGEゲル上で泳動することによって分離した。ゲルをAmersham Typhoonで画像化し、IQTL 8.2ソフトウェアを使用して定量化した。非標的鎖切断の見かけの一次速度定数(k切断-)を、GraphPad Prismを使用して各標的について決定した。
結果:
様々なPAMに対する491.174 RNPの相対切断速度を調べた。細胞における標的及び潜在的なオフターゲットの切断効率の予測を助けることに加えて、これらのデータにより、合成標的の切断速度を調整することが可能になる。自己標的化を可能にするために新しいプロトスペーサーをベクター内に加えることができる自己制限AAVベクターの場合、本発明者らは、PAMを変化させることによってエピソームの切断速度を上下に調節することができると推論した。
本発明者らは、PAMを除いて配列が同一である様々なdsDNA基質に対するRNPの切断速度を試験した。この実験設定は、PAM認識をスペーサー配列及びゲノムの状況から生じる効果を複雑にするのではなく、PAM自体の効果の単離を可能にするはずである。全てのNTC及びNTT PAMを試験した。予想通り、RNPは、TTC PAMを有する標的を最も迅速に切断し、第1の時点までに本質的に全てを生成物に変換した(図11A)。CTCは、およそ半分の速さで切断されたが、TTCの急速な切断により、より幅広い切断速度を捕捉するように最適化されたこれらのアッセイ条件下で、正確なk切断を決定することが困難になる(図11A、表14)。GTC標的は、NTC PAMの中で最もゆっくりと切断され、切断速度はTTC標的よりもおよそ6倍遅かった。全てのNTT PAMは、全てのNTC PAMよりもゆっくりと切断され、TTTが最も効率的に切断され、GTTがそれに続いた(図11B、表14)。全てのNTC PAMと比較して低いGTCの切断速度と比較した、全てのNTT PAM間のGTT切断の相対的な効率は、個々のPAMヌクレオチドの認識が状況依存的であり、PAMにおけるある位置でのヌクレオチド同一性が、他の位置での配列優先度に影響を及ぼすことを実証する。
ここで試験したPAM配列は、同じスペーサー配列で切断活性を依然として維持しながら、3桁にわたる切断速度を生じる。これらのデータは、所与の合成標的における切断速度が、関連するPAMを変化させることによって容易に改変され得、自己切断活性の調節を可能にして、AAVエピソームの切断及び排除の前にゲノム標的の効率的な標的化を可能にすることを実証する。
各dsDNA基質を生成するために使用したDNA配列を示す。各々のPAM配列は太字である。TS-標的鎖。NTS-非標的鎖。

TTC切断の速度は、このアッセイの分解能を超えるので、得られたk-切断は、下限として解釈されるべきである。
実施例6:二本鎖切断についてのヌクレアーゼ活性の評価
精製された野生型及び操作されたCasXバリアントは、固定されたHRS標的化配列を有するシングルガイドRNAと複合体化する。RNP複合体を、100nMの最終濃度でMgCl2を含む緩衝液に添加し、10nMの濃度で標的鎖又は非標的鎖のいずれかの5’側にCy7.5標識を有する二本鎖標的DNAとインキュベートする。反応物のアリコートを固定された時点で採取し、等量の50mM EDTA及び95%ホルムアミドの添加によってクエンチする。試料を、変性ポリアクリルアミドゲル上で泳動して、切断されたDNA基質と切断されていないDNA基質とを分離する。結果を可視化し、野生型及び操作されたバリアントによる標的及び非標的鎖の切断速度を決定する。標的結合に対する変化と核酸分解反応自体の触媒速度との間をより明確に区別するために、タンパク質濃度を10nM~1uMの範囲にわたって滴定し、切断速度を各濃度で決定して、偽ミカエリス-メンテン適合を生成し、kcat及びKMを決定する。KMの変化は変化した結合を示し、kcatの変化は変化した触媒を示す。
実施例7:PASSアッセイによる異なるPAM配列特異性のCasXタンパク質バリアントの同定。
CasXタンパク質2(配列番号2)、491、515、533、535、668、及び672のPAM配列特異性を同定するために実験を実施した。これを達成するために、HEK293細胞株であるPASS_V1.01又はPASS_V1.02を、少なくとも2回の反復実験で、上記のCasXタンパク質で処理し、次世代配列決定(NGS)を実施して、意図された標的部位で様々なスペーサーを使用して、編集の割合(%)を計算した。
材料及び方法:PASSシステムを使用してクローンタンパク質バリアントをアッセイするために、多重化プールアプローチをとった。簡潔には、2つのプールされたHEK293細胞株を生成し、PASS_V1.01及びPASS_V1.02と名付けた。プール内の各細胞は、特定の標的部位と対になったゲノムに組み込まれたシングルガイドRNA(sgRNA)を含んでいた。タンパク質発現構築物のトランスフェクション後、特定のスペーサーによる特定の標的での編集を、NGSによって定量化することができる。各ガイド-標的対は、CasX-ガイドRNP複合体の活性、特異性、及び標的化能に関するデータを提供するように設計された。
対のスペーサー-標的配列は、Twist Biosciencesによって合成され、等モルプールのオリゴヌクレオチドとして入手した。このプールを、PCRによって増幅し、Golden Gateクローニングによってクローニングして、p77と名付けられたプラスミドの最終ライブラリを生成した。各プラスミドは、GFP発現エレメントとともに、sgRNA発現エレメント及び標的部位を含んでいた。sgRNA発現エレメントは、gRNA足場174(配列番号2238)の転写を駆動するU6プロモーター、続いて、ガイド及びCasXバリアントのRNPを意図された標的部位に標的化するスペーサー配列からなった。250個の可能な固有の、対のスペーサー-標的合成配列を設計及び合成した。次いで、レンチウイルスのプールを、製造業者の説明書に従ってLentiX産生システム(Takara Bio USA,Inc)を使用して、このプラスミドライブラリから産生した。次いで、得られたウイルス調製物を、qPCRによって定量化し、単一コピーの組み込みを生成するように、低い感染多重度で標準HEK293細胞株に形質導入した。次いで、得られた細胞株を、蛍光活性化細胞選別(fluorescence-activated cell sorting、FACS)によって精製して、PASS_V1.01又はPASS_V1.02の産生を完了した。次いで、細胞株を、6ウェルプレート形式で播種し、2連で、水で処理するか、又は2μgのプラスミドp67でトランスフェクトし、製造業者の説明書に従ってLipofectamineトランスフェクション試薬(ThermoFisher)によって送達した。プラスミドp67は、SV40核局在化配列でタグ付けされたCasXタンパク質の発現を駆動するEF-1αプロモーターを含む。2日後、処理した細胞を回収し、溶解させ、ゲノムDNA単離キット(Zymo Research)を使用して、ゲノムDNAを抽出した。次いで、ゲノムDNAをカスタムプライマーを用いてPCR増幅して、Illumina NGSと適合性のアンプリコンを生成し、NextSeq機器で配列決定した。試料リードを逆多重化し、品質についてフィルタリングした。次いで、編集結果メトリック(インデルを有するリードの割合)を、処理された試料にわたって、各スペーサー-標的合成配列について定量化した。
CasXタンパク質に対するPAM配列特異性を評価するために、4つの異なるPAM配列に対する編集結果メトリックを分類した。TTC PAM標的部位について、48個の異なるスペーサー-標的対を定量化した(ATC PAM、CTC PAM、及びGTC PAM標的部位について、14、22、及び11個の個々の標的部位をそれぞれ定量化した)。いくつかのCasXタンパク質については、反復実験を数ヶ月間にわたって数十回繰り返した。これらの実験の各々について、平均編集効率を上記のスペーサーの各々について計算した。次いで、PAM配列の4つのカテゴリにわたる平均編集効率を、これらの測定値の標準偏差とともに、全てのかかる実験から計算した。
結果:表15は、PAMカテゴリにわたる平均編集効率及びCasXタンパク質バリアントにわたる平均編集効率を、これらの測定値の標準偏差とともに列挙する。各カテゴリの測定回数も示されている。これらのデータは、操作されたCasXバリアント491及び515が、正準PAM配列TTCに特異的である一方、CasXの他の操作されたバリアントが、試験したPAM配列において多かれ少なかれ効率的に機能したことを示す。特に、CasX491についてのPAM優先度の平均順位は、CasX515についてTTC>>ATC>CTC>GTC、又はTTC>>ATC>GTC>CTCであるが、野生型CasX2は、TTC>>GTC>CTC>ATCの平均順位を示す。より低い編集のPAM配列については、これらの平均測定値の誤差が大きいことに留意されたい。対照的に、CasXバリアント535、668、及び672は、TTC>CTC>ATC>GTCの順位で、かなり広いPAM認識を有する。最後に、CasX533は、WT CasXと比較して、完全に並べ替えられた順位ATC>CTC>>GTC>TTCを示す。これらのデータを使用して、目的の標的DNA配列に対して最大限に活性な治療用CasX分子を操作することができる。
実験の条件下で、配列TTC、ATC、CTC、又はGTCのPAMに関連する標的DNA配列でのヒト細胞における二本鎖DNA切断について改善されたCasXタンパク質のセットが同定された。これは、CasXバリアントが、比較して、PAM特異性の範囲が変化したことを支持している。
実施例8:CasX: gRNAインビトロ切断アッセイ
1.RNPの構築
精製された野生型並びにCasX及びシングルガイドRNA(sgRNA)のRNPを、実験の直前に調製するか、又は調製して後で使用するために液体窒素中で瞬間凍結し、-80℃で保存した。RNP複合体を調製するために、CasXタンパク質をsgRNAと1:1.2のモル比でインキュベートした。簡潔には、sgRNAを、緩衝液#1(25mM NaPi、150mM NaCl、200mMトレハロース、1mM MgCl2)に添加し、次いで、CasXを、sgRNA溶液にゆっくりとかき混ぜながら添加し、37°Cで10分間インキュベートして、RNP複合体を形成する。RNP複合体を、使用前に200μLの緩衝液#1で予め湿らせた0.22μmのCostar 8160フィルターを通して濾過した。必要に応じて、RNP試料を、0.5mL Ultra 100-Kdカットオフフィルター(Millipore パーツ番号UFC510096)を用いて、所望の容量が得られるまで濃縮した。コンピテントRNPの形成を以下に記載するように評価した。
2.野生型参照CasXと比較したタンパク質バリアントの切断コンピテント画分の決定
参照CasXと比較して活性RNPを形成するCasXバリアントの能力を、インビトロ切断アッセイを使用して決定した。切断アッセイのためのβ-2ミクログロブリン(B2M)7.37標的を以下のように生成した。5’蛍光標識(それぞれ、LI-COR IRDye 700及び800)を有する配列TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(非標的鎖、NTS(配列番号1069))及びAGCGCGAGCACAGCTAAGGCCACGGAGCGAGACATCTCGGCCCGAATGCTGTCAGCTTCA(標的鎖、TS(配列番号1068))を有するDNAオリゴを購入した。オリゴを1:1の比で1×切断緩衝液(20mM Tris HCl pH7.5、150mM NaCl、1mM TCEP、5%グリセロール、10mM MgCl)中で混合し、95℃に10分間加熱し、溶液を室温に冷却することによって、dsDNA標的を形成させた。
CasX RNPを、1×切断緩衝液(20mM Tris HCl pH7.5、150mM NaCl、1mM TCEP、5%グリセロール、10mM MgCl2)中で、最終濃度が1μMの示されたCasX及びガイド(グラフを参照されたい)(特に明記しない限り、1.5倍過剰の示されたガイド)を用いて、37℃で10分間再構成した後、使用するまで氷に移した。7.37標的を、7.37標的に相補的なスペーサーを有するsgRNAとともに使用した。
切断反応物を、100nMの最終RNP濃度及び100nMの最終標的濃度で調製した。反応を37℃で行い、7.37標的DNAを添加することによって反応を開始した。アリコートを、5、10、30、60、及び120分で採取し、95%ホルムアミド、20mM EDTAに添加することによってクエンチした。試料を、95℃で10分間加熱することによって変性させ、10%尿素-PAGEゲル上で泳動した。ゲルを、LI-COR Odyssey CLxで画像化し、LI-COR Image Studioソフトウェアを使用して定量化するか、又はCytiva Typhoonで画像化し、Cytiva IQTLソフトウェアを使用して定量化した。得られたデータをプロットし、Prismを使用して分析した。本発明者らは、化学量論量未満の酵素が、延長された時間スケール下であっても化学量論量を超える量の標的を切断することができず、代わりに、存在する酵素の量に比例するプラトーに近づくという観察によって示されるように、CasXが、アッセイ条件下で、本質的に単一代謝回転酵素として作用すると仮定した。したがって、等モル量のRNPによって長い時間スケールにわたって切断された標的の画分は、RNPのどの画分が適切に形成され、切断に対して活性であるかを示す。切断反応がこの濃度レジーム下で単相性から明らかに逸脱するので、切断トレースを二相性速度モデルに適合させ、3つの独立した反復の各々についてプラトーを決定した。平均値及び標準偏差を計算して、活性画分を決定した(表16)。
図1に示されるように、CasX2+ガイド174+7.37スペーサー、CasX119+ガイド174+7.37スペーサー、CasX457+ガイド174+7.37スペーサー、CasX488+ガイド174+7.37スペーサー、及びCasX491+ガイド174+7.37スペーサーについて形成されたRNPについて、見かけの活性(コンピテント)画分を決定した。表16に、得られた活性画分を示す。全てのCasXバリアントは、野生型CasX2よりも高い活性画分を有し、これは、操作されたCasXバリアントが、野生型CasXと比較して、試験条件下で同一のガイドを有する有意により活性で安定なRNPを形成することを示している。これは、sgRNAに対する親和性の増加、sgRNAの存在下での安定性若しくは溶解度の増加、又は操作されたCasX: sgRNA複合体の切断コンピテント立体構造の安定性の増加に起因する可能性がある。RNPの溶解度の増加は、CasX2と比較して、CasX457、CasX488、又はCasX491がsgRNAに添加された場合、形成される観察された沈殿物の顕著な減少によって示された。
3.インビトロ切断アッセイ-参照シングルガイドと比較したシングルガイドバリアントについての切断コンピテント画分の決定
図2及び表16に示されるように、CasX2.2.7.37、CasX2.32.7.37、CasX2.64.7.37、及びCasX2.174.7.37についても同じプロトコルを使用して切断コンピテント画分を決定したところ、16±3%、13±3%、5±2%、及び22±5%であった。
ガイドの第2のセットを異なる条件下で試験して、RNPの形成に対するガイドの寄与をより良好に単離した。7.37スペーサーを有するガイド174、175、185、186、196、214、及び215を、以前のように過剰なガイドではなく、ガイドについて1μM及びタンパク質について1.5μMの最終濃度でCasX491と混合した。図3及び表16に、その結果を示す。これらのガイド制限条件下で、これらのガイドの多くは、174を上回る更なる改善を示し、174の場合の80±9%と比較して、185及び196は、それぞれ91±4%及び91±1%のコンピテント画分を達成した。
これらのデータは、CasXバリアント及びsgRNAバリアントの両方が、野生型CasX及び野生型sgRNAと比較して、ガイドRNAを有するより高度の活性RNPを形成できることを示す。
野生型参照CasXと比較したCasXバリアント119、457、488、及び491の見かけの切断速度を、標的7.37の切断についてのインビトロ蛍光アッセイを使用して決定した。
4.インビトロ切断アッセイ-野生型参照CasXと比較したCasXバリアントのk切断の決定
CasX RNPを、1×切断緩衝液(20mM Tris HCl pH7.5、150mM NaCl、1mM TCEP、5%グリセロール、10mM MgCl)中で、最終濃度が1μMの示されたCasX(図4を参照)及び1.5倍過剰の示されたガイドを用いて、37℃で10分間再構成した後、使用するまで氷に移した。切断反応を、200nMの最終RNP濃度及び10nMの最終標的濃度で設定した。反応を、特に断りのない限り、37℃で行い、標的DNAを添加することによって反応を開始した。アリコートを、0.25、0.5、1、2、5、及び10分で採取し、95%ホルムアミド、20mM EDTAに添加することによってクエンチした。試料を、95℃で10分間加熱することによって変性させ、10%尿素-PAGEゲル上で泳動した。ゲルを、LI-COR Odyssey CLxで画像化し、LI-COR Image Studioソフトウェアを使用して定量化するか、又はCytiva Typhoonで画像化し、Cytiva IQTLソフトウェアを使用して定量化した。得られたデータをプロットし、Prismを使用して分析し、各CasX: sgRNAの組み合わせの個別の反復について、非標的鎖切断の見かけの一次速度定数(k切断)を決定した。表16に、独立した適合による3回の反復の平均値及び標準偏差を示し、図5に、切断トレースを示す。
見かけの切断速度定数を、野生型CasX2、並びに各アッセイで利用したガイド174及びスペーサー7.37を有するCasXバリアント119、457、488、及び491について決定した(表16及び図4を参照)。全てのCasXバリアントは、野生型CasX2と比較して、改善された切断速度を有した。CasX457は、上で決定されたように、より高いコンピテント画分を有するにもかかわらず、119よりもゆっくりと切断した。CasX488及びCasX491は、かなりの差で最も高い切断速度を有した。標的は最初の時点でほぼ完全に切断され、真の切断速度はこのアッセイの分解能を超えるので、報告されたk切断は下限として解釈されるべきである。
これらのデータは、CasXバリアントがより高いレベルの活性を有し、k切断速度が、野生型CasX2と比較して少なくとも30倍高くなることを示す。
5.インビトロ切断アッセイ:野生型ガイドとガイドバリアントとの比較。
また、野生型参照CasX2及び参照ガイド2を用いて切断アッセイを実施し、ガイドバリアント32、64、及び174と比較して、バリアントが切断を改善したかどうかを決定した。実験は上記のように実施した。得られたRNPの多くは、試験した時間内に標的の完全な切断に近づかなかったので、本発明者らは、一次速度定数ではなく初期反応速度(V0)を決定した。最初の2つの時点(15秒及び30秒)を、各CasXsgRNAの組み合わせ及び反復について線形適合した。3回の反復について、傾きの平均値及び標準偏差を決定した。
アッセイ条件下で、ガイド2、32、64、及び174を有するCasX2のV0は、20.4±1.4nM/分、18.4±2.4nM/分、7.8±1.8nM/分、及び49.3±1.4nM/分であった。(表16、並びに図5及び図6を参照)。ガイド174は、得られたRNPの切断速度の大幅な改善(2に対して約2.5倍、図6を参照のこと)を示したが、ガイド32及び64は、ガイド2と同様の又はそれよりも劣る機能を示した。注目すべきことに、ガイド64は、ガイド2のものよりも低い切断速度を支持するが、インビボでは、はるかに良好に機能する(データは示さず)。ガイド64を生成するためのいくつかの配列の改変は、三重鎖形成に関与するヌクレオチドを犠牲にして、インビボで転写を改善する可能性が高い。ガイド64の改善された発現は、インビボでのその改善された活性を説明する可能性が高く、一方、その減少した安定性は、インビトロで不適切なフォールディングを導く可能性がある。
スペーサー7.37を有するガイド174、175、185、186、196、214、及び215、並びにCasX491を用いて更なる実験を実施して、相対切断速度を決定した。本発明者らのアッセイで測定可能な範囲まで切断速度を減少させるために、切断反応物を10℃でインキュベートした。結果を図7及び表16に示す。これらの条件下では、215は、174よりも速い切断速度を支持する唯一のガイドであった。196は、ガイド制限条件下でRNPの最も高い活性画分を示し、174と本質的に同じ動態を有し、異なるバリアントが異なる特徴の改善をもたらすことを再度強調した。
これらのデータは、アッセイの条件下で、ガイドバリアントをCasXとともに使用すると、その大部分が、野生型ガイドを有するものよりも高いレベルの活性を有するRNPをもたらし、約2倍~6倍超の範囲の切断初速度の改善を伴うことを支持する。表16の番号は、左から右に、RNP構築物のCasXバリアント、sgRNA足場、及びスペーサー配列を示す。以下の表で、RNP構築物名は、左から右に、CasXタンパク質バリアント、ガイド足場、及びスペーサーが示されている。
6.インビトロ切断アッセイ:参照2.2に対する515.174及び526.174の切断速度及びコンピテント画分の比較。
本発明者らは、操作されたシングルガイドバリアント174と複合体化した操作されたタンパク質CasXバリアント515及び526を、参照野生型タンパク質2(配列番号2)及び最小限に操作されたガイドバリアント2(配列番号5)と比較したいと考えた。1.5倍過剰のガイドを用いて、上記のようにRNP複合体を構築した。k切断及びコンピテント画分を決定するための切断アッセイを上記のように実施し(両方とも37℃で実施)、異なる時点を使用して、反応がほぼ完了するのに必要な時間が有意に異なるため、野生型対操作されたRNPについてのコンピテント画分を決定した。
得られたデータは、タンパク質及びガイドの両方を操作することによって、RNPの活性が劇的に改善したことを明らかに実証する。515.174及び526.174のRNPは、2.2の16%と比較して、それぞれ76%及び91%のコンピテント画分を有した(図8、表16)。動態アッセイにおいて、515.174及び526.174の両方は、第1の時点までに本質的に全ての標的DNAを切断し、アッセイの分解能を超え、それぞれ17.10及び19.87分-1の推定切断速度をもたらした(図9、表16)。対照的に、2.2のRNPは、最後の10分の時点までに平均60%未満の標的DNAを切断し、操作されたRNPよりもほぼ2桁低い推定k切断を有する。タンパク質及びガイドに対して行われた改変は、より安定であり、活性粒子を形成する可能性がより高く、粒子毎にはるかに効率的にDNAを切断するRNPをもたらした。

平均値及び標準偏差
**速度がアッセイの分解能を超えている
実施例9:インビトロでの切断動態に対するスペーサー長の効果の試験
様々な長さのスペーサーを有する2つのCasXバリアント及びガイドRNAのリボ核タンパク質複合体(RNP)を、インビトロでの切断活性について試験して、どのスペーサー長が標的核酸の最も効率的な切断を支持するか、及びスペーサー長の優先度がタンパク質によって変化するかどうかを決定した。
方法:
様々な長さのスペーサーを有するCasX及びガイドRNAのリボ核タンパク質複合体(RNP)を、インビトロでの切断活性について試験して、どのスペーサー長が標的核酸の最も効率的な切断を支持するかを決定した。
CasXバリアント515及び526を上記のように精製した。足場174(配列番号2238)を有するガイドを、インビトロ転写(in vitro transcription、IVT)によって調製した。IVT鋳型は、推奨プロトコルに従って、Q5ポリメラーゼ(NEB M0491)、各足場骨格のための鋳型オリゴ、並びにT7プロモーター及び7.37スペーサーを有する20ヌクレオチドの増幅プライマー(GGCCGAGATGTCTCGCTCCG(配列番号1084);tdTomato)又は3’末端から短縮された18若しくは19ヌクレオチドの増幅プライマーを使用して、PCRによって生成した。表17に、スペーサー配列並びに各鋳型を生成するために使用したオリゴヌクレオチドを示す。次いで、得られた鋳型は、T7 RNAポリメラーゼを使用して、標準的なプロトコルに従ってRNAガイドを生成した。変性ポリアクリルアミドゲル電気泳動を使用してガイドを精製し、使用前にリフォールディングした。
CasX RNPは、CasXを1μMになるように1×切断緩衝液(20mM Tris HCl pH7.5、150mM NaCl、1mM TCEP、5%グリセロール、10mM MgCl)に希釈し、sgRNAを1.2μMになるように添加し、37℃で10分間インキュベートすることによって再構成した後、使用するまで氷に移す。蛍光標識された7.37標的DNAを、Integrated DNA Technologiesから個々のオリゴヌクレオチドとして購入し(配列は表17)、dsDNA標的を、1×切断緩衝液中の2つの相補鎖の等モル混合物を加熱し、室温までゆっくりと冷却することによって調製した。
RNPを、最終濃度が200nMになるように切断緩衝液に希釈し、振盪せずに10℃でインキュベートした。7.37標的DNAを、最終濃度が10nMになるように添加することによって、切断反応を開始した。0.25、0.5、1、2、5、10、及び30分の時点をとった。等量の95%ホルムアミド、20mM EDTAを添加することによって、時点をクエンチした。試料を、95℃で10分間加熱することによって変性させ、10%尿素-PAGEゲル上で泳動した。ゲルをAmersham Typhoonで画像化し、IQTLソフトウェアで分析した。得られたデータをプロットし、Prismを使用して分析した。非標的鎖の切断を単一の指数関数に適合させて、見かけの一次速度定数(k切断)を決定した。
結果:
18、19、又は20ヌクレオチドのスペーサーを有するsgRNAと複合体化したCasXバリアント515及び526の切断速度を比較して、どのスペーサー長が各タンパク質バリアントについて最も効率的な切断をもたらすかを決定した。インビトロ転写されたsgRNAを用いて実施した他の実験と一致して、18ntスペーサーガイドは、両方のタンパク質バリアントについて最も良好に機能した(図12A及び図12B、表18)。18ntスペーサーは、タンパク質515の場合、20ntスペーサーよりも1.4倍速く、タンパク質526の場合、20ntスペーサーよりも3倍速かった。19ntスペーサーは、両方のタンパク質に対して中間の活性を有したが、ここでも、差異はバリアント526に対してより顕著であった。一般に、20ntよりも短いスペーサーは、様々なタンパク質、スペーサー、及び送達方法にわたって増加した活性を有することが観察されているが、改善の程度及び最適なスペーサー長は異なっている。これらのデータは、配列が非常に類似している(2残基のみが異なる)2つの操作されたタンパク質が、方向は類似しているが程度が大幅に異なるスペーサー長の結果として、活性の変化を有し得ることを示す。
実施例10:ガイドRNAに対する結合親和性の評価
精製された野生型及び改良型CasXを、塩化マグネシウム並びに非特異的結合及び凝集を防止するためのヘパリンを含有する低塩緩衝液中で、3’側にCy7.5部分を含有する合成シングルガイドRNAとインキュベートする。sgRNAは、10pMの濃度で維持し、タンパク質は、別個の結合反応で、1pMから100μMまで滴定する。反応を平衡に到達させた後、試料を、それぞれタンパク質及び核酸に結合するニトロセルロース膜及び正に荷電したナイロン膜を用いた真空マニホールド膜結合アッセイにかける。膜を画像化して、ガイドRNAを同定し、結合RNA対非結合RNAの割合を、各タンパク質濃度についてニトロセルロース膜対ナイロン膜上の蛍光量によって決定して、タンパク質-sgRNA複合体の解離定数を計算する。実験はまた、これらの変異が野生型及び変異体タンパク質に対するガイドの親和性にも影響を及ぼすかどうかを判定するために、sgRNAの改良型バリアントを用いて実施される。本発明者らはまた、電気移動度シフトアッセイを実施して、膜結合アッセイと定性的に比較し、凝集ではなく可溶性結合が、タンパク質-RNA会合への主要な寄与因子であることを確認する。
実施例11:標的DNAに対する結合親和性の評価
精製された野生型及び改良CasXは、標的核酸に相補的な標的化配列を有するシングルガイドRNAと複合体化する。RNP複合体を、塩化マグネシウム並びに非特異的結合及び凝集を防止するためのヘパリンを含有する低塩緩衝液中で、PAM及び標的鎖上の5’側にCy7.5部分を有する適切な標的核酸配列を含有する二本鎖標的DNAとインキュベートする。標的DNAは、1nMの濃度で維持し、一方、RNPは、別個の結合反応で、1pMから100μMまで滴定する。反応を平衡に到達させた後、試料を、未変性5%ポリアクリルアミドゲル上で泳動して、結合及び非結合標的DNAを分離する。ゲルを画像化して、標的DNAの移動度シフトを同定し、結合対非結合DNAの割合を、各タンパク質濃度について計算して、RNP-標的DNA三元複合体の解離定数を決定する。実験は、参照CasX及び参照gRNAを含むRNPと比較して、CasXバリアント及びgRNAバリアントを含むRNPの改善された結合親和性を実証すると予想される。
実施例12:RNP産生のためのCasXバリアントの改善された発現及び溶解度特徴の評価
野生型及び改変型CasXバリアントを、同一条件下で、BL21(DE3)E.coliで発現させる。全てのタンパク質は、IPTG誘導性T7プロモーターの制御下にある。細胞を、TB培地で、37℃で0.6のODまで増殖させ、その時点で増殖温度を16℃に低下させ、0.5mMのIPTGを添加することによって発現を誘導する。発現の18時間後、細胞を回収する。可溶性タンパク質画分を抽出し、SDS-PAGEゲル上で分析する。可溶性CasXの発現の相対レベルを、クーマシー染色によって同定する。タンパク質を上記のプロトコルに従って並行して精製し、純粋なタンパク質の最終収量を比較する。精製されたタンパク質の溶解度を決定するために、タンパク質が沈殿し始めるまで、構築物を保存緩衝液中で濃縮する。沈殿したタンパク質を遠心分離によって除去し、可溶性タンパク質の最終濃度を測定して、各バリアントの最大溶解度を決定する。最後に、CasXバリアントを、シングルガイドRNAと複合体化し、沈殿が始まるまで濃縮する。沈殿したRNPを遠心分離によって除去し、可溶性RNPの最終濃度を測定して、ガイドRNAに結合した場合の各バリアントの最大溶解度を決定する。
実施例13:ガイドRNAガイド足場プラットフォーム進化
二本鎖DNA(dsDNA)切断について改善された活性を示すガイドRNAガイド足場バリアントを同定するために実験を実施した。これを達成するために、足場バリアントの大規模ライブラリを設計し、ヒト細胞におけるレポーター遺伝子の機能的ノックアウトについてプール様式で試験した。ノックアウトの改善につながる足場バリアントは、プール内の機能的エレメントを配列決定し、その後コンピュータで分析することによって決定した。
材料及び方法
ライブラリ設計
RNA二次構造の安定性の評価
RNAfold(v2.4.14)(Lorenz R,et al.ViennaRNA Package 2.0.Algorithms Mol Biol.6:26(2011))を使用して、Jarmoskaite I.,et al.A quantitative and predictive model for RNA binding by human pumilio proteins.Mol Cell.74(5): 966(2019)において行われたものと同様に、RNA配列の二次構造の安定性を予測した。ΔΔG_BC値を評価するために、制約のないアンサンブルのアンサンブル自由エネルギー(ΔG)を計算し、次いで、制約のあるアンサンブルのアンサンブル自由エネルギー(ΔG)を計算した。ΔΔG_BCは、制約のあるΔG値と制約のないΔG値との差である。シュードノットステム、足場ステム、及び伸長ステムの塩基形成を反映し、三重鎖の塩基が対合しないことを必要とする制約ストリングを使用した。
シュードノットステム二次構造安定性の計算
シュードノットの構造安定性を、ガイド足場175由来の三重鎖ループ配列を使用して、3~33位にわたるステムループ全体について計算した。更に、シュードノット塩基の対形成及び三重鎖ループにおける塩基対解消を強制する制約ストリングを生成した。したがって、安定性の変化は、シュードノットステムの配列の違いのみによる可能性がある。例えば、シュードノット配列AAAACG_CGTTTTは、三重ループ配列CUUUAUCUCAUUACUUUGA(配列番号158)を挿入することによってステムループ配列に変えられ、その結果、最終配列はAAAACGCUUUAUCUCAUUACUUUGACGTTTT(配列番号159)となり、制約ストリングは、「((((((xxxxxxxxxxxxxxxxxxx))))))」(配列番号160、式中、x=n)であった。
分子生物学
ライブラリ構築の分子生物学
ガイドRNA足場バリアントの設計されたライブラリを合成し、Twist Biosciencesから入手し、次いで、ライブラリに特異的なプライマーを用いてPCRによって増幅した。これらのプライマーは、制限酵素SapIの配列認識部位を導入するために、ライブラリの5’末端及び3’末端の追加の配列を増幅する。PCRは、Q5 DNAポリメラーゼ(New England Biolabs)を用いて行い、製造業者の説明書に従って行った。典型的なPCR条件は、50μLの反応中、10ngの鋳型ライブラリDNA、1×Q5 DNAポリメラーゼ緩衝液、300nM dNTP、300nMの各プライマー、0.25μLのQ5 DNAポリメラーゼであった。サーマルサイクラーでは、典型的なプログラムは、次のサイクルである:95℃で5分間;次いで、98℃で15秒間、65℃で20秒間、72℃で1分間を20サイクル;72℃で2分間の最終伸長。増幅したDNA産物を、DNA Clean and Concentratorキット(Zymo Research)で精製した。次いで、このPCRアンプリコン並びにプラスミドpKB4を、制限酵素SapI(New England Biolabs)で消化し、両方を、独立して、製造業者の説明書に従って、アガロースゲル電気泳動、続いて、ゲル抽出(Zymo)によってゲル精製した。次いで、ライブラリを、T4 DNAリガーゼ(New England Biolabs)を使用してライゲーションし、DNA Clean and Concentratorキット(Zymo)で精製し、MegaX DH10B T1Rエレクトロポレーション細胞(ThermoFisher Scientific)に形質転換した(全て製造業者の説明書に従った)。形質転換したライブラリを、SOC培地中で1時間回復させ、次いで、5mLの2xyt培地で、振盪しながら37℃で一晩増殖させた。次いで、培養物から、プラスミドDNAをミニプレップした(QIAGEN)。次いで、プラスミドDNAを、制限酵素Esp3I(New England Biolabs)で消化することによって更にクローニングし、続いて、相補的な一本鎖DNAオーバーハング及びGFPを標的化するための所望のスペーサー配列を有するアニールしたオリゴヌクレオチドとライゲーションした。5’リン酸化修飾を有するオリゴヌクレオチドを、95℃で1分間加熱した後、25℃の最終温度に達するまで、1分当たり2度温度を下げることによってアニールした。Golden Gateアセンブリ反応として連結を行った。ここで、典型的な反応条件は、総体積40μLの水中、1μgの予め消化したプラスミドライブラリ、1μMのアニールしたオリゴヌクレオチド、2μLのT4 DNAリガーゼ、2μLのEsp3I、及び1×T4 DNAリガーゼ緩衝液からなった。反応を、37℃で3分間と16℃で5分間との間で、25サイクル行った。上記のように、ライブラリを精製し、形質転換し、一晩増殖させ、ミニプレップした。次いで、得られたプラスミドのライブラリを、レンチウイルスの産生に使用した。
ライブラリのスクリーニング
LVの産生
レンチウイルス粒子は、24時間前に播種した70~90%コンフルエントのLentiX HEK293T細胞をトランスフェクトすることによって生成した。プールしたライブラリを含むプラスミドを、無血清培地中で、ポリエチレンイミンを用いて、パッケージング及びVSV-Gエンベローププラスミドを含む第2世代レンチウイルスシステムに導入した。粒子を産生するために、トランスフェクションの12時間後に培地を交換し、トランスフェクションの36~48時間後にウイルスを回収する。ウイルス上清を、0.45μmのPES膜フィルターを使用して濾過し、必要に応じて、標的細胞に添加する前に細胞培養培地に希釈した。
濾過の72時間後、レンチウイルス上清のアリコートを、TaqMan qPCRによって滴定した。ウイルスゲノムRNAを、フェノール-クロロホルム抽出(TRIzol)、続いて、アルコール沈殿を使用して単離した。抽出の品質及び量を、ナノドロップ読み取りによって評価した。次いで、ThermoFischer SuperScript IV逆転写酵素によるcDNA産生の直前に、あらゆる残留プラスミドDNAをDNase Iで消化した。ウイルスcDNAを、1:1000の段階希釈に供し、WPREベースのプライマー及びTaqManマスターミックスと組み合わせた後、Bio-Rad CFX96によるqPCRを行った。全ての試料希釈液を、二連で添加し、平均した後、既知のプラスミドベースの標準曲線に対して力価を計算する。常に水を陰性対照として測定する。
LVのスクリーニング(形質導入、維持、ゲーティング、選別、gDNA単離)
細胞分裂が確実に起こるように、形質導入の24~48時間前に、標的レポーター細胞を継代する。形質導入の時点で、細胞をトリプシン処理し、カウントし、適切な密度に希釈した。細胞を、二重のレンチウイルス組み込みを最小化するために、低いMOI(0.1~5、ウイルスゲノムによる)で、無処理のライブラリ又は対照を含むニートレンチウイルス上清で再懸濁した。レンチウイルス-細胞混合物を、40~60%コンフルエントで播種した後、37℃、5%COでインキュベートした。形質導入の48時間後、形質導入が上手くいった細胞を、4~6日で1~3μg/mLのピューロマイシンで選択し、その後、HEKで、又はFb培地中で回収した。
選択後、細胞を、4’,6-ジアミジノ-2-フェニルインドール(DAPI)及びリン酸緩衝生理食塩水(PBS)に懸濁した。次いで、細胞を、CorningストレーナーキャップFACSチューブ(製品352235)により濾過し、Sony MA900で選別した。標準的な方法による単一の生細胞のゲーティングに加えて、蛍光レポーターのノックダウンについて細胞を選別した。実験からの選別した細胞を、溶解し、製造業者のプロトコルに従って、Zymo Quick-DNAミニプレッププラスを使用してゲノムを抽出した。
次世代配列決定(NGS)のための処理
ゲノムDNAを、ガイドRNAをコードするDNAに特異的なプライマーを用いて、PCRによって増幅して、標的アンプリコンを形成した。これらのプライマーは、Illuminaリード及び2つの配列を導入するために5’末端に追加の配列を含む。典型的なPCR条件は、50μLの反応中、2μgのgDNA、1×Kapa Hifi緩衝液、300nM dNTP、300nMの各プライマー、0.75μlのKapa HifiホットスタートDNAポリメラーゼである。サーマルサイクラーで、95℃で5分間、次いで、98℃で15秒間、62℃で20秒間、72℃で1分間を15サイクル、72℃で2分間の最終伸長のサイクルを行う。増幅されたDNA産物を、Ampure XP DNAクリーンアップキットで精製する。第2のPCRステップは、Illuminaプラットフォーム上での多重化を可能にするために、インデックス化アダプターを用いて行った。前のステップからの20μLの精製産物を、50μLの反応中、1×Kapa GC緩衝液、300nM dNTP、200nMの各プライマー、0.75μLのKapa Hifi Hotstart DNAポリメラーゼと組み合わせた。サーマルサイクラーで、95℃で5分間、次いで、98℃で15秒間、65℃で15秒間、72℃で30秒間を5~16サイクル、72℃で2分間の最終伸長のサイクルを行う。増幅されたDNA産物を、Ampure XP DNAクリーンアップキットで精製する。Fragment Analyzer DNA分析キット(Agilent、dsDNA 35~1500bp)を使用して、アンプリコンの品質及び定量化を評価した。アンプリコンを、製造業者の説明書に従って、Illumina Miseq(v3、150サイクルのシングルエンド配列決定)で配列決定した。
NGS分析(試料処理及びデータ分析)
リードを、cutadapt(バージョン2.1)を用いてアダプター配列についてトリミングし、ガイド配列(足場配列及びスペーサー配列を含む)を、各リードについて抽出した(また、cutadapt v2.1連結アダプターを使用して、上流アンプリコン配列と下流アンプリコン配列との間の配列を抽出した)。固有のガイドRNA配列をカウントし、次いで、各足場配列を、設計された配列のリスト並びにガイド足場174(配列番号2238)及び175(配列番号2239)の配列と比較して、それぞれの同一性を決定した。
各固有のガイドRNA配列についてのリードカウントを、平均正規化を使用して、配列決定深度について正規化した。濃縮は、各GFP試料における正規化リードカウントを、関連するナイーブ試料における正規化リードカウントで割ることによって、各配列について計算した。両方の選択(R2及びR4)について、GFP集団及びナイーブ集団を、3回の別々の日にNGSのために処理し、各足場の濃縮値を3連で形成した。三連にわたってナイーブ試料及びGFP試料についてのリードカウントを合計した後、足場当たりの全体的な濃縮スコアを計算した。
異なる選択からの2つの濃縮スコアを、ナイーブ集団内のそれらの相対提示によって重み付けされた個々のlog濃縮スコアの加重平均によって組み合わせた。
log濃縮スコアの誤差を推定し、三連の試料にわたる平均濃縮スコアの95%信頼区間を計算した。これらの誤差は、2つの別個の選択に対する濃縮値を組み合わせる場合に伝播する。
結果及び考察
ライブラリ設計、注文、及びクローニング
RNA足場に対する変動を試験するために、偏りのない様式、及びRNA足場内の重要なモジュールに焦点を当てた標的を絞った様式の両方で、ガイドRNAバリアントのライブラリを設計した。
ライブラリの偏りのない部分では、ガイド足場174(配列番号2238)及び175(配列番号2239)配列番号)及び(配列番号)(約2800個の個々の配列)の各残基に対して設計した。二重変異体は、相互作用している可能性がある領域に特に焦点を当てるように設計した。従って、CryoEM構造(PDBid:6NY2)において、2つの残基が正準又は非正準塩基対形成相互作用に関与するか、又は2つの残基がRNAfold(v2.4.14)によって予測された最低エネルギーの構造において対形成すると予測された場合、ガイド足場174及び174における対応する残基を変異させた(両方の残基の全ての可能な置換、挿入、及び欠失を含む)。これらの「相互作用」残基に隣接する残基も変異させた。しかしながら、これらについては、2つの残基の各々の置換のみが含まれた。最終ライブラリでは、ガイド足場174又は175に対して2つの変異を有する約27,000配列を設計した。
RNA足場の重要な領域の特異的変異誘発に充てられたライブラリの部分において、シュードノット領域、三重鎖領域、足場バブル、及び伸長ステムに対して改変を設計した(領域の識別については図18を参照)。ライブラリのこれらの標的化されたセクションの各々において、仮説駆動型の様式で、全ドメインを変異誘発した(図19)。例として、三重鎖領域について、三重鎖を含む塩基トリプレットの各々を、異なる三重鎖形成モチーフに変異誘発した(図20を参照されたい)。このタイプの変異誘発は、バブルを取り囲む塩基の全ての可能な置換が変異誘発された(すなわち、ガイド配列174又は175に対して最大5つの変異を有する)足場ステムバブルにおいて用いられたものとは異なる。これに対して、シュードノットステムを含む5塩基対は、別のワトソン-クリック対形成配列で完全に置換された(最大10個の異なる塩基が変異誘発された)。
ライブラリの最終標的化セクションは、タンパク質の結合に適した二次構造を形成する可能性がより高い配列について最適化することを意味した。要するに、配列の二次構造の安定性は、1)任意の制約の不在下、2)シュードノットステム、足場ステム、及び伸長ステムなどの重要な二次構造エレメントが形成されるように制約された、2つの条件下で予測された(材料及び方法を参照)。本発明者らの仮説は、これらの2つの条件間の安定性の差(本明細書において、ΔΔG_BCと呼ばれる)が、タンパク質の結合により適した配列について最小であり、したがって、この差が最小である配列を探索する必要があるというものであった。
設計されたライブラリを、Twist(約40,000個の異なる配列)から注文し、タンパク質STX119も発現するレンチウイルスプラスミド骨格にクローニングするためのgolden gate部位を含むように合成した(材料及び方法を参照)。GFP遺伝子を標的化するスペーサー配列をライブラリベクターにクローニングし、GFP遺伝子を標的化するために各RNA足場バリアントから単一ガイドRNAを効果的に生成した。設計したライブラリバリアントの提示を、次世代配列決定を用いて評価した(材料及び方法を参照)。
ライブラリのスクリーニング及び評価
ガイドRNAバリアント及び単一CasXタンパク質(バージョン119)を含有するプラスミドライブラリをレンチウイルス粒子に作製した(材料及び方法を参照)。qPCRアッセイ(材料及び方法を参照)を使用して、ウイルスゲノムのコピー数に基づいて、粒子を滴定した。GFPを安定して発現する細胞株に、レンチウイルス粒子のライブラリを低い感染多重度(MOI)で形質導入して、各細胞が多くても1つのライブラリメンバーを組み込むことを強制した。細胞プールは、ゲノム組み込みを有する細胞のみを保持するように選択した。最後に、細胞集団をGFP発現について選別し、GFP陰性細胞の集団を得た。これらのGFP陰性細胞は、CasX RNPをGFPタンパク質に効果的に標的化するライブラリメンバーを含み、インデル及びその後の機能喪失を引き起こした。
選別されていない(「ナイーブ」)細胞集団及びGFP陰性集団からのゲノムDNAを処理して、各細胞においてガイドRNAライブラリメンバーの配列を単離した。ナイーブ集団及びGFP陰性集団におけるガイドRNAの提示を決定するために、次世代配列決定を行った。濃縮スコアは、GFP集団におけるライブラリメンバーの提示をナイーブ集団におけるその提示で割ることによって、各ライブラリメンバーについて計算した:高い濃縮スコアは、開始プールよりも活性なGFP陰性集団においてはるかに頻度が高く、したがって、GFP遺伝子内でインデルを効果的に生成することができる活性バリアントである(濃縮値>1、log濃縮>0)ライブラリメンバーを示す。低い濃縮スコアは、ナイーブと比較して活性GFP集団において枯渇しており、したがって、インデルの形成において効果的でない(濃縮値<1、log濃縮<0)ライブラリメンバーを示す。比較のための最終統計として、相対濃縮値を、(GFP陰性対ナイーブ集団における)ライブラリメンバーの濃縮を(GFP陰性対ナイーブ集団における)参照足場配列の濃縮で割ったものとして計算した。(対数空間では、これらの値は単に差し引かれる)。図21に、参照骨格配列の濃縮値を示す。
レンチウイルス粒子の独立した産生、細胞の形質導入、ナイーブ集団及びGFP陰性集団を得るための選択及び選別、並びに各ライブラリメンバーの濃縮値を知るための配列決定を用いて、スクリーニングを複数回行った。これらのスクリーニングはR2及びR4と呼ばれ、ガイド足場174及び175上の単一ヌクレオチドバリアントについて得られた濃縮値を主に再現する(図22)。スクリーニングは、機能的GFP集団において濃縮された変異の多くの可能な組み合わせを同定することができ、したがって、機能的RNPをもたらし得る。対照的に、非標的化スペーサーを含むガイドは濃縮されておらず、濃縮が選択的カットオフであることが確認された(データは示さず)。ガイド足場174及び175上の濃縮された変異の完全なセットを、それぞれ表19及び20に示す。これらのリストは、標的化された機能的RNPを依然として達成することができる配列多様性を明らかにする。
単一ヌクレオチド変異は、足場の変異可能領域を示す。
ガイド足場174及び175と比較して類似の活性又は改善された活性をもたらす足場変異を決定するために、単一ヌクレオチド置換、挿入、又は欠失の濃縮値をプロットした(図23)。概して、174上の単一ヌクレオチド変化は、175よりも耐性であり、おそらく、この状況における174のより高い活性、したがって、活性を弱める変異に対するより高い耐性を反映している(図21及び図24)。有利であった175上の単一ヌクレオチド変異はまた、大多数の場合において174の状況においても有利であり(図24)、したがって、足場175上の変異についての値は、変異効果のより厳密な読み出しであると解釈された。以下の段落に記載されるように、この分析によって重要な変異可能領域が明らかになった。
最も注目すべき特徴は、伸長ステムであり、これは、参照配列174又は175と同様の濃縮値を示した。これは、足場が、過去に見られたものと同様に、この領域における変化を許容することができ、CasX RNPの構造解析によって、伸長ステムがタンパク質とほとんど接触しないように見られると予測されることを示唆している。
三重ループは、特にガイド足場175(例えば、特にC15又はC17への変異)において作製された場合、参照足場と比較して高い濃縮を示した別の領域であった。特に、175におけるC17位は、足場174において既にGに変異しており、これは、足場175に対するこの位置での2つの高度に濃縮された変異のうちの1つである。
G7とA29との間のシュードノットステムにおける予測された対のいずれかのメンバーに対する変化は、特にガイド足場175において、参照と比較して両方とも高度に濃縮された。この対は、非正準Gである。ガイド足場174及び175の両方における対形成。足場175におけるこれらの位置で最も強く濃縮された変異は、A29をC又はTに変換した。その1つ目は、正準ワトソン-クリック対(G7: C29)を形成し、その2つ目は、GUゆらぎ対(G7: U29)を形成する。これらは両方とも、Gと比較してヘリックスの安定性を増加させることが予想され得る。A対と比較して、ヘリックスの安定性を増加させることが予想され得る。G7のTへの変換も高度に濃縮された。これは、この位置で正準対(U7: A29)を形成する。明らかに、これらの位置は、より安定な対形成に有利である。概して、5’末端は変異可能であり、脱濃縮をもたらす変化はほとんどなかった。
最後に、ガイド足場175における54位でのCの挿入は、高度に濃縮されたが、ガイド足場174における類似の位置でのA又は挿入されたGのいずれかの欠失は、両方とも参照と同様の濃縮値を有した。総合すると、ガイド足場は、この足場ステムバブル中に2つのヌクレオチドを有することを好む可能性があるが、それは強い優先度ではない可能性がある。これらの結果を、以下のセクションで更に検討する。
シュードノットステムの安定性は、足場の活性に不可欠である。
足場活性に対するシュードノットステムの効果を更に調査するために、シュードノットステムを以下の方法で改変した:(1)ステム内の塩基対をシャフルして、それぞれの新しいシュードノットが同じ組成の塩基対を有するが、ステム内の順序が異なるようにし、(2)塩基対をランダムなWC対配列で完全に置換した。291個のシュードノットステムを試験した。第1のセットの配列の分析は、G-A対が、他の可能な位置(2~6;野生型配列において、それは5位にある;図25)と比較して、シュードノットステムの第1の位置にあることに対する強い優先度を示すが、結果は、シュードノットステムにおける2~6位の各々にGA対を有することが一般的に好ましくなく、平均濃縮度が低いことを実証する。1位にG-A塩基を有することは、ヘリックスの残りがスタッキング(ワトソン-クリック対のみ)から形成することを可能にすることによって、シュードノットステムを安定化する可能性がある。この結果は、足場が完全に対形成したシュードノットステムを好むことを更に支持する。
かなりの数のシュードノット配列が正のlog濃縮を有しており、この配列を別の塩基対で置換することが概して許容されることを示唆した(図26のシュードノット構造)。シュードノットステムにおけるより安定なヘリックスがより活性な足場をもたらすという仮説を更に試験するために、各シュードノットステムの二次構造安定性を計算した(材料及び方法)。シュードノット安定性と濃縮(したがって、活性)との間に強い関係が観察され(図27:より活性な足場が安定なシュードノットステムを有する)、安定なシュードノットステム(<-7kcal/mol)を有するガイド足場は高い濃縮を有し、不安定化したシュードノットステム(≧-3kcal/mol)を有するガイド足場は非常に低い濃縮を有した。
二重変異は、ガイド足場の変異可能領域を示す。
各参照ガイド足場に対する二重変異を調べて、足場内の変異可能領域、及び足場活性を改善するための潜在的な変異を更に同定した。非正準Gを形成すると予測される7位及び29位の単一対のみに焦点を当てる。シュードノットステムにおける対は、変異誘発を支持する(上記のセクションを参照)-本発明者らは、この位置の対について全64個の二重変異をプロットすることができる(図28)。正準対は、これらの2つの位置で有利である(例えば、7位でのCの置換及び29位でのGの置換は、G: C対を生成し、濃縮される;7位でのCの置換及び29位でのGの挿入は、同様にG: C対を生じる、7位でのAの置換及び29位でのUの置換は、A: U対を生成する)。挿入の対は濃縮されなかった。それはおそらく、ヘリックスにおいてG:A対が1つ上の位置に移動し、完全に除去されていないことを考慮すると、ここに正準対を挿入しても、ヘリックスを安定化するには十分ではないためである。驚くべきことに、いくつかの濃縮された二重変異、例えば、7位でのUの置換及び29位でのCの置換(非標準U: C対を形成する)、7位でのUの置換及び29位でのUの置換(U: U対を形成する)、並びに他のいくつかは、正準対を形成していなかった(図28)。プリン: プリン対は、他の非正準対よりもヘリックスに対して実質的により破壊的である。実際、7位でのAの置換及び29位でのGの置換は、再びA: G対を形成し、この位置では濃縮されていないG対。
ガイド足場175の重要な構造エレメントの各々内の二重置換の濃縮値を、各位置が最大3つの置換を有し得るヒートマップから決定した。足場ステムが変異に対して最も耐性が低いことが決定され、この領域における配列が強く制約されていることを示唆した。
これらの結果は、ガイド足場に実質的な変更を加えることができ、編集アッセイで利用される場合でも機能的遺伝子のノックアウトを引き起こし得ることを示している。特に、結果は、足場内のシュードノットステムの二次構造安定性の増加を含む、ガイド足場における改変を通して活性を改善するために利用され得る重要な位置を実証する。

変異配列は、「;」で区切られており、配列毎の複数の変異は、「,」で区切られている。

変異配列は、「;」で区切られており、配列毎の複数の変異は、「,」で区切られている。
実施例14:CcdB選択アッセイは、TTC、ATC、及びCTC PAM配列での改善されたdsDNA切断又は改善されたスペーサー特異性を有するCasXタンパク質バリアントを同定する
生化学的にコンピテントであり、TTC又はATC又はCTCのいずれかのPAM配列に関連する標的DNA配列での二本鎖DNA(dsDNA)切断についてCasX515と比較して改善された活性又は改善されたスペーサー特異性を示す、CasX515(配列番号416)に由来するバリアントのセットを同定するために実験を行った。これを達成するために、まず、CasX515及びガイド足場174を使用したCcdB選択実験において、バックグラウンドレベルを上回る生存を有するスペーサーのセットを同定した。第二に、これらのスペーサーを用いてCcdB選択を実施して、正準の「野生型」PAM配列であるTTCでのdsDNA切断に対して生化学的にコンピテントであるCasX515に由来するバリアントのセットを決定した。第三に、CcdB選択実験を行って、ATC型又はCTC型のいずれかのPAM配列での改善されたdsDNA切断を可能にするCasX515のバリアントのセットを決定した。第四に、プラスミド対抗選択実験を行って、スペーサー特異性の改善をもたらすCasX515に由来するバリアントのセットを決定した。
材料及び方法:
CcdB選択実験の場合、示されたCasXタンパク質(又はライブラリ)及びsgRNAを発現する300ngのプラスミドDNA(p73)を、CcdB毒性タンパク質を発現するプラスミドを保有するE.coli株BW25113にエレクトロポレーションした。形質転換後、培養物を、グルコースリッチ培地中で、37℃で20分間回復させた。その後、IPTGを、最終濃度が1mMになるように添加し、培養物を、更に40分間更にインキュベートした。次いで、回収した培養物を、プラスミドに選択的な抗生物質を含有するLB寒天プレート(Teknova カタログ番号L9315)で滴定した。細胞を、グルコース(CcdB毒素が発現されない)又はアラビノース(CcdB毒素が発現される)のいずれかを含有するプレートで滴定し、相対生存率を計算し、図32に示されるようにプロットした。次に、培養物をエレクトロポレーションし、上記のように回収し、回収物の画分を、滴定用に保存した。回収した培養物の残りを、回復期間後に分割し、グルコース又はアラビノースのいずれかを含有する培地で増殖させて、プールされたライブラリの試料を、それぞれ選択なしで又は強い選択で回収した。これらの培養物を回収し、製造業者の説明書に従ってプラスミドミニプレップキット(QIAGEN)を使用して、生存プラスミドプールを抽出した。合計3ラウンドの選択について、全プロセスを繰り返した。
最終的なプラスミドプールを単離し、固有分子識別子(unique molecular identifier、UMI)に特異的なプライマーを使用して、p73プラスミドのPCR増幅を行った。これらのUMI配列は、各特異的UMIがCasX515タンパク質のただ1つの変異と関連するように設計された。網羅的変異進化(DME)と呼ばれるアプローチにおける多くの可能なアミノ酸の置換並びに可能な挿入及び単一のアミノ酸置換を含むCasX515のバリアントのプールの増幅には、典型的なPCR条件を使用した。増幅されたDNA産物を、Ampure XP DNAクリーンアップキットを用いて精製し、30μLの水に溶出した。次いで、アンプリコンを第2のPCRによる配列決定のために調製して、製造業者の説明書に従ってMiSeq機器又はNextSeq機器(Illumina)のいずれかで、次世代配列決定(NGS)に適合するアダプター配列を付加した。調製した試料のNGSを行った。返された生データファイルを以下のように処理した:(1)配列を品質及びアダプター配列についてトリミングし、(2)リード1及びリード2からの配列を単一挿入配列に重ね合わせ、(3)各配列を、CasX515の参照配列に対する変異に関連するUMIを含んでいることについて定量した。CasX515に対する個々の変異の発生率をカウントした。選択後の変異カウントを、選択前の変異カウントで割り、10の偽カウントを使用して「濃縮スコア」を生成した。このスコアの2を底とする対数(log)を計算し、図33~図36に示されるヒートマップとしてプロットした。単一のスペーサーについての生物学的反復を示す。これらの反復の平均値を計算し、全体の濃縮スコアとしてプロットした。図33に示される実験では、ライブラリを、3回実施した2つのTTC PAMスペーサー(スペーサー23.2 AGAGCGTGATATTACCCTGT、配列番号161、及び23.13 CCCTTTGACGTTGGAGTCCA、配列番号162)及び2回実施した1つのTTC PAMスペーサー(スペーサー23.11 TCCCCGATATGCACCACCGG、配列番号154)を用いたCcdB選択に通し、3回の測定の平均値を、CasX515の測定されたバリアントのヒートマップとしてlog濃縮スケール上にプロットした。CasX515と比較して、完全な切断コンピテンスを保持したCasX515のバリアントは、約0のlog濃縮値を示し、切断機能の喪失を有するバリアントは、0未満のlog値を示した。一方、この選択を使用して改善された切断を有するバリアントは、CasX515の値と比較して、0を超えるlog値をもたらした。図34~図36のヒートマップを生成するための実験は、選択性のための以下の単一スペーサー(11.2 AAGTGGCTGCGTACCACACC、配列番号163;23.27 GTACATCCACAAACAGACGA、配列番号164;及び23.19 CCGATATGCACCACCGGGTA、配列番号157)を使用して実施した。
プラスミド対抗選択実験の場合、TTC PAMスペーサーを用いたCcdB選択から得られた最終プラスミドプールに対して追加のラウンドの細菌選択を行った。対抗選択の全体的なスキームは、プラスミドの2つの集団を同時に含むE.coli細胞のみの複製を可能にすることである。第1のプラスミド(p73)は、CasXタンパク質(ATcによる誘導性発現下)及びsgRNA(構成的に発現される)、並びに抗生物質耐性遺伝子(クロラムフェニコール)を発現する。このプラスミドはまた、CcdBのような標準的な順方向選択アッセイのために使用され得、また、スペーサー配列は、実験者が望むように完全に自由に変更できることに留意されたい。第2のプラスミド(p74)は、抗生物質耐性遺伝子(カナマイシン)を発現するためにのみ機能するが、p73にコードされるスペーサーに一致する標的部位を含む(又は含まない)ように改変されている。更に、これらの標的部位は、スペーサーのRNAと標的部位のDNAとの間の非正準ワトソン-クリック塩基対形成からなる、スペーサー配列に対する「ミスマッチ」を組み込むように設計することができる。p73から発現されるRNPがp74における標的部位を切断することができる場合、細胞はクロラムフェニコールに対してのみ耐性のままである。対照的に、RNPが標的部位を切断できない場合、細胞はクロラムフェニコール及びカナマイシンの両方に対して耐性のままである。最後に、上記の二重プラスミド複製システムは2つの方法で達成することができる。連続法では、いずれかのプラスミドを最初に細胞に送達することができ、その後、株をエレクトロコンピテントにし、第2のプラスミドを送達する(両方ともエレクトロポレーションによって)。以前の研究は、プラスミド送達のいずれかの順序が、成功裏の対抗選択のために十分であることを示し、そして両方のスキームを実施した:スクリーン5と名付けられた実験では、p73は、p74を保有するコンピテント細胞にエレクトロポレーションされるが、スクリーン6では、その逆が当てはまる。培養物を、上記のように、エレクトロポレーションし、回収し、滴定し、選択条件下で1回増殖させ、プラスミドを回収し、続いて、上記のように、増幅、NGS、及び濃縮計算も行った。
最後に、追加のCcdB選択を同様の様式で行ったが、ガイド足場235並びに代替プロモーターWGAN45、Ran2、及びRan4を用いて、全てスペーサー23.2を有する毒性CcdBプラスミドを標的とした。これらのプロモーターは、上記のCcdB選択と比較してガイドRNAをより弱く発現することが予想され、したがって、細菌細胞中のCasX RNPの総濃度を減少させることが予想される。この生理学的効果は、選択的アッセイにおける細菌細胞の全生存を減少させるはずであり、したがって、濃縮スコアのダイナミックレンジを増加させ、TTC PAMスペーサー23.2におけるRNPヌクレアーゼ活性とより正確に相関する。各プロモーターについて、上記のように、3ラウンドの選択を3回で行い、各ラウンドの実験により、上記のような濃縮データが得られた。以下、これらの実験をスクリーン7と称する。
結果:
図32に示される結果は、ガイド足場174と複合体化したCasX515が、TTC PAM配列に関連するDNA配列を標的化するスペーサー(以下に列挙される)を使用して標的化した場合、CcdB発現プラスミドを切断することができることを実証する。対照的に、代替的なPAM配列を利用するスペーサーは、はるかに変動的な生存を示した。ATC PAMスペーサー(以下に列挙)は、数%から0.1%未満の生存に及んだが、CTC PAMスペーサー(以下に列挙)は、50%超から1%未満の範囲の生存を可能にした。最後に、GTC PAMスペーサー(以下に列挙)のみが、0.1%以下の生存を可能にした。これらのベンチマークデータは、この選択パイプラインの実験設計を支持し、CcdB細菌アッセイの強力な選択力を実証する。具体的には、二本鎖DNAを切断することができないCasXタンパク質は、少なくとも4桁脱濃縮されるが、切断に対して生化学的にコンピテントなCasXタンパク質は、アッセイに生き残るであろう。
図33のヒートマップを使用して、TTC PAM配列に関連する標的DNA配列でのdsDNA切断に対して生化学的にコンピテントであるCasX515のバリアントのセットを同定した。図34及び図35のヒートマップを使用して、CTCのPAM配列に関連する標的DNA配列(スペーサー11.2及び23.27)でのdsDNA切断について改善を示すバリアントを同定した。一方、図36のヒートマップは、ATCのPAM配列に関連するスペーサー(スペーサー(23.19))についての同じバリアントのセットから生成された。
図33A~図33Eの結果は、3つのTTC PAM標的部位での編集にコンピテントなCasX515のバリアントを同定し、分類する。これらの3つのデータセットは、個々に又は組み合わせてのいずれかで、バリアント間の基礎となる生化学的差異を表し、ヒトゲノム編集用の改善されたCasX治療剤の将来の操作のための目的の領域を同定する。この証拠として、タンパク質全体にわたる各位置での停止コドンの存在など、内部対照をナイーブライブラリの一部として均一に含まれた。これらの終止コドンは、選択ラウンド全体を通して失われることが一貫して観察され、部分的に短縮されたCasX515がdsDNA切断を可能にしないはずであるという予想と一致した。同様に、ヒートマップデータに反映された活性の喪失を有するバリアントは、選択中に枯渇していることが観察され、したがって、このアッセイにおける二本鎖DNA切断に対する適合性の重度の喪失を有する。しかしながら、1以上の濃縮値(及び0以上の対応するlog濃縮値)を有するバリアントは、少なくとも、生化学的切断に関して中立である。重要なことに、バリアントのこの特定のサブセットにおいて同定された変異のうちの1つ以上が、治療用分子に対して望ましい特性を示す場合、これらの変異は、生化学的機能と適合性であることが示された構造-機能相関を確立する。より具体的には、これらの変異は、CasXタンパク質の転写、翻訳、フォールディング、安定性、リボ核タンパク質(RNP)形成、PAM認識、二本鎖DNA巻き戻し、非標的鎖切断、及び標的鎖切断などの特性に影響を及ぼし得る。
図34A~図34E、図35A~図35E、及び図36A~図36Eを使用して、CTC及びATC PAM配列に関連する配列での切断に対してコンピテントなバリアントを同定し、分類した。これらのデータセットにおける濃縮されたバリアント(濃縮>1、およそ0の値のlog濃縮に等しい)は、CTC又はATC PAM標的部位の切断を特に改善する変異を表す。これらの基準を満たす変異は、変異がPAMの認識を改善することによって切断速度を改善する(1型)か、又は変異がPAM配列にかかわらず分子の全体的な切断速度を改善するか(2型)のいずれかの2つの一般的な方法で更に下位分類することができる。
1型の例として、223位での置換変異は、試験した全ての試料において数百倍濃縮されていることが見出された。この位置は、野生型参照CasXタンパク質CasX1及び2の両方でグリシンをコードする。これは、CasX1の公開されたCryoEM構造(PDB ID:6NY2)におけるDNA非標的鎖の-4ヌクレオチド位置から6.34オングストロームであると測定されている。したがって、223位におけるこれらの置換変異は、新規のPAMの変化したヌクレオチドに物理的に近位であり、DNAと直接相互作用する可能性が高い。この結論を更に支持するものとして、濃縮された置換の多くは、置換されたアミノ酸(グリシン)と比較して、更なる水素結合を形成することができるアミノ酸をコードしていた。これらの知見は、特にPAM DNA配列に物理的に近接している場合(10オングストローム以内)、DNA鎖の一方又は両方と相互作用する変異を導入することによって、CasXタンパク質において新規のPAM配列の認識の改善を達成することができることを実証する。図34~図36におけるヒートマップの更なる特徴は、非正準PAM配列の認識の増加を可能にする変異を表し得るが、それらの作用機序はまだ調べられていない。
2型の変異の例として、図34A~図34E、35A~図35E、及び36A~図36Eのヒートマップの結果を使用して、CasX515と比較して全体的な切断速度を改善するが、必ずしもDNAのPAM配列を特異的に認識しない変異を同定した。例えば、27位でのアルギニンの挿入からなるCasX515のバリアントは、スペーサー11.2(CTC PAM)及びスペーサー23.19(ATC PAM)による選択において、1より大きい濃縮値を有することが測定された。このバリアントは、CTC PAMスペーサー上での同等の選択によって以前に同定されており、ここで、この変異は桁違いに濃縮された(データは示さず)。このアミノ酸変異の位置は、上記の構造モデルにおける-1位のDNA標的鎖に物理的に近位(9.29オングストローム)である。これらの洞察は、二本鎖DNAを有するCasX RNPによって形成される成熟したRループが、アルギニンの側鎖によって、おそらく、正に帯電した側鎖と負に帯電したDNA標的鎖の骨格とのイオン相互作用によって安定化される機構を示唆する。このような相互作用は、PAMの特異性を変化させることなく、全体的な切断動態に有益である。これらのデータは、図34A~図34E、35A~図35E、及び36A~図36Eに示されるいくつかの濃縮された変異が、DNA鎖に近位(10オングストローム以内)である場合、DNA鎖のいずれか又は両方と物理的に相互作用することによって、CasX515の全体的な切断活性を改善するバリアントを表すという結論を支持する。
データは、図34A~図34E、35A~図35E、及び36A~図36Eにおけるヒートマップから同定されたCTC又はATC PAM配列に関連する配列での切断を改善するために測定された変異の多くが、上で指定された2つの型の変異のいずれかとして分類され得るという結論を支持する。1型の変異について、CTC PAMで試験したスペーサーのうちの少なくとも1つにおいて大きな濃縮スコアを有する223位に対する変異からなるバリアントを、関連する最大濃縮スコアとともに表21に列挙する。2型の変異について、数千の濃縮されたバリアントの中から、変異のより小さなリストを体系的に選択した。CasX515と比較して全体的な切断活性を改善する可能性が高い変異を同定するために、以下のアプローチをとった。第一に、CTC又はATM PAMスペーサーにわたって最も一貫して濃縮された変異をフィルタリングした。各スペーサーについての各変異の濃縮スコアについて、下限(lower bound、LB)を定義した。LBは、生物学的な3回の反復にわたる組み合わせたlog濃縮スコアから、個々の反復についてのlog濃縮スコアの標準偏差を引いたものとして定義された。第二に、3つの独立した実験データセット(1つのATC PAM選択及び2つのCTC PAM選択)のうちの少なくとも2つについてLB>1であるこれらの変異のサブセットをとった。第三に、変異のこのサブセットは、3つのTTC PAM選択のいずれかにおいて負のlog濃縮が測定されたものを除外することによって更に減少した。最後に、少なくとも1つの実験における構造的特徴及び強い濃縮スコアの組み合わせに基づいて、個々の変異を手動で選択した。これらの基準を満たす得られた274個の変異を、図34A~図34E、35A~図35E、及び36A~図36Eのヒートマップに表される2つのCTC PAM実験又は1つのATC PAM実験から観察された最大log濃縮スコア、並びに変異が位置するドメインとともに、表22に列挙する。
クラスI変異とは対照的に、クラスIIと呼ばれる別のカテゴリの変異が存在する。これは、スペーサー配列によって決定されるゲノムDNAにおけるオンターゲット部位とオフターゲット部位とを識別するCasX RNPの能力を改善し、CasXタンパク質のヌクレアーゼ活性のスペーサー特異性を改善する。クラスII変異を特に同定するために、2つの更なる実験を実施した。これらの実験は、プラスミド対抗選択からなり、CasX515と比較して、ガイドRNAのスペーサー配列と意図された標的DNAとの間の単一ミスマッチに対する、生成されたバリアントの感受性を表す濃縮スコアが得られた。得られた濃縮スコアを、実験データにわたって観察された全ての変異についてランク付けし、以下の分析を実施して、所望のオンターゲット部位でのヌクレアーゼ活性を大幅に低下させることなくCasXタンパク質のスペーサー特異性を改善する可能性が高い変異のサブセットを同定した。まず、スクリーニング5からの変異を、スペーサー23.2を使用して、3つの技術的反復にわたるそれらの平均濃縮スコアによってランク付けした。標的部位(PDB ID:6NY2)に結合したCasX RNPの公開されたモデルから推測されるように、ヌクレオチドミスマッチに物理的に近位であった変異を除去して、スペーサー全体にわたって普遍的というよりも、スペーサー23.2のみで特異性に改善を付与する可能性があるクラスII変異を廃棄した。最後に、3つのTTC PAM CcdB選択からのそれらの平均log濃縮が0未満であったときに、オンターゲットTTC PAM部位でのそれらの切断活性が変異によって負の影響を受けた場合、これらのクラスII変異を廃棄した。これらの基準を満たす得られた変異を、スクリーニング5から観察された最大log濃縮スコア及び変異が位置するドメインとともに表23に列挙する。追加的に、クラスII変異は、スクリーン6の対抗選択実験から同定された。これらの変異は、それらの平均濃縮スコアによって同様にランク付けされたが、異なるフィルタリングステップが適用された。特に、以下のカテゴリの各々から変異を同定した:スペーサー23.2、スペーサー23.11、若しくはスペーサー23.13のいずれかからの最高の平均濃縮スコアを有するもの;スペーサー23.2及びスペーサー23.11からの最高の組み合わせた平均濃縮スコアを有するもの;スペーサー23.11及びスペーサー23.13からの最高の組み合わせた平均濃縮スコアを有するもの;又はスクリーン5におけるスペーサー23.2及びスクリーン6におけるスペーサー23.2からの最高の組み合せた平均濃縮スコアを有するもの。これらの得られた変異を、スクリーン6からの観察された最大log濃縮スコア及び変異が位置するドメインとともに、表23に列挙する。
クラスI又はクラスII変異に加えて、TTC PAM配列でのdsDNA編集活性を改善することが直接観察された別のカテゴリの変異が存在する。これらの変異は、クラスIII変異と呼ばれ、スクリーン7においてスペーサー23.2を使用してCcdBプラスミドを標的化する場合にCasX515の濃縮スコアを上回る濃縮スコアを示すことによって、ヌクレアーゼ活性の改善を実証した。コンピュータによるフィルタリングステップを使用して、特に興味深いこれらの濃縮された変異のサブセットを同定した。具体的には、試験した3つのプロモーターの各々について0を超える3つの反復にわたる平均濃縮値を有する変異を同定した。最後に、アミノ酸配列にわたる濃縮スコアの特徴を使用して、濃縮された位置での更なる変異を同定した。目的の特徴の例としては、以下のものが挙げられる:トポロジカルな変化を容易にするための、タンパク質ドメインの接合部における挿入又は欠失;ポリペプチド骨格をねじるためのプロリンへのアミノ酸の置換;タンパク質と、ガイドRNA又は標的DNAのいずれかの鎖の負に帯電した核酸骨格との間にイオン結合を追加するための、正に帯電したアミノ酸へのアミノ酸の置換;連続した欠失の両方が高度に濃縮されているアミノ酸の欠失;多くの高度に濃縮された置換を含む位置への置換;タンパク質の最N末端における高度に濃縮されたアミノ酸へのアミノ酸の置換。これらの得られた変異を、スクリーン6からの観察された最大log濃縮スコア及び変異が位置するドメインとともに、表24に列挙する。
実施例15:RNPとして送達された場合の細胞における編集に対するスペーサー長の評価
実験の目的は、細胞内に送達されたCasX及びガイドのRNPによる標的核酸の編集に対するスペーサー(標的化配列)長の効果を決定することであった。
CasXバリアント491を上記のように精製した。足場174を有するガイドRNAを、インビトロ転写(IVT)によって調製した。IVT鋳型は、推奨プロトコルに従ってQ5ポリメラーゼ(NEB M0491)、各足場骨格の鋳型オリゴ、並びにT7プロモーター及び全長(20ヌクレオチド)の15.3(CAAACAAATGTGTCACAAAG、配列番号165)スペーサー若しくは15.5(GGAATAATGCTGTTGTTGAA、配列番号166)スペーサーのいずれかを有する増幅プライマー、又はそれぞれのスペーサーの3’末端から1若しくは2ヌクレオチド短縮された増幅プライマー(表26の配列)を使用して、PCRによって生成した。IVT鋳型を生成するために使用したプライマーの配列を表25に示す。次いで、得られた鋳型は、T7 RNAポリメラーゼを使用して、標準的なプロトコルに従ってRNAガイドを生成した。変性ポリアクリルアミドゲル電気泳動を使用してガイドを精製し、使用前にリフォールディングした。25mMリン酸ナトリウム緩衝液(pH7.25)、300mM NaCl、1mM MgCl2、及び200mMトレハロースを含有する緩衝液中で、タンパク質を1.2倍過剰のモル濃度のガイドと混合することによって、個々のRNPを構築した。RNPを、37℃で10分間インキュベートし、次いで、サイズ排除クロマトグラフィーを介して精製し、25mMリン酸ナトリウム緩衝液pH7.25)、150mM NaCl、1mM MgCl2、及び200mMトレハロースを含有する緩衝液(緩衝液1)に交換した。精製後、RNPの濃度を、Pierce 660nmタンパク質アッセイを使用して決定した。
精製されたRNPを、Jurkat細胞において、T細胞受容体α(TCRα)遺伝子座での編集について試験した。RNPを、Lonza4-Dヌクレオフェクターシステムを使用して、エレクトロポレーションによって送達した。700,000細胞を、20μLのLonza緩衝液SEに再懸濁し、適切な濃度に緩衝液1に希釈したRNPに添加し、最終体積を2μLとした。細胞を、プロトコルCL-120を使用して、Lonza96ウェルシャトルシステムを使用して、エレクトロポレーションした。細胞を、予め平衡化したRPMI中に、37°Cで回収した。次いで、各エレクトロポレーション条件を、96ウェルプレートの3つのウェルに分けた。ヌクレオフェクションの1日後、細胞を、新鮮なRPMIに交換した。ヌクレオフェクション後の3日目、細胞を、TCRα/β(BioLegend)に対するAlexa Fluor647標識抗体で染色し、表面TCRα/βの喪失について、Attune Nxtフローサイトメーターを使用して評価した。Jurkat細胞の一部は、編集の不在下、TCRα/βに対して陽性染色されない。これを説明し、編集によりTCRαがノックアウトされた細胞の実際の割合(%)を推定するために、式TCRKO=(TCR-obs-TCR-neg)/(1-TCR-neg)を適用した。式中、TCRKOは、TCRαの推定ノックアウト率であり、TCR-obsは、実験試料中のTCR染色に対して陰性の細胞の観察された割合であり、TCR-negは、RNPを含まない対照試料中のTCR染色に対して陰性の細胞の割合である。この式は、TCRα/βを発現する細胞及び発現しない細胞が同等の割合で編集されると仮定している。補正された割合のTCRαノックアウト細胞を、Prismを使用して、RNPの濃度に対してプロットした。各スペーサーについて、3つのスペーサー長を、EC50を除く共通のパラメータを使用して、用量反応曲線に適合した。報告されたp値は、20ntスペーサーについての用量曲線及び比較される短縮型スペーサーの用量曲線が、同じEC50パラメータでモデル化され得る確率である。
結果:CasX RNPは、CasXバリアント491と、15.3又は15.5(いずれもTCRα遺伝子の定常領域を標的化するスペーサー)のいずれかを有する足場174から構成されるガイドとを使用して構築された。予め構築されたRNPがエクスビボ編集のためにヌクレオフェクトされる場合、より短いスペーサーの使用が編集の増加を支持するかどうかを決定するために、全長20ntスペーサー並びに短縮型19nt及び18ntスペーサーを有するガイドを試験した。RNPは、22μLのヌクレオフェクション反応中、0.3125μM~2.5μMの範囲の2倍希釈で試験した。編集は、ヌクレオフェクションの3日後にフローサイトメトリーによって評価した。両方のスペーサー配列について、短縮型スペーサーを有するRNPは、用量範囲にわたって、20ntスペーサーを有するものよりも大幅に効率的に編集された(図37A~図37B、用量反応曲線)。スペーサー15.3については、20ntスペーサーの1.414μMと比較して、18nt及び19ntスペーサーは、それぞれ0.225μM及び0.299μMのEC50値を有した(両方の切断についてp<0.0001;余分平方和F検定)。スペーサー15.5については、18ntスペーサーの0.519μMに対して20ntスペーサーでは0.938μM(p=0.0001)のEC50を有した。一方、19ntスペーサーは、0.808μM(p=0.0762)のEC50を有し、20ntスペーサーにより類似していた。19ntの15.3スペーサーが18ntスペーサーと同様の編集を有し、19ntの15.5スペーサーが対応する20ntスペーサーにより密接に類似しているという事実にもかかわらず、試験した両方のスペーサーについて、傾向の方向性は一貫したままであり、CasX編集分子が予め構築されたRNPとして送達される場合、18ntスペーサーを有するガイドを使用することが、編集を増加させるための一般化可能な戦略であり得ることを示唆し、18又は19のより短いスペーサーが、RNPによるエクスビボ編集において20塩基のスペーサーと比較して増加した活性を支持することを実証する。
実施例16:新規のPAM配列特異性を有するCasXタンパク質バリアントのアッセイによる同定
実験の目的は、CasXタンパク質515(配列番号416)の配列バリアントのPAM配列特異性を同定することであった。これを達成するために、HEK293細胞株PASS_V1.01を、ガイド174(配列番号2238)と一緒に、CasXタンパク質491(配列番号336)又はCasXタンパク質515若しくは515のバリアントで処理し、次世代配列決定(NGS)を実施して、様々なスペーサー及び関連する標的部位での編集の割合(%)を計算した。
材料及び方法:PASSシステムを使用してクローンタンパク質バリアントをアッセイするために、多重化プールアプローチをとった。簡潔には、プールされたHEK細胞株を生成し、PASS_V1.01と名付けた。プール内の各細胞は、特定の標的部位と対になったゲノムに組み込まれたシングルガイドRNA(sgRNA)を含んでいた。タンパク質発現構築物のトランスフェクション後、特定のスペーサーによる特定の標的での編集を、NGSによって定量化することができる。各ガイド-標的対は、CasX-ガイドRNP複合体の活性、特異性、及び標的化能に関するデータを提供するように設計された。
対のスペーサー-標的配列は、Twist Biosciencesによって合成され、等モルプールのオリゴヌクレオチドとして入手した。このプールを、PCRによって増幅し、Golden Gateクローニングによってクローニングして、p77と名付けられたプラスミドの最終ライブラリを生成した。各プラスミドは、GFP発現エレメントとともに、sgRNA発現エレメント及び標的部位を含んでいた。sgRNA発現エレメントは、gRNA足場174(配列番号2238)の転写を駆動するU6プロモーター、続いて、ガイド及びCasXバリアントのRNPを対形成した標的部位に標的化するスペーサー配列からなった。250個の可能な固有の、対のスペーサー・標的合成配列を設計及び合成した。次いで、レンチウイルスのプールを、製造業者の説明書に従ってLentiX産生システム(Takara Bio USA,Inc)を使用して、このプラスミドライブラリから産生した。次いで、得られたウイルス調製物を、qPCRによって定量化し、単一コピーの組み込みを生成するように、低い感染多重度で標準HEK293細胞株に形質導入した。次いで、得られた細胞株を、蛍光活性化細胞選別(FACS)によって精製して、PASS_V1.01の産生を完了した。次いで、この細胞株を、6ウェルプレート形式で播種し、2連で、水で処理するか、又は2μgのプラスミドp67でトランスフェクトし、製造業者の説明書に従ってLipofectamineトランスフェクション試薬(ThermoFisher)によって送達した。プラスミドp67は、SV40核局在化配列でタグ付けされたCasXタンパク質の発現を駆動するEF-1aプロモーターを含む。2日後、処理したPASS_V1.01細胞を回収し、溶解させ、ゲノムDNA単離キット(Zymo Research)を使用して、ゲノムDNAを抽出した。次いで、ゲノムDNAをカスタムプライマーを用いてPCR増幅して、Illumina NGSと適合性のアンプリコンを生成し、NextSeq機器で配列決定した。試料リードを逆多重化し、品質についてフィルタリングした。次いで、編集結果メトリック(インデルを有するリードの割合)を、処理された試料にわたって、各スペーサー-標的合成配列について定量化した。
分子に対するPAM配列特異性を評価するために、4つの異なるPAM配列に対する編集結果メトリックを分類した。TTC PAM標的部位について、48個の異なるスペーサー・標的対を定量化した(ATC PAM、CTC PAM、及びGTC PAM標的部位について、14、22、及び11個の個々の標的部位をそれぞれ定量化した)。2つの生物学的反復についての平均編集効率及び平均の標準誤差を、これらのスペーサーの各々について計算した。次いで、PAM配列の4つのカテゴリにわたる平均編集効率を、測定値の標準偏差とともに計算した。
結果:表27は、2回の実験の平均として計算された、CasXタンパク質バリアント515で標的化された場合の上記のスペーサーについての平均編集効率を列挙する。スペーサー名及び関連するPAM配列を示す。表28は、CasXタンパク質バリアント534についての同じデータを列挙する。追加的に、平均編集効率を、PAM配列の4つのカテゴリの各々について計算した。

図38は、PAMカテゴリにわたる、及びCasXタンパク質バリアントにわたる平均編集効率を示す棒グラフであり、2つの実験の平均の標準誤差がエラーバーとしてプロットされている。これらのデータは、CasXバリアント491及び515の両方が、正準PAM配列TTCに特異的である一方、CasXの他のバリアントが、試験したPAM配列において多かれ少なかれ効率的に機能したことを示す。特に、CasXの223位で置換された異なるアミノ酸は、PAMヌクレオチド配列のすぐ5’の位置に異なる塩基を好むことが観察された。表29に、これらの4つのPAM配列の各々についての最も高い編集活性を有するCasXバリアントを列挙する。バリアント名及びアミノ酸置換、並びに示されたPAM配列についてのCasX515と比較した編集の改善倍率が指定されている。これらのデータは、この位置のアミノ酸の側鎖の同一性がPAM認識に重要であることを示唆している。4つのヌクレオチドの各々は、CasXタンパク質のこの領域における異なる結合ネットワーク又は化学的環境に最も相補的である可能性が高い。これらのデータを使用して、目的の標的DNA配列に対して最大限に活性な治療用CasX分子を操作することができる。
実験の条件下で、配列TTC、ATC、CTC、又はGTCのPAMに関連する標的DNA配列でのヒト細胞における二本鎖DNA切断について改善されたCasXタンパク質515のバリアントのセットが同定された。これは、CasXバリアントが、野生型CasXと比較して、増加した範囲のPAM特異性を生成することができることを支持している。
実施例17:TTC、ATC、CTC、又はGTCのPAM配列での改善された編集効率を有するCasXタンパク質バリアントのPASSアッセイによる比較
実験の目的は、CasXタンパク質2(配列番号2)の操作されたバリアント及び新規のバリアントを利用して、ヒト細胞におけるゲノム編集効率を比較することであった。これを達成するために、HEK293細胞株PASS_V1.00を、野生型参照CasXタンパク質2又は操作されたバリアント119(配列番号270)、491(配列番号336)、及び515(配列番号416)、又は515の配列バリアントで処理し、次世代配列決定(NGS)を実施して、様々なスペーサー及び関連する標的部位での編集の割合(%)を計算した。
材料及び方法:PASSシステムを使用してクローンタンパク質バリアントをアッセイするために、多重化プールアプローチをとった。簡潔には、プールされたHEK細胞株を生成し、PASS_V1.00と名付けた。プール内の各細胞は、特定の標的部位と対になったゲノムに組み込まれたシングルガイドRNA(sgRNA;配列番号2238)を含んでいた。タンパク質発現構築物のトランスフェクション後、特定のスペーサーによる特定の標的での編集を、NGSによって定量化することができる。各ガイド-標的対は、CasX-ガイドRNP複合体の活性、特異性、及び標的化能に関するデータを提供するように設計された。
対のスペーサー-標的配列は、Twist Biosciencesによって合成され、等モルプールのオリゴヌクレオチドとして入手した。このプールを、PCRによって増幅し、Golden Gateクローニングによってクローニングして、p66と名付けられたプラスミドの最終ライブラリを生成した。各プラスミドは、GFP発現エレメント及びハイグロマイシン発現エレメントとともに、sgRNA発現エレメント及び標的部位を含んでいた。sgRNA発現エレメントは、gRNA足場174(配列番号2238)の転写を駆動するU6プロモーター、続いて、ガイド及びCasXバリアントのRNPを対形成した標的部位に標的化するスペーサー配列からなった。250個の可能な固有の、対のスペーサー・標的合成配列を設計及び合成した。次いで、レンチウイルスのプールを、製造業者の説明書に従ってLentiX産生システム(Takara Bio USA,Inc)を使用して、このプラスミドライブラリから産生した。次いで、得られたウイルス調製物を、qPCRによって定量化し、単一コピーの組み込みを生成するように、低い感染多重度で標準HEK293細胞株に形質導入した。次いで、得られた細胞株を、蛍光活性化細胞選別(FACS)によって精製して、PASS_V1.00の産生を完了した。次いで、この細胞株を、6ウェルプレート形式で播種し、水で処理するか、又は2μgのプラスミドp67でトランスフェクトし、製造業者の説明書に従ってLipofectamineトランスフェクション試薬(ThermoFisher)によって送達した。プラスミドp67は、SV40核局在化配列でタグ付けされたCasXタンパク質の発現を駆動するEF-1aプロモーターを含む。5日後、処理した細胞を回収し、溶解させ、ゲノムDNA単離キット(Zymo Research)を使用して、ゲノムDNAを抽出した。次いで、ゲノムDNAをカスタムプライマーを用いてPCR増幅して、Illumina NGSと適合性のアンプリコンを生成し、NextSeq機器で配列決定した。試料リードを逆多重化し、品質についてフィルタリングした。次いで、編集結果メトリック(インデルを有するリードの割合)を、処理された試料にわたって、各スペーサー-標的合成配列について定量化した。
分子に対する編集効率を評価するために、4つの異なるPAM配列に対する編集結果メトリックを分類した。TTC PAM標的部位について、48個の異なるスペーサー・標的対を定量化した(ATC PAM、CTC PAM、及びGTC PAM標的部位について、14、22、及び11個の個々の標的部位をそれぞれ定量化した)。編集効率を、これらのスペーサーの各々について計算し、水処理試料において観察された編集を差し引くことによって、バックグラウンドシグナル対して正規化した。
結果:図30は、PAMカテゴリにわたる、及びCasXタンパク質バリアントにわたる編集効率を示すバイオリンプロットである。個々のスペーサーの編集効率をドットで示し、平均編集効率を水平バーで示す。任意のヌクレアーゼでリポフェクトされた細胞は、CasX528を除く野生型ヌクレアーゼCasX2の平均編集よりも高い、TTC PAM標的部位(水平バー)での平均編集を示した。また、4つの異なるPAM配列に対する任意の所与のヌクレアーゼの相対優先度が、バイオリンプロットで表されている。CasXヌクレアーゼ527(配列番号427)、528(配列番号428)、及び529(配列番号429)は、野生型ヌクレアーゼCasX2のPAM優先度とは大幅に異なるPAM優先度を示す。これらのデータは、CasXアミノ酸配列の特定の領域がPAM認識に重要であることを示唆しており、これらのデータを使用して、目的の標的DNA配列に対して最大限に活性な治療用CasX分子を操作することができる。
実験の条件下で、操作されたCasXバリアント119、491、及び515、又は515の配列バリアントを同定した。これらは、WT CasX2タンパク質と比較して、配列TTC、ATC、CTC、又はGTCのPAMに関連する標的DNA配列でのヒト細胞における二本鎖DNA切断について改善されている。これらのデータは、野生型参照CasXと比較して、PAM特異性の範囲が増加したCasXバリアントを生成することができることを支持する。
実施例18:TTC、ATC、CTC、又はGTCのPAM配列での改善された最大編集効率を有するCasXタンパク質バリアントのPASSアッセイによる比較
実験の目的は、CasXタンパク質バリアントを比較して、選択標的核酸配列についてのTTC、ATC、CTC、又はGTCのPAM配列での最大編集効率を決定することであった。これを達成するために、HEK293細胞株PASS_V1.00を、操作されたCasXタンパク質491(配列番号336)又は更に操作されたバリアント532(配列番号432)若しくは533(配列番号433)で処理し、次世代配列決定(NGS)を実施して、様々なスペーサー及び関連する標的核酸部位での編集の割合(%)を計算した。
材料及び方法:PASSシステムを使用してクローンタンパク質バリアントをアッセイするために、多重化プールアプローチをとった。簡潔には、プールされたHEK細胞株を生成し、PASS_V1.00と名付けた。プール内の各細胞は、特定の標的部位と対になったゲノムに組み込まれたシングルガイドRNA(sgRNA)を含んでいた。タンパク質発現構築物のトランスフェクション後、特定のスペーサーによる特定の標的での編集を、NGSによって定量化することができる。各ガイド-標的対は、CasX-ガイドRNP複合体の活性、特異性、及び標的化能に関するデータを提供するように設計された。
対のスペーサー-標的配列は、Twist Biosciencesによって合成され、等モルプールのオリゴヌクレオチドとして入手した。このプールを、PCRによって増幅し、Golden Gateクローニングによってクローニングして、p66と名付けられたプラスミドの最終ライブラリを生成した。各プラスミドは、GFP発現エレメント及びハイグロマイシン発現エレメントとともに、sgRNA発現エレメント及び標的部位を含んでいた。sgRNA発現エレメントは、gRNA足場174(配列番号2238)の転写を駆動するU6プロモーター、続いて、ガイド及びCasXバリアントのRNPを対形成した標的部位に標的化するスペーサー配列からなった。250個の可能な固有の、対のスペーサー・標的合成配列を設計及び合成した。次いで、レンチウイルスのプールを、製造業者の説明書に従ってLentiX産生システム(Takara Bio USA,Inc)を使用して、このプラスミドライブラリから産生した。次いで、得られたウイルス調製物を、qPCRによって定量化し、単一コピーの組み込みを生成するように、低い感染多重度で標準HEK293細胞株に形質導入した。次いで、得られた細胞株を、蛍光活性化細胞選別(FACS)によって精製して、PASS_V1.00の産生を完了した。次いで、この細胞株を、6ウェルプレート形式で播種し、2連で、水で処理するか、又は2μgのプラスミドp67でトランスフェクトし、製造業者の説明書に従ってLipofectamineトランスフェクション試薬(ThermoFisher)によって送達した。プラスミドp67は、SV40核局在化配列でタグ付けされたCasXタンパク質の発現を駆動するEF-1aプロモーターを含む。5日後、処理したPASS_V1.00細胞を回収し、溶解させ、ゲノムDNA単離キット(Zymo Research)を使用して、ゲノムDNAを抽出した。次いで、ゲノムDNAをカスタムプライマーを用いてPCR増幅して、Illumina NGSと適合性のアンプリコンを生成し、NextSeq機器で配列決定した。試料リードを逆多重化し、品質についてフィルタリングした。次いで、編集結果メトリック(インデルを有するリードの割合)を、処理された試料にわたって、各スペーサー-標的合成配列について定量化した。
分子に対する編集効率を評価するために、4つの異なるPAM配列に対する編集結果メトリックを分類した。TTC PAM標的部位について、48個の異なるスペーサー・標的対を定量化した(ATC PAM、CTC PAM、及びGTC PAM標的部位について、14、22、及び11個の個々の標的部位をそれぞれ定量化した)。編集効率を、これらのスペーサーの各々について計算し、水処理試料において観察された編集を差し引くことによって、バックグラウンドシグナル対して正規化した。次いで、2回の生物学的反復の平均、並びに平均の標準誤差(SEM)を計算した。最後に、PAMの各カテゴリ(TTC、ATC、CTC、又はGTC)について、全てのスペーサーについての平均編集効率、並びに伝搬SEMを計算した。
結果:図31は、PAMカテゴリ及びCasXタンパク質バリアントにわたる編集効率を示す棒グラフである。Cas532又は533でリポフェクトされた細胞は、TTC PAM標的部位におけるPAM配列の各々で、Cas533を除いて、CasX491よりも高い平均編集を示した。これらのデータは、CasXバリアント532又は533が、目的の治療標的で編集活性を改善し得ることを示唆する。
操作されたCasXバリアント532及び533は、標的DNA配列が配列TTC、ATC、CTC、又はGTCのPAMと関連している場合、CasX491と比較して、ヒト細胞において改善された編集効率を有することが同定された。これらのデータは、CasXバリアント532及び533が、CasX491と比較して、特に非正準PAM配列に関連するそれらの標的に対して、目的の治療標的での編集効率を改善し得ることを支持する。
実施例19:CasX491又はCasX119と比較して増強された編集活性を有するCasXタンパク質バリアントのPASSアッセイによる同定
実験の目的は、CasX491又は119と比較して、ヒト細胞において改善された編集を有するCasXのバリアントを同定することであった。これを達成するために、HEK293細胞株PASS_V1.01を、野生型CasXタンパク質2、又は操作されたCasXタンパク質バリアント119若しくは491(配列番号336)、又は別のCasXタンパク質バリアントで処理し、次世代配列決定(NGS)を実施して、様々なスペーサー及び関連する標的部位での編集の割合(%)を計算した。
材料及び方法:PASSシステムを使用してクローンタンパク質バリアントをアッセイするために、多重化プールアプローチをとった。簡潔には、プールされたHEK細胞株を生成し、PASS_V1.01と名付けた。プール内の各細胞は、特定の標的部位と対になったゲノムに組み込まれたシングルガイドRNA(sgRNA:配列番号2238)を含んでいた(表30に列挙)。タンパク質発現構築物のトランスフェクション後、特定のスペーサーによる特定の標的での編集を、NGSによって定量化することができる。各ガイド-標的対は、CasX-ガイドRNP複合体の活性、特異性、及び標的化能に関するデータを提供するように設計された。
対のスペーサー-標的配列は、Twist Biosciencesによって合成され、等モルプールのオリゴヌクレオチドとして入手した。このプールを、PCRによって増幅し、Golden Gateクローニングによってクローニングして、p77と名付けられたプラスミドの最終ライブラリを生成した。各プラスミドは、GFP発現エレメントとともに、sgRNA発現エレメント及び標的部位を含んでいた。sgRNA発現エレメントは、gRNA足場174(配列番号2238)の転写を駆動するU6プロモーター、続いて、ガイド及びCasXバリアントのRNPを対形成した標的部位に標的化するスペーサー配列からなった。250個の可能な固有の、対のスペーサー・標的合成配列を設計及び合成した。次いで、レンチウイルスのプールを、製造業者の説明書に従ってLentiX産生システム(Takara Bio USA,Inc)を使用して、このプラスミドライブラリから産生した。次いで、得られたウイルス調製物を、qPCRによって定量化し、単一コピーの組み込みを生成するように、低い感染多重度で標準HEK293細胞株に形質導入した。次いで、得られた細胞株を、蛍光活性化細胞選別(FACS)によって精製して、PASS_V1.01の産生を完了した。次いで、この細胞株を、6ウェルプレート形式で播種し、2連又は単一試料のいずれかで、水で処理するか、又は2μgのプラスミドp67でトランスフェクトし、製造業者の説明書に従ってLipofectamineトランスフェクション試薬(ThermoFisher)によって送達した。プラスミドp67は、SV40核局在化配列でタグ付けされたCasXタンパク質の発現を駆動するEF-1aプロモーター、並びにピューロマイシン耐性遺伝子を含む。1日後、細胞を、ピューロマイシン耐性に選択的な培地(Sigma)に移した。更に4日後、処理したPASS_V1.01細胞を回収し、溶解させ、ゲノムDNA単離キット(Zymo Research)を使用して、ゲノムDNAを抽出した。次いで、ゲノムDNAをカスタムプライマーを用いてPCR増幅して、Illumina NGSと適合性のアンプリコンを生成し、NextSeq機器で配列決定した。試料リードを逆多重化し、品質についてフィルタリングした。次いで、編集結果メトリック(インデルを有するリードの割合)を、処理された試料にわたって、各スペーサー-標的合成配列について定量化した。
ヒト標的部位でのCasXヌクレアーゼの編集活性を評価するために、48個のTTC PAM標的部位を定量化した。2つの生物学的反復についての平均編集効率及び平均の標準誤差を、示されている場合、これらのスペーサーの各々について計算した。48個のスペーサーにわたる平均編集効率も、示されている場合、平均の伝搬標準誤差とともに計算した。
結果:図39は、ヒト細胞における48個の異なるTTC PAM標的部位での選択CasXヌクレアーゼの、CasX491と比較した平均編集効率を示す棒グラフである。2つの実験の平均の伝搬標準誤差をエラーバーとしてプロットした。これらのデータは、CasX119及び491の両方が野生型CasX2よりも大幅に効率的であることを示す。更に、CasX515は、CasX491の編集効率と比較して有意に異ならない。驚くべきことに、CasX527は、491と比較して、TTC PAM配列で改善された効率を示した(Welchの両側t検定によりp=0.0000635)。CasXヌクレアーゼ527は、潜在的に、非標準PAM配列を有する二本鎖DNA標的部位を有するCasXリボ核タンパク質(RNP)のRループ構造を安定化することによって、ATC、CTC、又はGTCのPAM配列での改善された編集効率を示すように操作された。CasX527は、CasX491の26位に挿入されたアルギニンアミノ酸からなる。この位置は、CasX PAM認識ループ(アミノ酸位置223)とDNAの非標的鎖(NTS)のPAMヌクレオチドとの相互作用に物理的に近位である。
図40は、相同な参照CasXタンパク質1(配列番号1;タンパク質データバンク識別番号:6NY2)の公開されたCryoEM構造上のPAM認識ループの位置及びCasX527変異の位置(26位)を図示する。挿入されたアルギニンとDNA NTSとの間の更なるイオン相互作用は、PAM配列TTC、ATC、CTC、又はGTCのいずれかでの安定性の改善を促進し、これらのスペーサーにおける全体的な編集効率の改善をもたらす可能性が高い。
図41は、CasX2及びCasX527の編集効率を、48個のTTC PAMスペーサーでのCasX515の選択バリアントと比較したバイオリンプロットであり、編集効率の中央値は水平バーとして表されている。上で考察したように、CasX527は、CasX491と同等以上の編集効率を有することが以前に観察されており、いくつかの新規のCasXバリアントは、CasX527と比較して、更に改善された編集効率を有することがここで観察された。意外にも、CasX583についての編集率は、特に均一かつ高かった。これは、Rループ構造の安定性における大きな改善の結果である可能性があり、それにより、スペーサー間で典型的に観察される編集のばらつきがほとんど克服された。この仮説を支持するように、CasX583は、タンパク質の非標的鎖結合ドメイン(NTSB)における168位の疎水性ロイシンの正に帯電したリジンへの置換によってCasX515とは異なり、これは、標的DNAのNTSへの更なるイオン結合を容易にする可能性がある。この領域は、上で考察したCryoEM構造では非構造化されており、明確にするために、NTSBドメインが標識されている。表30は、CasXタンパク質バリアント527又は583で標的化した場合の48個のTTC PAMスペーサーに対する編集効率を列挙する。これは、アッセイの条件下で、標的の大部分でCasX583の編集効率の増強を実証する。スペーサー名及び関連するPAM配列を示す。
図42は、ヒト細胞における48個の異なるTTC PAM標的部位での選択CasXヌクレアーゼのCasX491に対する平均編集効率を示す棒グラフである。2つの実験の平均の伝搬標準誤差をエラーバーとしてプロットした。灰色の破線は、CasX119の編集活性を示す。これらのデータは、CasXバリアント429~458が、CasX119と比較して変動的な編集効率を示し、場合によっては、CasX119と比較して改善された編集効率を示し、これは、CasX491と比較して70.8%で編集することを示す。特に、CasX450は、CasX119よりも大幅に効率的であり、CasX491と比較して95.9%で編集し、CasX119配列と比較して4つの置換変異からなる。これらの4つの置換変異は、以下の通りである:D732N、E385P、Y857R、I658V。重要なことに、CasX449は、I658Vの置換を除いて同じ配列からなり、かなり効率が低く、CasX491と比較して、わずか58.1%で編集する。この比較は、この変異が活性の増加に非常に重要であることを示す。これらのデータは、置換変異の組み合わせがCasX119に対して行われる場合に、改善された編集活性が達成可能であることを実証する。注目すべきことに、活性に対するこれらの増強は、相同なCasXタンパク質配列間のドメイン交換から生じることが観察された増強とは別である。特に、CasX484は、CasX2ドメイン(NTSB及びヘリックスIb)がCasX1に見出されるドメインで置換されていることによってのみCasX491とは異なり、対応する活性の増加は62.0%~100.0%である。これらのデータは、CasX119ヌクレアーゼ活性が、個々の置換変異の組み合わせによって、又は相同なCasXタンパク質とのドメイン交換によって増強され得ることを示す。
実験の条件下で、CasXタンパク質491又は515のバリアントのセットが同定された。これらは、配列TTCのPAMに関連する標的DNA配列でのヒト細胞における二本鎖DNA切断について改善されており、目的の標的DNA配列について増強された活性を有するCasXバリアント分子を更に操作するために使用され得る変異についての特定の位置又は位置の組み合わせの証拠を提供する。
実施例20:CasX491と比較して増強された特異性を有するCasXタンパク質バリアントのPASSアッセイによる同定
実験の目的は、ヒト細胞におけるオフターゲット部位対オンターゲット部位での切断に対して改善された特異性を有するCasXのバリアントを同定することであった。これを達成するために、HEK293細胞株PASS_V1.01を、シングルガイドRNA(sgRNA;配列番号2238)とともに、野生型CasXタンパク質2、又は操作されたCasXタンパク質バリアント119若しくは491(配列番号336)、又は別のCasXタンパク質バリアントで処理し、次世代配列決定(NGS)を実施して、様々なスペーサー及び関連する標的部位における編集の割合(%)を計算した。
材料及び方法:PASSシステムを使用してクローンタンパク質バリアントをアッセイするために、実施例19に記載のように、多重化プールアプローチをとった。
ヒト標的部位におけるCasXヌクレアーゼの編集活性並びに特異性を評価するために、2セットの標的部位を定量化した。まず、48個のTTC PAM標的部位を定量化し、2つの生物学的反復についての平均編集効率及び平均の標準誤差を、これらのスペーサーの各々について計算した。48個のスペーサーにわたる平均編集効率も、平均の伝搬標準誤差とともに計算した。第二に、28セットの2つのTTC PAMスペーサー・標的部位対を定量化した。スペーサー・標的対の各セットは、固定されたスペーサー配列と、2つの異なる標的部位と、からなった。2つの標的部位は、標的部位の20個の位置のうちの1つで単一ヌクレオチドのミスマッチによって異なっていた。一方の標的部位(オンターゲットスペーサー・標的対)は、スペーサー配列に完全に相補的であり、他方(オフターゲットスペーサー・標的対)は、スペーサーのRNAとDNA標的鎖との間のミスマッチからなる。2つの生物学的反復についての平均編集効率及び平均の標準誤差を、これらのスペーサーの各々について計算した。これらの28セットの標的部位の各々について、オフターゲット部位とオンターゲット部位との間の編集効率の比、並びに平均の伝搬標準誤差を計算した。このメトリックは、特異度として定義される。最後に、28セットの標的部位にわたる平均特異度、並びに平均の伝搬標準誤差を計算した。
結果:図43は、CasX491と比較した平均編集効率並びに選択CasXヌクレアーゼの平均特異度を示す棒グラフである。2つの実験の平均の伝搬標準誤差をエラーバーとしてプロットした。これらのデータは、CasX119及び491の両方が野生型CasX2よりも大幅に効率的であること、及びCasX119がCasX2と比較してスペーサー内の単一ヌクレオチドミスマッチに対して特異的なままであること(低い特異度)を示す(平均特異度がCasX2では0.171であるのに対してCasX119では0.182)。対照的に、CasX491は、これらの条件下で単一ヌクレオチドミスマッチに対するかなりの量の特異性を喪失した(平均特異度が0.446)。CasX515を生成するためのCasX491への更なる変異(793位でのプロリンの挿入)は、分子の特異性をわずかに改善するが、この結果は統計的に有意ではない。更に、CasX527を生成するためのCasX491の26位でのアルギニンの挿入は、分子の特異性を有意かつ大幅に悪化させる(平均特異度が0.839)。しかしながら、重要なことに、CasX515に対する更なる単一変異は、分子の特異性を更に改善する。CasX535、537、542、543、及び544は全て、特異性を有意に改善する。CasX544は、特異性を最も改善し、平均特異度は0.183であり、これは野生型CasX2のものと有意に異ならない。同時に、CasX544は、CasX491の平均編集効率と比較して、97.7%の平均編集効率を維持し、有意に異ならない。これらのデータは、CasX491又は515に対して行われた単一変異が、ヒト細胞において標的化DNA配列を編集する場合、ヌクレアーゼの活性若しくは特異性のいずれか、又は両方を変化させ得ることを実証する。図68は、試験した変異の組み合わせと、活性及び特異性の両方に対するそれらの効果との間の定性的関係を示すフローチャートである。表31は、28セットのオンターゲット・標的対又はオフターゲットスペーサー・標的対のCasX491の平均の編集の割合(%)を定量化し、オンターゲット編集効率対オフターゲット編集効率の平均比を示す。表32は、CasX2又はCasXバリアント491と比較した、選択CasXバリアントの平均編集活性、並びに0~1の絶対値としての各バリアントの平均特異度を定量化する。全ての場合において、操作されたバリアントは、参照CasX2(配列番号2)と比較して、改善された編集効率を示し、アッセイの条件下で4倍~ほぼ7倍多い編集を有したが、CasX527(配列番号427)及び532(配列番号432)は、CasX491(配列番号336)と比較して改善を示した。CasX542(配列番号442)、543(配列番号443)、及び544(配列番号444)は、本質的にCasX491と同程度に活性であったが、参照CasX2と同等の特異性を保持していた。
実験の条件下で、CasXタンパク質491又は515のバリアントのセットを同定した。これらは、配列TTCのPAMに関連する標的DNA配列でのヒト細胞における二本鎖DNA切断について改善されている。加えて、これらのタンパク質バリアントの特異性を、オンターゲット部位対オフターゲット部位での編集を測定することによって定量化した。これらのデータを使用して、目的の標的DNA配列に対して最大限に活性で、最大限に特異的な治療用CasXバリアント分子を操作することができる。
実施例21:改善されたガイドRNAバリアントによる、インビトロでのマウス及びヒトRHOエキソン1遺伝子座での増強されたオンターゲット活性の実証
実験を実施して、治療的に関連するマウス及びヒトRhoエキソン1を含む異なるゲノム標的での増加した活性を有する新規の操作されたガイドRNAバリアントを同定した。以前のアッセイは、編集効率並びに特異性を有意に増加させる可能性を保持する足場配列内の多くの異なる「ホットスポット」領域(例えば、ステムループ)を同定した(表33の配列)。追加的に、スクリーニングを実施して、オフターゲット編集又は非特異的編集を引き起こすことなく、複数の異なるPAM-スペーサーの組み合わせにわたって、AAVベクターにおける本発明者らのCRISPRシステムの全体的な活性を増加させるであろう足場バリアントを同定した。現在のベンチマークベクターと比較して増加した編集効率を達成することで、インビボ研究で使用されるウイルスベクターの用量の低減が可能になり、AAV媒介性CasXガイドシステムの安全性が改善される。
材料及び方法:
新たなCasXバリアント配列及びgRNA足場バリアントを、プラスミド及びウイルスベクターによる検証のためにAAV導入遺伝子構築物に挿入した。本発明者らは、ITR間のAAV導入遺伝子を、概念的に異なる部分に分割した。これらは、本発明者らの治療用カーゴ(CasX及びgRNAバリアント+スペーサー)と、哺乳動物細胞における発現に関連するアクセサリエレメント(例えば、プロモーター、NLS、ポリ(A))と、からなる。AAVゲノムにおける各部分を制限酵素部位によって分離して、モジュラークローニングができるようにした。部分を、Twistから遺伝子断片として注文し、PCR増幅し、対応する制限酵素で消化し、きれいにし、次いで、同じ酵素で消化したベクターにライゲーションした。次いで、新しいAAV構築物を化学的コンピテントE.coli(Turbos又はStbl3s)に形質転換し、37℃で1時間回復させた後、カナマイシンLB寒天プレート上にプレーティングした。単一コロニーを採取し、ミニプレップし、Sanger配列決定を行った。次いで、配列を検証した構築物を、スペーサー12.7(tdTomatoを標的化:CTGCATTCTAGTTGTGGTTT、配列番号194)を有するBbsI Golden-Gateアセンブリにクローニングした。スペーサーは、2つのオリゴをアニーリングし、水で希釈することによって作製した。次いで、形質転換及びミニプレップのプロトコルを繰り返し、スペーサーがクローニングされたベクターを、再度、配列を検証した。検証した構築物をマキシプレップした。マキシプレップの品質を評価するために、構築物を、XmaI(ITRの各々においていくつかの部位を切断する)及びXhoI(AAVゲノムを1箇所切断する)による2つの別個の消化物において処理した。次いで、これらの消化物及び未切断構築物を、1%アガロースゲル上で泳動し、ChemiDoc上で画像化した。プラスミドが、90%超がスーパーコイルで、正しいサイズであり、ITRがインタクトである場合、構築物を、ヌクレオフェクションによる試験に移し、その後、AAVベクターの産生に使用した。
レポーター細胞株:
Ai9-tdTomatoから単離された不死化神経前駆細胞株を、予め平衡化したmNPC培地(GlutaMAax、10mM HEPES、1×MEM非必須アミノ酸、1×ペニシリン/ストレプトマイシン、1:1000 2-メルカプトエタノール、1×B-27サプリメント(ビタミンAを含まない)、増殖因子bFGF及びEGFを補充した1×N2を含むDMEM/F12)で浮遊培養した。試験前に、accutaseを使用して細胞を持ち上げ、穏やかに再懸濁し、ニューロスフェアの完全な分離を監視した。次いで、細胞を、培地でクエンチし、スピンダウンし、新鮮な培地に再懸濁した。細胞をカウントし、ヌクレオフェクションに直接使用するか、又はAAV形質導入の2日前に、10,000個の細胞をPLF(1×ポリ-DL-オルニチン臭化水素酸塩、滅菌脱イオン水中10mg/mL、1×ラミニン、及び1×フィブロネクチン)でコーティングされた96ウェルプレート中でインキュベートした。
HEK293T二重レポーター細胞株を、GFPに連結されたヒトRHO遺伝子のエキソン1及びmscarletに連結されたヒトP23H.RHO遺伝子のエキソン1を構成的に発現する2つの導入遺伝子カセットをHEK293T細胞にノックインすることによって生成した。改変された細胞を、3~5日毎の連続継代によって増殖させ、10%ウシ胎児血清(FBS;Seradigm,#1500-500)並びに100単位/mLのペニシリン及び100mg/mLのストレプトマイシン(100x-Pen-Strep;GIBCO #15140-122)を補充された、ピルビン酸ナトリウム(100×,ThermoFisher #11360070)、非必須アミノ酸(100×,ThermoFisher #11140050)、HEPES緩衝液(100×,ThermoFisher #15630080)、及び2-メルカプトエタノール(1000×,ThermoFisher #21985023)を更に含み得る、ダルベッコ改変イーグル培地(DMEM;Corning Cellgro,#10-013-CV)からなる線維芽細胞(FB)培地で維持した。細胞を、37℃及び5%CO2でインキュベートした。1~2週間後、GFP+/mscarlet+細胞を、FB培地にバルク選別した。レポーター株を3~5日毎の連続継代によって増殖させ、37℃及び5%CO2のインキュベーター内のFB培地で維持した。レポータークローンを、限界希釈法によって生成した。クローン株を、フローサイトメトリー、ゲノム配列決定、及び以前に検証されたRHO標的化CasX分子を使用するRHO遺伝子座の機能的改変を介して特徴付けた。最適なレポーター株は、i)細胞当たり単一コピーのWTRHO.GFP及びmutRHO.mscarletが正しく組み込まれ、ii)未改変細胞と同等の倍加時間を維持し、iii)以下に記載の方法を使用してアッセイした場合にRHO遺伝子の破壊時にGFP及びmscarlet蛍光の減少をもたらしたものを同定した。
ヌクレオフェクション:
CasX足場ガイドシステムの発現を駆動するAAVシスプラスミドを、Lonza P3初代細胞96ウェルNucleofectorキットを使用してmNPCにヌクレオフェクトした。ARPE-19株については、Lonza SF溶液及びサプリメントを使用した。プラスミドを、200ng/μl、100ng/μLの濃度に希釈した。構築物当たり5μLのDNAを、それぞれ200,000個のtdTomato mNPC又はARPE-19細胞を含むP3又はSF溶液に添加した。製造業者のガイドラインに従ってLonza 4D Nucleofectorシステムを使用して、合わせた溶液をヌクレオフェクトした。ヌクレオフェクション後、溶液を、適切な培養培地でクエンチした。次いで、この溶液を、96ウェルプレートに3連でアリコートした(1ウェル当たり約67,000細胞)。トランスフェクションの48時間後、処理した細胞に、増殖因子を含有する新鮮なmNPC培地を補充した。トランスフェクションの5日後、tdTomato mNPCを持ち上げ、活性をFACSによって評価した。
AAVの産生:
懸濁HEK293T細胞を、親HEK293Tから適応させ、FreeStyle293培地で増殖させた。スクリーニング目的のために、小規模培養物(20~30mL、125mL三角フラスコで培養し、110rpmで撹拌した)を、トランスフェクションの日に1.5e+6細胞/mLの密度に希釈した。ITRリピートに隣接する導入遺伝子を有するエンドトキシンフリーpAAVプラスミドを、複製のためのアデノウイルスヘルパー遺伝子及びAAV rep/capゲノムを供給するプラスミドと、無血清OPTIMEM培地中でPEIMax(Polysciences)を使用して共トランスフェクトした。トランスフェクションの3時間後、培養物に、10%CDM4HEK293(HyClone)を補充した。3日後、培養物を、1000rpmで10分間遠心分離して、上清を細胞ペレットから分離した。上清を、40% PEG、2.5M NaCl(最終濃度8%)と混合し、氷上で少なくとも2時間インキュベートして、AAVウイルス粒子を沈殿させた。AAVベクターの大部分を含む細胞ペレットを、溶解培地(0.15M NaCl、50mM Tris HCl、0.05% Tween、pH8.5)に再懸濁し、氷上で超音波処理し(15秒、30%振幅)、Benzonase(250U/μL、Novagen)で、37℃で30分間処理した。次いで、粗溶解物及びPEG処理上清を、4℃で、4000rpmで20分間スピンして、PEG沈殿したAAV(ペレット)を、細胞デブリを含まない粗溶解物(上清)で再懸濁し、0.45μmフィルターを使用して更に清澄化した。
ウイルスゲノムの力価を決定するために、1μLの粗溶解物ウイルスをDNase及びProtKで消化し、続いて、定量的PCRを行った。5μLの消化されたウイルスを、IDT primetimeマスターミックス並びにCMVプロモーター領域(フォワード 5’-CATCTACGTATTAGTCATCGCTATTACCA-3’(配列番号752);リバース 5’-GAAATCCCCGTGAGTCAAACC-3’(配列番号753)、プローブ5’-TCAATGGGCGTGGATAG-3’(配列番号754))又はAAV2-ITR内に位置する62bp断片(フォワード 5’-GGAACCCCTAGTGATGGAGTT-3’(配列番号755);リバース 5’-CGGCCTCAGTGAGCGA-3’(配列番号756)、プローブ5’-CACTCCCTCTCTGCGCGCTCG-3’(配列番号757))を増幅するように設計されたプライマー及び6’FAM/Zen/IBFQプローブ(IDT)のセットから構成された25μLのqPCR反応で使用した。AAV ITRプラスミドの10倍段階希釈液(各5μLの2e+9~2e+4 DNAコピー/mL)を参照標準として使用して、ウイルス試料の力価(ウイルスゲノム(vg)/mL)を計算した。QPCRプログラムを、以下のように設定した:95℃で5分間の初期変性ステップ、続いて、95℃で1分間の変性及び60℃で1分間のアニーリング/伸長の40サイクル。
AAV形質導入:
10,000細胞/ウェルのmNPCを、AAV形質導入の48時間前に、96ウェルプレートのPLFでコーティングされたウェル上に播種した。ウイルス感染条件は全て、実験ベクター間でvg数を正規化して、約1.0e+6~1.0e+4vg/細胞の範囲の感染多重度(MOI)の一連の3倍希釈で、3連で行った。計算は、トランスフェクション時の1ウェル当たり20,000個の細胞の推定数に基づいた。bFGF/EGF増殖因子(最終濃度20ng/mL)を補充した予め平衡化したmNPC培地に希釈した最終体積が50μLのAAVベクターを各ウェルに適用した。トランスフェクションの48時間後、増殖因子を補充した新鮮な培地で、完全な培地交換を行った。トランスフェクションの5日後、編集活性(tdt+細胞定量)を、FACSによって評価した。
FACSによる編集活性の評価:
トランスフェクションの5日後、96ウェルプレート中の処理されたtdTomato mNPC又はARPE-19細胞を、dPBSで洗浄し、50μLのTrypLE及びトリプシン(0.25%)で、それぞれ15分間及び5分間処理した。細胞解離後、処理したウェルを、DMEM、10%FBS、及び1×ペニシリン/ストレプトマイシンを含有する培地でクエンチした。再懸濁した細胞を、丸底96ウェルプレートに移し、1000gで5分間遠心分離した。次いで、細胞ペレットを、1×DAPIを含有するdPBSで再懸濁し、プレートをAttune NxTフローサイトメーターのオートサンプラーに装填した。Attune NxTフローサイトメーターを、以下のゲーティングパラメータを使用して実行した:細胞を選択するためのFSC-A×SSC-A、単一細胞を選択するためのFSC-H×FSC-A、DAPI陰性生存細胞を選択するためのFSC-A×VL1-A、及びtdTomato陽性細胞を選択するためのFSC-A×YL1-A。
mRHOエキソン1遺伝子座におけるインデルのNGS分析:
トランスフェクションの5日後、96ウェルプレート中の処理されたtdTomato mNPCを、dPBSで洗浄し、50μLのTrypLE及びトリプシン(0.25%)で、それぞれ15分間及び5分間処理した。細胞解離後、処理したウェルを、DMEM、10%FBS、及び1×ペニシリン/ストレプトマイシンを含有する培地でクエンチした。次いで、細胞をスピンダウンし、得られた細胞ペレットをPBSで洗浄した後、製造業者の説明書に従ってZymoミニDNAキットを使用して、gDNA抽出のために処理した。マウスRHOエキソン1遺伝子座で生じる編集レベルを評価するために、アンプリコンを、プライマーのセット(フォワード 5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNNNGCAGCCTTGGTCTCTGTCTACG-3’(配列番号758);リバース 5’-GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTGCCCCAGTCTCTCTGCTCATACC-3’(配列番号759))を用いて200ngのgDNAから増幅し、ビーズ精製し(Beckman coulter、Agencourt Ampure XP)、次いで、再増幅して、Illuminaアダプター配列及び16ntの固有分子識別子(UMI)を組み込んだ。Fragment Analyzer DNA分析キット(Agilent、dsDNA 35~1500bp)を使用して、アンプリコンの品質及び定量化を評価した。アンプリコンを、製造業者の説明書に従ってIllumina Miseqで配列決定した。配列決定からの生fastqファイルを以下のように処理した:(1)プログラムcutadapt(v2.1)を使用して、配列を品質及びアダプター配列についてトリミングし、(2)プログラムflash2(v2.2.00)を使用して、リード1及びリード2の配列を単一の挿入配列に重ね合わせ、(3)コンセンサス挿入配列を、予想されるアンプリコン配列及びスペーサー配列とともに、プログラムCRISPResso2(v2.0.29)を実行した。このプログラムは、スペーサーの3’末端周辺のウィンドウ(スペーサーの3’末端から-3bpを中心とする30bpウィンドウ)において改変されたリードの割合(%)を定量化する。CasXの活性を、このウィンドウ内のどこかに挿入、置換、及び/又は欠失を含むリードの割合の合計として定量化した。
結果:
異なる編集実験を実施して、複数の目的のゲノム遺伝子座を標的化する異なるスペーサーを有する、新規gRNA足場バリアント(ガイド174及び229~237)と対になったCasX491によって媒介されるオンターゲット切断を定量化した。構築物を、ITR2配列に隣接するAAV骨格p59にクローニングした。タンパク質Cas 491の発現は、CMVプロモーターの制御下で駆動され、並びに足場-スペーサーの発現は、ヒトU6プロモーターの制御下で駆動される。mNPC-tdTレポーター細胞株を使用して、tdTomato遺伝子座での単一スペーサーによって媒介される二重切断効率(スペーサー12.7、TTC PAM)、並びに内因性マウスRHOエキソン1遺伝子座での単一切断効率(スペーサー11.30、CTCN PAM)を評価した。ARPE-19由来細胞株に組み込まれた二重レポーターシステムもまた、外因的に発現されたヒトWT Rho遺伝子座でのオンターゲット編集を評価するために使用した(スペーサー11.1、CTC PAM)。
スペーサー12.7及び11.30を有するgRNA足場バリアントを、それぞれ図14及び図15に示される2つの異なる用量で、マウスNPC細胞株において、ヌクレオフェクションによって試験した。構築物を、現在のベンチマークであるgRNA足場174活性と比較した。両方の標的遺伝子座において、ガイド足場バリアント231、233、234、及び235の構築物は、足場174を含む構築物よりも高いレベルで機能した。足場235は、足場174と比較して、mRHOエキソン1遺伝子座で、活性の2倍の増加を示した。本発明者らは更に、二重レポーターARPE-19細胞株を構築物p59.491.174.11.1及びp59.491.235.11.1並びに非標的スペーサー対照でヌクレオフェクションすることによって、足場235が、オフターゲット切断を増加させることなく、活性を一貫して改善することを検証した。スペーサー11.1は、外因的に発現されたmRHO-GFP遺伝子を標的とした。足場235は、174と比較して、3倍増加した活性を示した(それぞれ、Rho-GFP細胞の9%対3%)。アレル特異性を、配列がWTと1bp異なるP23H-RHO-Scarlett細胞集団の割合を調べることによって評価した。
最後に、本発明者らは、これらの足場バリアントがAAVに効率的にパッケージングされ、ウイルスで送達された場合でも強力なままであることを実証しようとした。スペーサー11.30(オンターゲット、マウスWT RHO)及び11.31(オフターゲット、マウスP23 RHO)を有するガイド足場バリアント174及び235を発現するAAVベクターで形質導入されたmNPCは、足場174と比較して、3.0e+5MOIで、オンターゲット遺伝子座で235足場バリアントを含む構築物の活性の増加を示したが(5倍超の増加、図45A及び図45B)、オフターゲットインデルは検出不可能であった。
これらの結果は、治療的に関連するゲノム標的(例えば、マウス及びヒトRHOエキソン1遺伝子座)を有する二重レポーターシステムにおいて、足場バリアントを新規の構造変異を用いて操作して、活性を増加させることができることを支持する。更に、新たに特徴付けられた足場は、全体的に2倍を超える活性の増加を示したが、1bpミスマッチスペーサー領域によるオフターゲット切断は検出されなかった。これは、スペーサー11.31によって標的化される、変異アレルがWT配列と1ヌクレオチド異なる、adRP P23H Rhoなどのアレル特異的治療戦略に関連する。この研究は、P23H RHOの救出及び遺伝毒性研究、並びに他の治療標的のために設計されたAAVベクターにおけるガイド足場235の使用を更に検証する。
実施例22:触媒的に不活性なCasXがインビトロで内因性B2M遺伝子座で編集しないことの実証
触媒的に不活性なCasXがインビトロで内因性遺伝子β-2-ミクログロブリン(B2M)を編集することができないことを実証するために実験を行う。
材料及び方法:
触媒的に不活性なCasX(dCasX)構築物の生成及びクローニング:
足場バリアント174を有するCasXバリアント491、527、668、及び676をこれらの実験で使用する。Cas9の陽性対照及び適切なガイドも含まれる。触媒的に不活性なCasX491(dCasX491;CAS096;配列番号1107)及び触媒的に不活性なCasX527(dCasX527;CAS142;配列番号1109)を生成するために、CasXバリアント491のRuvCドメインのD659、E756、D921触媒残基、並びにCasXバリアント527のRuvCドメインのD660、E757、及びD922触媒残基を、アラニンに変異させて、エンドヌクレアーゼ活性を消失させる。同様に、CasXバリアント668及び676のRuvCドメイン内の触媒残基でのD660、E757、D923からアラニンへの変異を、触媒的に不活性なCasX668(dCasX668;CAS401;(配列番号XX)及び触媒的に不活性なCasX676(dCasX676;CAS402;配列番号XX)を生成するために設計する。得られたプラスミド(表7に列挙されたdCasXバリアントアミノ酸配列)は、以下の構成を有する構築物を含む:Ef1α-SV40NLS-dCasXバリアント-SV40NLS。プラスミドはまた、内在性B2M遺伝子座を標的化するスペーサー(スペーサー。7.37;GGCCGAGAUGUCUCGCUCCG;配列番号1105)又は非標的化対照(スペーサー0.0;CGAGACGUAAUUACGUCUCG;配列番号1106)のいずれかを有するgRNA足場バリアント174をコードする配列を含む。
dCasX491、dCasX527、dCasX668、及びdCasX676をコードする配列を含む構築物を、オリゴヌクレオチドとして注文し、重複伸長PCR、続いて、等温アセンブリによって構築し、触媒的に不活性なCasXバリアントをコードするプラスミドを構築する。等温アセンブリ後、得られたプラスミドを、化学的コンピテントE.coli細胞に形質転換し、37℃で1時間回復させた後、カナマイシンLB寒天プレート上にプレーティングする。単一コロニーを採取して、コロニーPCR及びSanger配列決定を行う。配列を検証した構築物を、その後のHEK293T細胞へのトランスフェクションのためにミディプレップする。
HEK293T細胞へのプラスミドトランスフェクション:
HEK293T細胞を、96ウェルプレートの各ウェルに30,000細胞の密度で播種する。翌日、各ウェルを、リポフェクタミンを使用して、B2M遺伝子座に対する非標的化スペーサー0.0又は標的化スペーサー7.37のいずれかを有するgRNAとともに、CasXバリアント491、dCasX491、dCasX527、dCasX668、又はdCasX676(表7の配列)をコードするCasX: gRNA構築物を含む100ngの触媒的に不活性なバリアントプラスミドで一過的にトランスフェクトする。各構築物を3連で試験する。トランスフェクションの24時間後、細胞を、2μg/mLのピューロマイシンで選択する。トランスフェクションの6日後、次世代配列決定(NGS)による編集分析、及びB2M免疫染色、続いて、フローサイトメトリーによるB2Mタンパク質の発現分析のために、細胞を採取する。B2Mの発現は、細胞表面に発現されるB2M依存性HLAタンパク質を検出する抗体(BioLegend)を使用することによって決定される。HLA+細胞を、Attune NxTフローサイトメーターを使用して測定する。
NGS処理及び分析:
回収した細胞からのゲノムDNA(gDNA)を、製造業者の説明書に従ってZymo Quick-DNAミニプレッププラスキットを使用して抽出する。標的アンプリコンは、ヒトB2M遺伝子座に特異的なプライマーのセットを用いて、200ngの抽出されたgDNAから目的の領域を増幅することによって形成される。これらの遺伝子特異的プライマーは、Illuminaアダプター及び16ヌクレオチドの固有分子識別子を導入するために、5’末端に追加の配列を含む。増幅されたDNA産物を、Ampure XP DNAクリーンアップキットで精製する。Fragment Analyzer DNA分析キット(Agilent、dsDNA 35~1500bp)を使用して、アンプリコンの品質及び定量化を評価する。アンプリコンを、製造業者の説明書に従ってIllumina Miseqで配列決定する。配列決定からの生のfastqファイルを品質管理し、cutadapt v2.1、flash2 v2.2.00、及びCRISpESso2 v2.0.29を使用して処理する。各配列は、スペーサーの3’末端周辺のウィンドウ(スペーサーの3’末端から-3bpを中心とする30bpウィンドウ)において、参照配列と比較して挿入又は欠失(インデル)を含むことについて定量化する。CasX活性を、各試料について、このウィンドウ内のどこかに挿入、置換、及び/又は欠失を含むリードの割合の合計として定量化する。
結果:
この実験では、触媒的に活性なCasX491によって媒介されるB2M遺伝子座での編集が実証され、B2Mタンパク質の発現の減少をもたらすことが予想される。一方、dCasX491、dCasX527、dCasX668、又はdCasX676のいずれも、B2M遺伝子座での編集を示すとは予想されない。B2M遺伝子座の転写開始部位での触媒的に不活性なCasX分子の予想される立体障害を考慮すると、酵素的に不活性なCasX分子のいずれかによるB2Mタンパク質の発現のわずかな抑制が予想される。
実施例23:MS2ヘアピン結合親和性の改善によるXDP編集効力の増強
CasX: gRNA RNP複合体のgRNAがGag-MS2 RNA結合タンパク質(RBP)に対して高い親和性を有するMS2ヘアピンを有する官能化RNA伸長ステムを含む動員戦略を使用して、XDPの編集効力を改善することができるかどうかを決定するために実験を実施した。RNAヘアピンがMS2 RBPに結合すると、XDP粒子へのCasX RNPカーゴの動員が可能になる。編集のためにXDPが標的細胞に送達されると、このRNAヘアピン-MS2 RBPが解離して、CasXが核に移行できるようになると予想される。したがって、MS2タンパク質-RNA複合体の安定性の増加は、XDPの形成を支持する。これは、MS2 RNA結合タンパク質又はRNAヘアピン配列を変化させて、これらの成分間の結合親和性を増加させることによって達成され得る。
この原理を更に調査するため、MS2 RBPに対する様々な親和性を有するRNAヘアピンバリアントを組み込んだgRNAを、ハイスループットのインビトロ生化学アッセイを使用して評価し、平衡結合及び解離動態を評価した(Buenrostro et al.,Quantitative analysis of RNA-protein interactions on a massively parallel array reveals biophysical and evolutionary landscapes.Nat Biotechnol.32(6): 562(2014))。表34に、gRNAヘアピンバリアント及びそれらの関連するK(解離定数)値を列挙する。表35に、異なるMS2 RNAヘアピンバリアントをコードするガイドプラスミドの配列を提供する。表36に、MS2ヘアピンの配列を提供する。改善された結合親和性を有するMS2ヘアピンバリアントを含むgRNAが、XDP形成又は編集効力を増強するかどうかを調べるために、実験を実施した。具体的には、様々な平衡結合親和性を有する複数のMS2ヘアピンバリアントを、XDPの効力及び力価に対するそれらの効果について評価した。いくつかの非結合バリアントもこれらの実験に含まれた。
材料及び方法:
CasXタンパク質をコードする全てのプラスミドは、CasXバリアント491に属する。全てのXDPを、10%のVSV-G(他のXDP構造プラスミドに対するVSV-Gプラスミドの割合)でシュードタイプ化した。RNAフォールド構造を、RNAfoldウェブサーバー及びVARNAソフトウェアを用いて生成した。XDPを産生するための方法は、本明細書並びに国際公開第2021113772(A1)号(その全体が参照により援用される)に記載されている。
構造プラスミドのクローニング:
簡潔には、XDP構造プラスミドを生成するために、Gag-pol配列をpXDP1(UC Berkeley)から除去し、増幅し、CasX491、HIV-1、又はMS2 CP成分をコードする精製された断片を、製造業者のプロトコルに従ってIn-Fusion HDクローニングキット(Takara)を使用して、プラスミド骨格にクローニングした。構築された産物を、化学的にコンピテントなTurboコンピテントE.coli細胞に形質転換し、37℃で回復させた後、アンピシリンを含有するLB寒天プレート上にプレーティングした。個々のコロニーを採取し、ミニプレップし、Sanger配列決定を行い、アセンブリを検証した。表35に、プラスミドの配列を列挙する。
ガイドプラスミドのクローニング:
MS2 RNAヘアピンバリアントを含む全てのガイドプラスミドには、tdTomato標的化スペーサー12.7(CUGCAUUCUAGUUGUGGUUU;配列番号1146)が組み込まれた。tdTomato標的化スペーサーを、前述のようにクローニングした。簡潔には、スペーサーを、2つのオリゴをアニーリングすることによって作製し、適切な制限酵素を用いたGolden Gateアセンブリによって、別の足場を有するpSGプラスミドにクローニングした。クローニングしたスペーサーを、検証のために、形質転換、ミニプレップ、及びSanger配列決定に供した。
pGP2糖タンパク質のプラスミドクローニング:
簡潔には、VSV-G糖タンパク質及びCMVプロモーターをコードする配列、並びにカナマイシン耐性プラスミドから得られた骨格を、前述のように増幅及び精製した。これらの構築物を、製造業者のプロトコルに従ってIn-Fusion(登録商標)HDクローニングキット(Takara)を使用して、プラスミド骨格にクローニングした。構築された産物を、化学的にコンピテントなTurboコンピテントE.coli細胞に形質転換し、カナマイシンを含有するLB寒天プレート上にプレーティングし、37℃でインキュベートした。個々のコロニーを採取し、ミニプレップし、Sanger配列決定を行い、アセンブリを検証した。
XDPの産生:
簡潔には、HEK293T Lenti-X細胞を、70~90%コンフルエントに達するように、トランスフェクションの24時間前に、1皿当たり20×10細胞で15cm皿に播種した。翌日、Lenti-X細胞を、PEI Max(Polypus)を使用して、以下のプラスミドでトランスフェクトした:XDP構造プラスミド(CasXバリアントもコードする)、ガイドプラスミドバリアント、及びXDPシュードタイプ化のためのpGP2。トランスフェクションの24時間後、培地をOpti-MEM(Thermo Fisher)と交換した。トランスフェクションの72時間後、XDP含有培地を回収し、0.45μmのPESフィルターを通して濾過した。上清を濃縮し、遠心分離によって精製した。XDPを、Glutamax、HEPES、NEAA、Pen/Strep、2-メルカプトエタノール、B-27(ビタミンAを含まない)、及びN2を補充した500μLのDMEM/F12に再懸濁した。
tdTomato神経前駆細胞(NPC)のXDP形質導入:
tdTomato NPCを、Glutamax、HEPES、NEAA、Pen/Strep、2-メルカプトエタノール、B-27(ビタミンAを含まない)、及びN2を補充したDMEM/F12で増殖させた。細胞を、StemPro Accutase細胞解離試薬を使用して回収し、PLFでコーティングされた96ウェルプレートに播種した。48時間後、細胞を、tdTomato標的化スペーサーを含むXDPで形質導入し、ニートの再懸濁したウイルスから始めて、5つの半対数希釈を行った。次いで、細胞を、1000×gで15分間遠心分離した。形質導入されたNPCを、96時間増殖させた後、フローサイトメトリーによって、tdTomato遺伝子座での編集のマーカーとしてのtdTomatoの蛍光を分析した。フローサイトメトリーによって決定されるように、50%の細胞における編集を達成するために必要なXDP粒子の数として、EC50を決定した。アッセイは、各試料について2~3回実行し、同様の結果を得た。
結果:
Gag-MS2、Gag-pro、CasX、gRNA足場バリアント、及びVSV-Gから構成されるXDPを、元のMS2(MS2 WT)又はMS2高親和性バリアント(MS2 353)のいずれかを用いて産生した。その後、産生されたXDPを、NPCにおけるtdTomato遺伝子座でのそれらの編集効率について評価した。図49は、0.007μLの濃縮XDP調製物を使用してNPCに形質導入した場合の、フローサイトメトリーを使用してtdTomatoの蛍光によって測定したtdTomato遺伝子座での編集の割合(%)を示す。基本対照gRNA足場188及び251に加えて、高親和性足場バリアント296及び298は、MS2 WT及びMS2 353の両方で増強された効力を示し、K値が1.8~2.1nMの範囲であった。更に、中親和性足場バリアント303、304、305、307、310及び313は、9.2~36.9nMの範囲のK値を有し、有望な編集効率をもたらした。図50は、MS2 WT及びMS 353構成を組み込んだ異なるgRNA足場にわたるEC50の結果を示す。足場バリアント296、297、及び305は、足場188と比較して、わずかに高い効力を示し、この利点は、MS2 353構成でより明らかであった。図51は、gRNA MS2ヘアピンの親和性(K)と得られたXDP効力(EC50)との間の明らかな相関を示し、R値が0.81である(p<0.001)。35nM未満の親和性を有するMS2を含むXDPは、XDPへのCasX RNPの効率的な動員及びパッケージングをもたらした。しかしながら、これらの実験の条件下では、gRNA MS2ヘアピンの親和性と得られたXDP力価との間に相関関係は観察されなかった(図52)。

Claims (191)

  1. 配列番号2292、2291、2307、2281~2290、2293~2306、2308~2332、及び23530~2398からなる群から選択される配列のうちのいずれか1つと少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%、又は100%の配列同一性を有する配列を含む、ガイドRNA(gRNA)足場。
  2. 配列番号2292、2291、2307、2281~2290、2293~2306、2308~2332、及び23530~2398からなる群から選択される配列を含む、請求項1に記載のgRNA足場。
  3. 配列番号2238に対して1つ以上の改変を有する配列を含み、前記1つ以上の改変が、改善された特徴をもたらす、請求項1に記載のgRNA足場。
  4. 前記1つ以上の改変が、表19に示される1つ以上のヌクレオチドの置換、挿入、及び/又は欠失を含む、請求項3に記載のgRNA足場。
  5. 前記改善された特徴が、任意選択的にインビトロアッセイにおける、編集活性の増加、シュードノットステム安定性の増加、三重鎖領域安定性の増加、足場ステム安定性の増加、伸長ステム安定性、オフターゲットフォールディング中間体の減少、及びクラス2、V型CRISPRタンパク質に対する結合親和性の増加からなる群から選択される1つ以上の機能特性である、請求項3又は請求項4に記載のgRNA足場。
  6. 前記gRNA足場が、インビトロアッセイにおいて、配列番号2238のgRNA足場のスコアと比較して、少なくとも約2.0、少なくとも約2.5、少なくとも約3、又は少なくとも約3.5大きい改善された濃縮スコア(log)を示す、請求項3~5のいずれか一項に記載のgRNA足場。
  7. 配列番号2239に対して1つ以上の改変を有する配列を含み、前記1つ以上の改変が、改善された特徴をもたらす、請求項1に記載のgRNA足場。
  8. 前記1つ以上の改変が、表20に示される1つ以上のヌクレオチドの置換、挿入、及び/又は欠失を含む、請求項7に記載のgRNA足場。
  9. 前記改善された特徴が、任意選択的にインビトロアッセイにおける、編集活性の増加、シュードノットステム安定性の増加、三重鎖領域安定性の増加、足場ステム安定性の増加、伸長ステム安定性、オフターゲットフォールディング中間体の減少、及びクラス2、V型CRISPRタンパク質に対する結合親和性の増加からなる群から選択される1つ以上の機能特性である、請求項7又は請求項8に記載のgRNA足場。
  10. 前記gRNA足場が、インビトロアッセイにおいて、配列番号2239のgRNA足場のスコアと比較して、少なくとも約1.2、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、又は少なくとも約3.5大きい改善された濃縮スコア(log)を示す、請求項7~9のいずれか一項に記載のgRNA足場。
  11. 配列番号2239の配列に対して、C9、U11、C17、U24、A29、U54、G64、A88、及びA95からなる群から選択される位置に1つ以上の改変を含む、請求項1に記載のgRNA足場。
  12. 配列番号2239の配列に対して、C9U、U11C、C17G、U24C、A29C、54位でのGの挿入、64位でのCの挿入、A88G、及びA95Gからなる群から選択される1つ以上の改変を含む、請求項11に記載のgRNA足場。
  13. 配列番号2239の配列に対して、C9U、U11C、C17G、U24C、A29C、54位でのGの挿入、64位でのCの挿入、A88G、及びA95Gからなる改変を含む、請求項12に記載のgRNA足場。
  14. 前記改善された特徴が、シュードノットステム安定性、三重鎖領域安定性、足場バブル安定性、伸長ステム安定性、及びクラス2、V型CRISPRタンパク質に対する結合親和性からなる群から選択される、請求項7~13のいずれか一項に記載のgRNA足場。
  15. 配列番号2239の配列に対する前記64位でのCの挿入及び前記A88Gの置換が、前記伸長ステムの非対称バルジエレメントを解消し、前記gRNA足場の前記伸長ステムの安定性を増強する、請求項14に記載のgRNA足場。
  16. U11C、U24C、及びA95Gの置換が、前記gRNA足場の前記三重鎖領域の安定性を増加させる、請求項14に記載のgRNA足場。
  17. 前記A29Cの置換が、前記シュードノットステムの安定性を増加させる、請求項14に記載のgRNA足場。
  18. 前記gRNA足場が、前記伸長ステムにおいて1つ以上の異種RNA配列を含む、請求項1又は請求項2に記載のgRNA足場。
  19. 前記異種RNAが、MS2ヘアピン、Qβヘアピン、U1ヘアピンII、Uvsxヘアピン、及びPP7ステムループ、又はそれらの配列バリアントからなる群から選択される、請求項18に記載のgRNA足場。
  20. 前記異種RNA配列が、前記gRNAの安定性を増加させる、請求項18又は請求項19に記載のgRNA足場。
  21. 前記異種RNAが、タンパク質、RNA、DNA、又は小分子に結合することができる、請求項18又は請求項19に記載のgRNA足場。
  22. 前記gRNA足場が、Rev応答エレメント(RRE)又はその一部を含む、請求項18~21のいずれか一項に記載のgRNA足場。
  23. 前記RRE又はその一部が、配列UGGGCGCAGCGUCAAUGACGCUGACGGUACA(配列番号1280)を有する前記RREのステムIIB、配列CAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUG(配列番号1282)を有する前記RREのステムII-V、配列GCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGC(配列番号1281)を有する前記RREのステムII、配列GCUGACGGUACAGGC(配列番号1284)を有するステムIIBのRev結合エレメント(RBE)、及び配列AGGAGCUUUGUUCCUUGGGUUCUUGGGAGCAGCAGGAAGCACUAUGGGCGCAGCGUCAAUGACGCUGACGGUACAGGCCAGACAAUUAUUGUCUGGUAUAGUGCAGCAGCAGAACAAUUUGCUGAGGGCUAUUGAGGCGCAACAGCAUCUGUUGCAACUCACAGUCUGGGGCAUCAAGCAGCUCCAGGCAAGAAUCCUGGCUGUGGAAAGAUACCUAAAGGAUCAACAGCUCCU(配列番号1283)を有する全長RREからなる群から選択される、請求項22に記載のgRNA足場。
  24. 前記gRNA足場が、1つ以上のチミン(T)を含む、請求項1~23のいずれか一項に記載のgRNA。
  25. 請求項1~24のいずれか一項に記載のgRNA足場と、前記gRNA足場の3’末端の、標的核酸配列に相補的である標的化配列と、を含む、gRNA。
  26. 前記標的化配列が、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、又は30ヌクレオチドを有する、請求項25に記載のgRNA。
  27. 前記標的化配列が、18、19、又は20ヌクレオチドを有する、請求項26に記載のgRNA。
  28. 前記gRNAが、クラス2、V型CRISPRタンパク質とリボ核タンパク質(RNP)複合体を形成することができる、請求項25~27のいずれか一項に記載のgRNA。
  29. 操作されたクラス2、V型CRISPRタンパク質であって、
    a.QPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPEKDSDEAVTYSLGKFGQ(配列番号2335)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むNTSBドメインと、
    b.RALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSF(配列番号2336)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むヘリックスI-IIドメインと、
    c.PLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALRPYLSSEEDRKKGKKFARYQLGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAE(配列番号2351)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むヘリックスIIドメインと、
    d.SSNIKPMNLIGVDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAKKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAERQYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTC(配列番号2352)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むRuvC-Iドメインと、を含む、操作されたクラス2、V型CRISPRタンパク質。
  30. 前記CRISPRタンパク質が、QEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQ(配列番号2342)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むOBD-Iドメインを含む、請求項29に記載のクラス2、V型CRISPRタンパク質。
  31. 前記CRISPRタンパク質が、
    NSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLD(配列番号2347)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むOBD-IIドメインを含む、請求項29又は請求項30に記載のクラス2、V型CRISPRタンパク質。
  32. 前記CRISPRタンパク質が、PISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVA(配列番号2343)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むヘリックスI-Iドメインを含む、請求項29~31のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  33. 前記CRISPRタンパク質が、SNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETH(配列番号2349)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むTSLドメインを含む、請求項29~32のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  34. 前記CRISPRタンパク質が、
    ADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV(配列番号2350)の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含むRuvC-IIドメインを含む、請求項29~33のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  35. 配列番号416の配列、又はそれと少なくとも80%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、若しくは少なくとも99%の同一性を有する配列を含む、請求項34に記載のクラス2、V型CRISPRタンパク質。
  36. 前記クラス2、V型CRISPRタンパク質が、1つ以上のドメインに少なくとも1つの改変を含む、請求項29~35のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  37. 前記少なくとも1つの改変が、
    a.ドメインにおける少なくとも1つのアミノ酸置換、
    b.ドメインにおける少なくとも1つのアミノ酸欠失、
    c.ドメインにおける少なくとも1つのアミノ酸挿入、又は
    d.(a)~(c)の任意の組み合わせを含む、請求項36に記載のクラス2、V型CRISPRタンパク質。
  38. 配列番号2335に対して、P2、S4、Q9、E15、G20、G33、L41、Y51、F55、L68、A70、E75、K88、及びG90からなる群から選択される前記NTSBドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36又は請求項37に記載のクラス2、V型CRISPRタンパク質。
  39. 前記NTSBドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2335に対する、2位でのGの挿入、4位でのIの挿入、4位でのLの挿入、Q9P、E15S、G20D、30位でのSの欠失、G33T、L41A、Y51T、F55V、L68D、L68E、L68K、A70Y、A70S、E75A、E75D、E75P、K88Q、及びG90Qからなる群から選択される、請求項38に記載のクラス2、V型CRISPRタンパク質。
  40. 配列番号2336に対して、I24、A25、Y29 G32、G44、S48、S51、Q54、I56、V63、S73、L74、K97、V100、M112、L116、G137、F138、及びS140からなる群から選択される前記ヘリックスI-IIドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36~39のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  41. 前記ヘリックスI-IIドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2336に対する、24位でのTの挿入、25位でのCの挿入、Y29F、G32Y、G32N、G32H、G32S、G32T、G32A、G32V、32位でのGの欠失、G32S、G32T、G44L、G44H、S48H、S48T、S51T、Q54H、I56T、V63T、S73H、L74Y、K97G、K97S、K97D、K97E、V100L、M112T、M112W、M112R、M112K、L116K、G137R、G137K、G137N、138位でのQの挿入、及びS140Qからなる群から選択される、請求項40に記載のクラス2、V型CRISPRタンパク質。
  42. 配列番号2351に対して、L2、V3、E4、R5、Q6、A7、E9、V10、D11、W12、W13、D14、M15、V16、C17、N18、V19、K20、L22、I23、E25、K26、K31、Q35、L37、A38、K41、R 42、Q43、E44、L46、K57、Y65、G68、L70、L71、L72、E75、G79、D81、W82、K84、V85、Y86、D87、I93、K95、K96、E98、L100、K102、I104、K105、E109、R110、D114、K118、A120、L121、W124、L125、R126、A127、A129、I133、E134、G135、L136、E138、D140、K141、D142、E143、F144、C145、C147、E148、L149、K150、L151、Q152、K153、L158、E166、及びA167からなる群から選択される前記ヘリックスIIドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36~41のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  43. 前記ヘリックスIIドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2351に対する、2位でのAの挿入、2位でのHの挿入、2位でのLの欠失、及び3位でのVの欠失、V3E、V3Q、V3F、3位でのVの欠失、3位でのDの挿入、V3P、E4P、4位でのEの欠失、E4D、E4L、E4R、R5N、Q6V、6位でのQの挿入、7位でのGの挿入、9位でのHの挿入、9位でのAの挿入、VD10、0位でのT1の挿入、10位でのVの欠失、10位でのFの挿入、11位でのDの挿入、11位でのDの欠失、D11S、12位でのWの欠失、W12T、W12H、12位でのPの挿入、13位でのQの挿入、12位でのGの挿入、13位でのRの挿入、W13P、W13D、13位でのDの挿入、W13L、14位でのPの挿入、14位でのDの挿入、14位でのDの欠失、及び15位でのMの欠失、15位でのMの欠失、16位でのTの挿入、17位でのPの挿入、N18I、V19N、V19H、K20D、L22D、I23S、E25C、E25P、25位でのGの挿入、K26T、K27E、K31L、K31Y、Q35D、Q35P、37位でのSの挿入、37位でのLの欠失、及び38位でのAの欠失、K41L、42位でのRの挿入、43位でのQの欠失、及び44位でのEの欠失、L46N、K57Q、Y65T、G68M、L70V、L71C、L72D、L72N、L72W、L72Y、E75F、E75L、E75Y、G79P、79位でのEの挿入、81位でのTの挿入、81位でのRの挿入、81位でのWの挿入、81位でのYの挿入、82位でのWの挿入、82位でのYの挿入、W82G、W82R、K84D、K84H、K84P、K84T、V85L、V85A、85位でのLの挿入、Y86C、D87G、D87M、D87P、I93C、K95T、K96R、E98G、L100A、K102H、I104T、I104S、I104Q、K105D、109位でのKの挿入、E109L、R110D、110位でのRの欠失、D114E、114位でのDの挿入、K118P、A120R、L121T、W124L、L125C、R126D、A127E、A127L、A129T、A129K、I133E、133位でのCの挿入、134位でのSの挿入、134位でのGの挿入、135位でのRの挿入、G135P、L136K、L136D、L136S、L136H、138位でのEの欠失、D140R、140位でのDの挿入、141位でのPの挿入、142位でのDの挿入、143+位でのEの欠失、144位でのFの欠失、143位でのQの挿入、F144K、144位でのFの欠失、144位でのFの欠失、及び145位でのCの欠失、C145R、145位でのGの挿入、C145K、C147D、148位でのVの挿入、E148D、149位でのHの挿入、L149R、K150R、L151H、Q152C、K153P、L158S、E166L、及び167位でのFの挿入からなる群から選択される、請求項42に記載のクラス2、V型CRISPRタンパク質。
  44. 配列番号2352に対して、I4、K5、P6、M7、N8、L9、V12、G49、K63、K80、N83、R90、M125、及びL146からなる群から選択される前記RuvC-Iドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36~43のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  45. 前記RuvC-Iドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2351に対する、4位でのIの挿入、5位でのSの挿入、6位でのTの挿入、6位でのNの挿入、7位でのRの挿入、7位でのKの挿入、8位でのHの挿入、8位でのSの挿入、V12L、G49W、G49R、S51R、S51K、K62S、K62T、K62E、V65A、K80E、N83G、R90H、R90G、M125S、M125A、L137Y、137位でのPの挿入、141位でのLの欠失、L141R、L141D、142位でのQの挿入、143位でのRの挿入、143位でのNの挿入、E144N、146位でのPの挿入、L146F、P147A、K149Q、T150V、152位でのRの挿入、H153の挿入、T155Q、155位でのHの挿入、155位でのRの挿入、156位でのLの挿入、156位でのLの欠失、156位でのWの挿入、157位でのAの挿入、157位でのFの挿入、A157S、Q158K、159位でのYの欠失、T160Y、T160F、161位でのIの挿入、S161P、T163P、163位でのNの挿入、C164K、及びC164Mからなる群から選択される、請求項44に記載のクラス2、V型CRISPRタンパク質。
  46. 配列番号2342に対して、I3、K4、R5、I6、N7、K8、K15、D16、N18、P27、M28、V33、R34、M36、R41、L47、R48、E52、P55、及びQ56からなる群から選択される前記OBD-Iドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36~45のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  47. 前記OBD-Iドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2342に対する、3位でのGの挿入、I3G、I3E、4位でのGの挿入、K4G、K4P、K4S、K4W、K4W、R5P、5位でのPの挿入、5位でのGの挿入、R5S、5位でのSの挿入、R5A、R5P、R5G、R5L、I6A、I6L、6位でのGの挿入、N7Q、N7L、N7S、K8G、K15F、D16W、16位でのFの挿入、F18の挿入、27位でのPの挿入、M28P、M28H、V33T、R34P、M36Y、R41P、L47P、48位でのPの挿入、E52P、55位でのPの挿入、55位でのPの欠失、及び56位でのQの欠失、Q56S、Q56P、56位でのDの挿入、56位でのTの挿入、及びQ56Pからなる群から選択される、請求項46に記載のクラス2、V型CRISPRタンパク質。
  48. 配列番号2347に対して、S2、I3、L4、K11、V24、K37、R42、A53、T58、K63、M70、I82、Q92、G93、K110、L121、R124、R141、E143、V144、及びL145からなる群から選択される前記OBD-IIドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36~47のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  49. 前記OBD-IIドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2342に対する、2位でのSの欠失、I3R、I3K、3位でのIの欠失、及びL4の欠失、4位でのLの欠失、K11T、24位でのPの挿入、K37G、R42E、53位でのSの挿入、58位でのRの挿入、63位でのKの欠失、M70T、I82T、Q92I、Q92F、Q92V、Q92A、93位でのAの挿入、K110Q、R115Q、L121T、124位でのAの挿入、141位でのRの挿入、143位でのDの挿入、143位でのAの挿入、144位でのWの挿入、及び145位でのAの挿入からなる群から選択される、請求項48に記載のクラス2、V型CRISPRタンパク質。
  50. 配列番号2349に対して、S1、N2、C3、G4、F5、I7、K18、V58、S67、T76、G78、S80、G81、E82、S85、V96、及びE98からなる群から選択される前記TSLドメインにおける1つ以上のアミノ酸位置で改変を含む、請求項36~49のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  51. 前記OBD-IIドメインにおける1つ以上のアミノ酸位置での前記1つ以上の改変が、配列番号2349に対する、1位でのMの挿入、2位でのNの欠失、2位でのVの挿入、C3S、4位でのGの挿入、4位でのWの挿入、F5P、7位でのWの挿入、K18G、V58D、67位でのAの挿入、T76E、T76D、T76N、G78D、80位でのSの欠失、81位でのGの欠失、82位でのEの挿入、82位でのNの挿入、S85I、V96C、V96T、及びE98Dからなる群から選択される、請求項50に記載のクラス2、V型CRISPRタンパク質。
  52. 配列番号2と比較して改善された特徴を示し、前記改善された特徴が、gRNAに対する結合親和性の増加、前記標的核酸に対する結合親和性の増加、前記標的核酸の前記編集においてより広範囲のPAM配列を利用する能力の改善、前記標的核酸の巻き戻しの改善、編集活性の増加、編集効率の改善、前記標的核酸の切断に対する編集特異性の改善、オフターゲット編集又は前記標的核酸の切断の減少、編集され得る真核生物ゲノムの割合の増加、ヌクレアーゼの活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、DNAの前記非標的鎖の結合の増加、タンパク質安定性の改善、タンパク質:gRNA(RNP)複合体の安定性の増加、並びに改善された融合体特徴を含む、実施形態29~51のいずれか1つに記載のクラス2、V型CRISPRタンパク質。
  53. 前記改善された特徴が、TTC、ATC、GTC、又はCTC PAM配列を含む標的核酸配列での切断活性の増加を含む、請求項52に記載のクラス2、V型CRISPRタンパク質。
  54. 前記改善された特徴が、配列番号416の配列の切断活性と比較して、ATC又はCTC PAM配列を含む標的核酸配列での切断活性の増加を含む、請求項53に記載のクラス2、V型CRISPRタンパク質。
  55. 前記改善された切断活性が、インビトロアッセイにおいて、配列番号416の配列のスコアと比較して、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、少なくとも約6、少なくとも約7、少なくとも約8、又はそれ以上大きい濃縮スコア(log)である、請求項54に記載のクラス2、V型CRISPRタンパク質。
  56. 前記改善された特徴が、配列番号416の配列と比較して、CTC PAM配列を含む標的核酸配列での切断活性の増加を含む、請求項54に記載のクラス2、V型CRISPRタンパク質。
  57. 前記改善された切断活性が、インビトロアッセイにおいて、配列番号416の配列のスコアと比較して、少なくとも約2、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、若しくは少なくとも約6、又はそれ以上大きい濃縮スコア(log)である、請求項56に記載のクラス2、V型CRISPRタンパク質。
  58. 前記改善された特徴が、配列番号416の配列と比較して、TTC PAM配列を含む標的核酸配列での切断活性の増加を含む、請求項53に記載のクラス2、V型CRISPRタンパク質。
  59. 前記改善された切断活性が、インビトロアッセイにおいて、配列番号416の配列と比較して、少なくとも約1.5、少なくとも約2.0、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、若しくは少なくとも約6log、又はそれ以上大きい濃縮スコアである、請求項58に記載のクラス2、V型CRISPRタンパク質。
  60. 前記改善された特徴が、配列番号416の配列と比較して、前記標的核酸配列の切断に対する特異性の増加を含む、請求項52に記載のクラス2、V型CRISPRタンパク質。
  61. 前記増加した特異性が、インビトロアッセイにおいて、配列番号416の配列と比較して、少なくとも約2.0、少なくとも約2.5、少なくとも約3、少なくとも約3.5、少なくとも約4、少なくとも約4.5、少なくとも約5、若しくは少なくとも約6log、又はそれ以上大きい濃縮スコアである、請求項60に記載のクラス2、V型CRISPRタンパク質。
  62. 前記改善された特徴が、前記標的核酸配列のオフターゲット切断の減少を含む、請求項52に記載のクラス2、V型CRISPRタンパク質。
  63. 前記クラス2、V型CRISPRタンパク質が、表3に示される配列番号415~592及び1147~1231の配列からなる群から選択される配列、又はそれと少なくとも約50%、少なくとも約60%、少なくとも約70%、少なくとも約80%、少なくとも約90%、若しくは少なくとも約95%、若しくは少なくとも約96%、若しくは少なくとも約97%、若しくは少なくとも約98%、若しくは少なくとも約99%の配列同一性を有する配列を有する、請求項29~62のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  64. 表3に示される配列番号415~592及び1147~1231からなる群から選択される配列を含む、請求項29~62のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  65. 1つ以上の核局在化シグナル(NLS)を含む、請求項29~64のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  66. 前記1つ以上のNLSが、PKKKRKV(配列番号352)、KRPAATKKAGQAKKKK(配列番号353)、PAAKRVKLD(配列番号354)、RQRRNELKRSP(配列番号355)、NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(配列番号356)、RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(配列番号357)、VSRKRPRP(配列番号358)、PPKKARED(配列番号359)、PQPKKKPL(配列番号360)、SALIKKKKKMAP(配列番号361)、DRLRR(配列番号362)、PKQKKRK(配列番号363)、RKLKKKIKKL(配列番号364)、REKKKFLKRR(配列番号365)、KRKGDEVDGVDEVAKKKSKK(配列番号366)、RKCLQAGMNLEARKTKK(配列番号367)、PRPRKIPR(配列番号368)、PPRKKRTVV(配列番号369)、NLSKKKKRKREK(配列番号370)、RRPSRPFRKP(配列番号371)、KRPRSPSS(配列番号372)、KRGINDRNFWRGENERKTR(配列番号373)、PRPPKMARYDN(配列番号374)、KRSFSKAF(配列番号375)、KLKIKRPVK(配列番号376)、PKKKRKVPPPPAAKRVKLD(配列番号377)、PKTRRRPRRSQRKRPPT(配列番号378)、SRRRKANPTKLSENAKKLAKEVEN(配列番号379)、KTRRRPRRSQRKRPPT(配列番号380)、RRKKRRPRRKKRR(配列番号381)、PKKKSRKPKKKSRK(配列番号382)、HKKKHPDASVNFSEFSK(配列番号383)、QRPGPYDRPQRPGPYDRP(配列番号384)、LSPSLSPLLSPSLSPL(配列番号385)、RGKGGKGLGKGGAKRHRK(配列番号386)、PKRGRGRPKRGRGR(配列番号387)、PKKKRKVPPPPKKKRKV(配列番号389)、PAKRARRGYKC(配列番号63)、KLGPRKATGRW(配列番号64)、PRRKREE(配列番号65)、PYRGRKE(配列番号66)、PLRKRPRR(配列番号67)、PLRKRPRRGSPLRKRPRR(配列番号68)、PAAKRVKLDGGKRTADGSEFESPKKKRKV(配列番号69)、PAAKRVKLDGGKRTADGSEFESPKKKRKVGIHGVPAA(配列番号70)、PAAKRVKLDGGKRTADGSEFESPKKKRKVAEAAAKEAAAKEAAAKA(配列番号71)、PAAKRVKLDGGKRTADGSEFESPKKKRKVPG(配列番号72)、KRKGSPERGERKRHW(配列番号73)、KRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号74)、及びPKKKRKVGGSKRTADSQHSTPPKTKRKVEFEPKKKRKV(配列番号75)からなる配列の群から選択され、任意選択的に、前記1つ以上のNLSが、リンカーペプチドを用いて、クラス2、V型CRISPRタンパク質又は隣接するNLSに連結され、前記リンカーペプチドが、SR、RS、(G)n(配列番号1023)、(GS)n(配列番号1024)、(GSGGS)n(配列番号399)、(GGSGGS)n(配列番号400)、(GGGS)n(配列番号401)、GGSG(配列番号402)、GGSGG(配列番号403)、GSGSG(配列番号404)、GSGGG(配列番号405)、GGGSG(配列番号406)、GSSSG(配列番号407)、GPGP(配列番号408)、GGP、PPP、PPAPPA(配列番号409)、PPPG(配列番号24)、PPPGPPP(配列番号410)、PPP(GGGS)n(配列番号25)、(GGGS)nPPP(配列番号26)、AEAAAKEAAAKEAAAKA(配列番号1025)、及びTPPKTKRKVEFE(配列番号27)(式中、nは1~5である)からなる群から選択される、請求項65に記載のクラス2、V型CRISPRタンパク質。
  67. 前記1つ以上のNLSが、前記タンパク質のC末端又はその近くに位置する、請求項65又は請求項66に記載のクラス2、V型CRISPRタンパク質。
  68. 前記1つ以上のNLSが、前記タンパク質のN末端又はその近くに位置する、請求項65又は請求項66に記載のクラス2、V型CRISPRタンパク質。
  69. 少なくとも2つのNLSを含み、前記少なくとも2つのNLSが、前記タンパク質のN末端又はその近く及びC末端又はその近くに位置する、請求項65又は請求項66に記載のクラス2、V型CRISPRタンパク質。
  70. 前記クラス2、V型CRISPRタンパク質が、gRNAとリボ核タンパク質複合体(RNP)を形成することができる、請求項29~69のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  71. 前記RNPが、配列番号1~3のうちのいずれか1つの参照タンパク質及び配列番号4又は配列番号5のgRNAのRNPと比較して、少なくとも1つ以上の改善された特徴を示す、請求項70に記載のクラス2、V型CRISPRタンパク質。
  72. 前記改善された特徴が、ガイド核酸(gRNA)に対する結合親和性の増加、標的核酸に対する結合親和性の増加、標的核酸の前記編集において、ATC、CTC、GTC、又はTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の改善、前記標的核酸の巻き戻しの増加、編集活性の増加、編集効率の増加、前記標的核酸の編集特異性の増加、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、前記標的核酸のオフターゲット切断の減少、非標的核酸鎖の結合の増加、及びタンパク質:gRNA複合体(RNP)の安定性の増加からなる群から選択される、実施形態71に記載のクラス2、V型CRISPRタンパク質。
  73. 前記RNPの前記改善された特徴が、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5の前記gRNAの前記RNPと比較して、少なくとも約1.1~約100,000倍増加している、請求項71又は請求項72に記載のクラス2、V型CRISPRタンパク質。
  74. 前記RNPの前記改善された特徴が、配列番号1、配列番号2、又は配列番号3の前記参照タンパク質、及び配列番号4又は配列番号5の前記gRNAの前記RNPと比較して、少なくとも約10倍、少なくとも約100倍、少なくとも約1,000倍、又は少なくとも約10,000倍増加している、請求項71又は請求項72に記載のクラス2、V型CRISPRタンパク質。
  75. 前記RNPの前記改善された特徴が、配列番号2の前記参照タンパク質、及び配列番号4又は5を含む前記gRNAの前記RNPと比較して、編集効率の1.1~100倍の改善を含む、請求項71~74のいずれか一項に記載のクラス2、V型CRISPRタンパク質。
  76. gRNA及びクラス2、V型CRISPRタンパク質を含む遺伝子編集ペアであって、前記ペアが、
    a.請求項25~28のいずれか一項に記載のgRNAと、
    b.請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質と、を含む、遺伝子編集ペア。
  77. 前記gRNA及び前記クラス2、V型CRISPRタンパク質が、リボ核タンパク質複合体(RNP)を形成することができる、請求項76に記載の遺伝子編集ペア。
  78. 前記gRNA及び前記クラス2、V型CRISPRタンパク質が、リボ核タンパク質複合体(RNP)として一緒に会合している、請求項76又は請求項77に記載の遺伝子編集ペア。
  79. 前記クラス2、V型CRISPRタンパク質及び前記gRNAのRNPが、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5の配列を含むgRNAのRNPと比較して、少なくとも1つ以上の改善された特徴を示す、請求項77又は請求項78に記載の遺伝子編集ペア。
  80. 前記改善された特徴が、前記gRNAに対する前記クラス2、V型CRISPRタンパク質の結合親和性の増加、標的核酸に対する結合親和性の増加、標的核酸の前記編集において、ATC、CTC、GTC、又はTTCを含む1つ以上のより広範囲のPAM配列を利用する能力の増加、前記標的核酸の巻き戻しの増加、編集活性の増加、編集効率の増加、前記標的核酸の編集特異性の増加、ヌクレアーゼ活性の増加、二本鎖切断のための標的鎖装填の増加、一本鎖ニッキングのための標的鎖装填の減少、前記標的核酸のオフターゲット切断の減少、非標的核酸鎖の結合の増加、タンパク質:gRNA複合体(RNP)の安定性の増加、及び融合体特徴の増加からなる群のうちの1つ以上から選択される、請求項79に記載の遺伝子編集ペア。
  81. 前記クラス2、V型CRISPRタンパク質及び前記gRNAの前記RNPの前記改善された特徴が、同等のインビトロアッセイシステムにおいて、配列番号1、配列番号2又は配列番号3の参照タンパク質、及び配列番号4又は配列番号5の配列を含む前記gRNAの前記RNPと比較して、少なくとも約1.1~約100倍又はそれ以上増加している、請求項79又は請求項80に記載の遺伝子編集ペア。
  82. 前記クラス2、V型CRISPRタンパク質の前記改善された特徴が、同等のインビトロアッセイシステムにおいて、配列番号1、配列番号2、又は配列番号3の前記参照タンパク質、及び配列番号4又は配列番号5の配列を含む前記gRNAと比較して、少なくとも約1.1倍、少なくとも約2倍、少なくとも約10倍、少なくとも約100倍、又はそれ以上増加している、請求項79又は請求項80に記載の遺伝子編集ペア。
  83. 前記PAM配列TTC、ATC、GTC、又はCTCのうちのいずれか1つが、細胞アッセイシステムにおいて前記gRNAの前記標的化配列と同一性を有するプロトスペーサーの前記非標的鎖に対して1ヌクレオチド5’側に位置する場合、前記クラス2、V型CRISPRタンパク質及び前記gRNAを含む前記RNPが、同等のアッセイシステムにおいて、配列番号1、配列番号2、又は配列番号3の参照タンパク質、及び参照gRNAを含むRNPの編集効率及び/又は結合と比較して、前記標的核酸におけるより高い編集効率及び/又は標的核酸配列の結合を示す、請求項77~82のいずれか一項に記載の遺伝子編集ペア。
  84. 前記PAM配列が、TTCである、請求項83に記載の遺伝子編集ペア。
  85. 前記PAM配列が、ATCである、請求項83に記載の遺伝子編集ペア。
  86. 前記PAM配列が、CTCである、請求項83に記載の遺伝子編集ペア。
  87. 前記PAM配列が、GTCである、請求項83に記載の遺伝子編集ペア。
  88. 前記クラス2、V型CRISPR及び前記gRNAを含む前記RNPが、同等のインビトロアッセイシステムで評価した場合、配列番号1~3の前記参照タンパク質及び配列番号4又は配列番号5の前記gRNAのうちのいずれか1つのRNPの結合親和性と比較して、少なくとも1.5倍、少なくとも2倍、少なくとも4倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、又は少なくとも40倍大きい、前記1つ以上のPAM配列に対する結合親和性の増加を示す、請求項83~87のいずれか一項に記載の遺伝子編集ペア。
  89. 前記クラス2、V型CRISPR及び前記gRNAを含む前記RNPが、同等のインビトロアッセイシステムで評価した場合、配列番号1~3の前記参照タンパク質及び配列番号4又は配列番号5の前記gRNAのうちのいずれか1つのRNPの編集効率と比較して、少なくとも1.5倍、少なくとも2倍、少なくとも4倍、少なくとも10倍、少なくとも20倍、少なくとも30倍、又は少なくとも40倍高い編集効率の増加を示す、請求項77~88のいずれか一項に記載の遺伝子編集ペア。
  90. 前記クラス2、V型CRISPR及び前記gRNAが、同等のインビトロアッセイシステムで評価した場合、配列番号1~3の前記参照タンパク質及び配列番号4又は配列番号5の前記gRNAのうちのいずれか1つのRNPと比較して、少なくとも約5%、少なくとも約10%、少なくとも約15%、又は少なくとも約20%高い割合の切断コンピテントコンフォメーションを有するRNPを形成することができる、請求項77~89のいずれか一項に記載の遺伝子編集ペア。
  91. 前記クラス2、V型CRISPR及び前記gRNAを含む前記RNPが、時限インビトロアッセイにおいて、同等のインビトロアッセイシステムで評価した場合の配列番号1~3の前記参照タンパク質及び配列番号4又は配列番号5の前記gRNAのうちのいずれか1つのRNPと比較して、少なくとも約5倍、少なくとも約10倍、又は少なくとも約20倍高い前記標的核酸の切断速度を示す、請求項77~90のいずれか一項に記載の遺伝子編集ペア。
  92. 前記クラス2、V型CRISPR及び前記gRNAを含む前記RNPが、時限インビトロアッセイにおいて、同等のインビトロアッセイシステムで評価した場合の配列番号1~3の前記参照タンパク質及び配列番号4又は配列番号5の前記gRNAのうちのいずれか1つのRNPと比較して、少なくとも約5倍、少なくとも約10倍、少なくとも約20倍、又は少なくとも約100倍高い前記標的核酸のより高い割合の編集を示す、請求項77~91のいずれか一項に記載の遺伝子編集ペア。
  93. 表7に示される配列番号44~62及び1232~1235からなる群から選択される配列、又はそれと少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%、少なくとも98%、少なくとも99%を有する配列を含む、触媒的に不活性なクラス2、V型CRISPRタンパク質。
  94. 表7に示される配列番号44~62及び1232~1235からなる群から選択される配列を含む、触媒的に不活性なクラス2、V型CRISPRタンパク質。
  95. 前記触媒的に不活性なクラス2、V型CRISPRタンパク質及び請求項25~28のいずれか一項に記載のgRNAのRNPが、標的核酸に結合する能力を保持する、請求項93又は請求項94に記載のクラス2、V型CRISPRタンパク質。
  96. 請求項1~24のいずれか一項に記載のgRNA足場又は請求項25~28のいずれか一項に記載のgRNAをコードする配列を含む、核酸。
  97. 請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質をコードする配列を含む、核酸。
  98. 前記クラス2、V型CRISPRタンパク質をコードする前記配列が、真核細胞における発現のためにコドン最適化されている、請求項97に記載の核酸。
  99. 請求項25~28のいずれか一項に記載のgRNA、請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質、又は請求項96~98のいずれか一項に記載の核酸を含む、ベクター。
  100. 前記ベクターが、プロモーターを含む、請求項99に記載のベクター。
  101. 前記ベクターが、レトロウイルスベクター、レンチウイルスベクター、アデノウイルスベクター、アデノ随伴ウイルス(AAV)ベクター、単純ヘルペスウイルス(HSV)ベクター、CasX送達粒子(XDP)、プラスミド、ミニサークル、ナノプラスミド、DNAベクター、及びRNAベクターからなる群から選択される、請求項99又は請求項100に記載のベクター。
  102. 前記ベクターが、AAVベクターである、請求項101に記載のベクター。
  103. 前記AAVベクターが、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV-Rh74、又はAAVRh10から選択される、請求項102に記載のベクター。
  104. 前記ベクターが、レトロウイルスベクターである、請求項101に記載のベクター。
  105. 前記ベクターが、gagポリタンパク質の1つ以上の成分を含むXDPである、請求項101に記載のベクター。
  106. 前記gagポリタンパク質の前記1つ以上の成分が、マトリックスタンパク質(MA)、ヌクレオカプシドタンパク質(NC)、カプシドタンパク質(CA)、p1ペプチド、p6ペプチド、P2Aペプチド、P2Bペプチド、P10ペプチド、p12ペプチド、PP21/24ペプチド、P12/P3/P8ペプチド、P20ペプチド、及びプロテアーゼ切断部位からなる群から選択される、請求項105に記載のベクター。
  107. 前記クラス2、V型CRISPRタンパク質及び前記gRNAが、RNPにおいて一緒に会合している、請求項105又は請求項106に記載のベクター。
  108. 糖タンパク質トロピズム因子を含む、請求項105~107のいずれか一項に記載のベクター。
  109. 前記糖タンパク質トロピズム因子が、標的細胞の細胞表面マーカーに対する結合親和性を有し、前記XDPの前記標的細胞への侵入を促進する、請求項108に記載のベクター。
  110. ドナー鋳型を含む、請求項99~109のいずれか一項に記載のベクター。
  111. 請求項99~110のいずれか一項に記載のベクターを含む、宿主細胞。
  112. 前記宿主細胞が、ベビーハムスター腎線維芽細胞(BHK)細胞、ヒト胎児腎臓293(HEK293)細胞、ヒト胎児腎臓293T(HEK293T)細胞、NS0細胞、SP2/0細胞、YO骨髄腫細胞、P3X63マウス骨髄腫細胞、PER細胞、PER.C6細胞、ハイブリドーマ細胞、NIH3T3細胞、SV40遺伝物質を有するCV-1(サル)起源(COS)細胞、HeLa、チャイニーズハムスター卵巣(CHO)細胞、又は酵母細胞からなる群から選択される、請求項111に記載の宿主細胞。
  113. 細胞における標的核酸を改変する方法であって、前記細胞の前記標的核酸を、i)請求項76~92のいずれか一項に記載の遺伝子編集ペア、ii)請求項76~92のいずれか一項に記載の遺伝子編集ペアとドナー鋳型、iii)(i)若しくは(ii)の前記遺伝子編集ペアをコードする1つ以上の核酸、iv)(iii)の前記核酸を含むベクター、v)(i)若しくは(ii)の前記遺伝子編集ペアを含むXDP、又はvi)(i)~(v)のうちの2つ以上の組み合わせ、と接触させることを含み、前記標的核酸の前記接触が、前記標的核酸を改変する、方法。
  114. 前記標的を、前記標的核酸の異なる領域又は重複する領域に相補的な標的化配列を含む第1及び第2のgRNA又は複数のgRNAを含む複数の遺伝子編集ペアと接触させることを含む、請求項113に記載の方法。
  115. 前記標的を、前記標的核酸の異なる領域又は重複する領域に相補的な標的化配列を含む第1及び第2のgRNA又は複数のgRNAを含む遺伝子編集ペアをコードする複数の核酸と接触させることを含む、請求項113に記載の方法。
  116. 前記標的を、前記標的核酸の異なる領域又は重複する領域に相補的な標的化配列を含む第1及び第2のgRNA又は複数のgRNAを含む遺伝子編集ペアを含む複数のXDPと接触させることを含む、請求項113に記載の方法。
  117. 前記接触させることが、前記標的核酸を前記遺伝子編集ペアと結合させることと、前記標的核酸に1つ以上の一本鎖切断を導入することと、を含み、前記改変することが、前記標的核酸に変異、挿入、又は欠失を導入することを含む、請求項113に記載の方法。
  118. 前記接触させることが、前記標的核酸を結合させることと、前記標的核酸に1つ以上の二本鎖切断を導入することと、を含み、前記改変することが、前記標的核酸に変異、挿入、又は欠失を導入することを含む、請求項113~116のいずれか一項に記載の方法。
  119. 前記標的核酸をドナー鋳型核酸のヌクレオチド配列と接触させることを含み、前記ドナー鋳型が、前記標的核酸と相同性を有するヌクレオチド配列を含む、請求項113~118のいずれか一項に記載の方法。
  120. 前記ドナー鋳型が、前記ドナー鋳型の5’末端及び3’末端に相同アームを含む、請求項119に記載の方法。
  121. 前記ドナー鋳型が、相同組換え修復によって切断部位で前記標的核酸に挿入される、請求項119又は請求項120に記載の方法。
  122. 前記ドナー鋳型が、非相同末端結合(NHEJ)又はマイクロホモロジー末端結合(MMEJ)によって切断部位で前記標的核酸に挿入される、請求項121に記載の方法。
  123. 前記細胞の前記改変が、インビトロで起こる、請求項113~122のいずれか一項に記載の方法。
  124. 前記細胞の改変が、インビボで起こる、請求項113~122のいずれか一項に記載の方法。
  125. 前記細胞が、真核細胞である、請求項113~124のいずれか1項に記載の方法。
  126. 前記真核細胞が、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、及び非ヒト霊長類細胞からなる群から選択される、請求項125に記載の方法。
  127. 前記真核細胞が、ヒト細胞である、請求項125に記載の方法。
  128. 前記細胞が、胚性幹細胞、人工多能性幹細胞、生殖細胞、線維芽細胞、オリゴデンドロサイト、グリア細胞、造血幹細胞、ニューロン前駆細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、網膜細胞、がん細胞、T細胞、B細胞、NK細胞、胎児心筋細胞、筋線維芽細胞、間葉系幹細胞、自家移植増殖心筋細胞、脂肪細胞、全能性細胞、多能性細胞、血液幹細胞、筋芽細胞、成体幹細胞、骨髄細胞、間葉系細胞、実質細胞、上皮細胞、内皮細胞、中皮細胞、線維芽細胞、骨芽細胞、軟骨細胞、外因性細胞、内因性細胞、幹細胞、造血幹細胞、骨髄由来前駆細胞、心筋細胞、骨格細胞、胎児細胞、未分化細胞、多能性前駆細胞、単能性前駆細胞、単球、心筋芽細胞、骨格筋芽細胞、マクロファージ、毛細血管内皮細胞、異種細胞、同種細胞、自己細胞、又は出生後幹細胞からなる群から選択される、請求項113~127のいずれか一項に記載の方法。
  129. 前記細胞が、対象内にある、請求項124~128のいずれか一項に記載の方法。
  130. 前記改変が、遺伝子のアレルに変異を有する前記対象の前記細胞において起こり、前記変異が、前記対象において疾患又は障害を引き起こす、請求項129に記載の方法。
  131. 前記改変が、前記変異を前記遺伝子の野生型アレルに変化させるか、又は機能的遺伝子産物の発現をもたらす、請求項130に記載の方法。
  132. 前記改変が、前記対象において前記疾患又は障害を引き起こす前記遺伝子の前記アレルをノックダウン又はノックアウトする、請求項130に記載の方法。
  133. 前記細胞が、前記対象に対して自己由来である、請求項129~132のいずれか一項に記載の方法。
  134. 前記細胞が、前記対象に対して同種自己由来である、請求項129~132のいずれか一項に記載の方法。
  135. 前記ベクターが、アデノ随伴ウイルス(AAV)ベクターである、請求項113~134のいずれか一項に記載の方法。
  136. 前記AAVが、AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV-Rh74、又はAAVRh10である、請求項135に記載の方法。
  137. 前記ベクターが、レンチウイルスベクターである、請求項113に記載の方法。
  138. 前記ベクターが、治療有効用量を使用して、必要とする対象に投与される、請求項113~137のいずれか一項に記載の方法。
  139. 前記対象が、マウス、ラット、ブタ、及び非ヒト霊長類からなる群から選択される、請求項138に記載の方法。
  140. 前記対象が、ヒトである、請求項138に記載の方法。
  141. 前記ベクターが、少なくとも約1×10ベクターゲノム/kg(vg/kg)、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×10vg/kg、少なくとも約1×1010vg/kg、少なくとも約1×1011vg/kg、少なくとも約1×1012vg/kg、少なくとも約1×1013vg/kg、少なくとも約1×1014vg/kg、少なくとも約1×1015vg/kg、又は少なくとも約1×1016vg/kgの用量で前記対象に投与される、請求項138~140のいずれか一項に記載の方法。
  142. 前記ベクターが、少なくとも約1×10vg/kg~約1×1016vg/kg、少なくとも約1×10vg/kg~約1×1015vg/kg、又は少なくとも約1×10vg/kg~約1×1014vg/kgの用量で前記対象に投与される、請求項138~140のいずれか一項に記載の方法。
  143. 前記ベクターが、XDPである、請求項113に記載の方法。
  144. 前記XDPが、治療有効用量を使用して、必要とする前記対象に投与される、請求項143に記載の方法。
  145. 前記XDPが、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×10粒子/kg、少なくとも約1×1010粒子/kg、少なくとも約1×1011粒子/kg、少なくとも約1×1012粒子/kg、少なくとも約1×1013粒子/kg、少なくとも約1×1014粒子/kg、少なくとも約1×1015粒子/kg、少なくとも約1×1016粒子/kgの用量で前記対象に投与される、請求項144に記載の方法。
  146. 前記XDPが、少なくとも約1×10粒子/kg~約1×1016粒子/kg、又は少なくとも約1×10粒子/kg~約1×1015粒子/kg、又は少なくとも約1×10粒子/kg~約1×1014粒子/kgの用量で前記対象に投与される、請求項143に記載の方法。
  147. 前記ベクターが、実質内、静脈内、動脈内、脳室内、大槽内、髄腔内、頭蓋内、及び腹腔内経路からなる群から選択される投与経路によって投与され、前記投与方法が、注射、輸血、又は移植である、請求項138~146のいずれか一項に記載の方法。
  148. 前記ベクターが、治療有効用量の前記ベクターを使用して、1回以上の連続用量を含む治療レジメンに従って前記対象に投与される、請求項141~147のいずれか一項に記載の方法。
  149. 前記治療有効用量が、少なくとも2週間、又は少なくとも1ヶ月間、若しくは少なくとも2ヶ月間、若しくは少なくとも3ヶ月間、若しくは少なくとも4ヶ月間、若しくは少なくとも5ヶ月間、若しくは少なくとも6ヶ月間の期間にわたって、あるいは年1回、又は2年毎若しくは3年毎に1回、2回以上の用量として前記対象に投与される、請求項148に記載の方法。
  150. 請求項76~92のいずれか一項に記載の遺伝子編集ペアによって改変された標的核酸を含む、細胞。
  151. 請求項113~149のいずれか一項に記載の方法によって編集された、細胞。
  152. 前記細胞が、原核細胞である、請求項150又は151に記載の細胞。
  153. 前記細胞が、真核細胞である、請求項150又は151に記載の細胞。
  154. 前記真核細胞が、げっ歯類細胞、マウス細胞、ラット細胞、霊長類細胞、及び非ヒト霊長類細胞からなる群から選択される、請求項153に記載の細胞。
  155. 前記真核細胞が、ヒト細胞である、請求項153に記載の細胞。
  156. 請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質を含む、組成物。
  157. 請求項25~28のいずれか一項に記載のgRNAを含む、請求項156に記載の組成物。
  158. 前記タンパク質及び前記gRNAが、リボ核タンパク質複合体(RNP)において一緒に会合している、請求項157に記載の組成物。
  159. ドナー鋳型核酸を含み、前記ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、請求項156~158のいずれか一項に記載の組成物。
  160. 緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、請求項156~159のいずれか一項に記載の組成物。
  161. 請求項1~24のいずれか一項に記載のgRNA足場、又は請求項25~28のいずれか一項に記載のgRNAを含む、組成物。
  162. 請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質を含む、請求項161に記載の組成物。
  163. 前記クラス2、V型CRISPRタンパク質及び前記gRNAが、リボ核タンパク質複合体(RNP)において一緒に会合している、請求項162に記載の組成物。
  164. ドナー鋳型核酸を含み、前記ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、請求項161~163のいずれか一項に記載の組成物。
  165. 緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、請求項161~164のいずれか一項に記載の組成物。
  166. 請求項76~92のいずれか一項に記載の遺伝子編集ペアを含む、組成物。
  167. ドナー鋳型核酸を含み、前記ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、請求項166に記載の組成物。
  168. 緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、請求項166又は請求項167に記載の組成物。
  169. 請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質及び容器を含む、キット。
  170. 請求項1~24のいずれか一項に記載のgRNA足場、又は請求項25~28のいずれか一項に記載のgRNAを含む、請求項169に記載のキット。
  171. ドナー鋳型核酸を含み、前記ドナー鋳型が、標的核酸の標的核酸配列と相同性を有するヌクレオチド配列を含む、請求項169又は請求項170に記載のキット。
  172. 緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、請求項169~171のいずれか一項に記載のキット。
  173. 請求項1~24のいずれか一項に記載のgRNA足場、又は請求項25~28のいずれか一項に記載のgRNAを含む、キット。
  174. 請求項29~75のいずれか一項に記載のクラス2、V型CRISPRタンパク質を含む、請求項173に記載のキット。
  175. ドナー鋳型核酸を含み、前記ドナー鋳型が、標的核酸の標的核酸配列と相同性を有するヌクレオチド配列を含む、請求項173又は請求項174に記載のキット。
  176. 緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、請求項173~175のいずれか一項に記載のキット。
  177. 請求項76~92のいずれか一項に記載の遺伝子編集ペアを含む、キット。
  178. ドナー鋳型核酸を含み、前記ドナー鋳型が、標的核酸と相同性を有するヌクレオチド配列を含む、請求項177に記載のキット。
  179. 緩衝液、ヌクレアーゼ阻害剤、プロテアーゼ阻害剤、リポソーム、治療剤、標識、標識可視化試薬、又は前述の任意の組み合わせを含む、請求項177又は請求項178に記載のキット。
  180. 表3に列挙される配列のうちのいずれか1つを含む、操作されたクラス2、V型CRISPRタンパク質。
  181. 表2に列挙されるgRNA足場バリアント配列のうちのいずれか1つを含む、gRNA。
  182. 前記表2の配列の前記gRNA足場バリアントの1つ以上のウラシル(U)が、チミン(T)で置換されている、請求項181に記載のgRNA。
  183. 標的核酸に相補的な少なくとも10~30ヌクレオチドの標的化配列を含む、請求項182に記載のgRNA。
  184. 前記標的化配列が、20ヌクレオチドを有する、請求項183に記載のgRNA。
  185. 前記標的化配列が、19ヌクレオチドを有する、請求項183に記載のgRNA。
  186. 前記標的化配列が、18ヌクレオチドを有する、請求項183に記載のgRNA。
  187. 前記標的化配列が、17ヌクレオチドを有する、請求項183に記載のgRNA。
  188. 前記標的化配列が、16ヌクレオチドを有する、請求項183に記載のgRNA。
  189. 前記標的化配列が、15ヌクレオチドを有する、請求項183に記載のgRNA。
  190. 疾患の治療を必要とする対象においてそれを行う方法であって、治療有効量の、(a)請求項29~75及び180のいずれか一項に記載の操作されたクラス2、V型CRISPRタンパク質と、(b)請求項25~28及び181~189のいずれか一項に記載のgRNAと、を含む組成物を、前記対象に投与することを含む、方法。
  191. 疾患を有する対象の前記治療のための医薬品として使用するための、(a)請求項29~75及び180のいずれか一項に記載の操作されたクラス2、V型CRISPRタンパク質と、(b)請求項25~28及び181~189のいずれか一項に記載のgRNAと、を含む、組成物。
JP2023533837A 2020-12-03 2021-12-02 操作されたクラス2 v型crisprシステム Pending JP2023552374A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US202063121196P 2020-12-03 2020-12-03
US63/121,196 2020-12-03
US202163162346P 2021-03-17 2021-03-17
US63/162,346 2021-03-17
US202163208855P 2021-06-09 2021-06-09
US63/208,855 2021-06-09
PCT/US2021/061673 WO2022120095A1 (en) 2020-12-03 2021-12-02 Engineered class 2 type v crispr systems

Publications (1)

Publication Number Publication Date
JP2023552374A true JP2023552374A (ja) 2023-12-15

Family

ID=80050633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023533837A Pending JP2023552374A (ja) 2020-12-03 2021-12-02 操作されたクラス2 v型crisprシステム

Country Status (12)

Country Link
US (2) US20240026385A1 (ja)
EP (1) EP4256054A1 (ja)
JP (1) JP2023552374A (ja)
KR (1) KR20230128289A (ja)
AU (1) AU2021392719A1 (ja)
CA (1) CA3201258A1 (ja)
CL (1) CL2023001594A1 (ja)
GB (1) GB2616584A (ja)
MX (1) MX2023006566A (ja)
PE (1) PE20231178A1 (ja)
TW (1) TW202237836A (ja)
WO (1) WO2022120095A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114375334A (zh) 2019-06-07 2022-04-19 斯克里贝治疗公司 工程化CasX系统
CA3159316A1 (en) 2019-12-06 2021-06-10 Benjamin OAKES Compositions and methods for the targeting of rhodopsin
WO2022261149A2 (en) 2021-06-09 2022-12-15 Scribe Therapeutics Inc. Particle delivery systems
GB2625500A (en) 2021-09-21 2024-06-19 Scribe Therapeutics Inc Engineered CasX repressor systems
TW202411426A (zh) 2022-06-02 2024-03-16 美商斯奎柏治療公司 經工程化的2類v型crispr系統
WO2023235888A2 (en) 2022-06-03 2023-12-07 Scribe Therapeutics Inc. COMPOSITIONS AND METHODS FOR CpG DEPLETION
WO2023240027A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Particle delivery systems
WO2023240074A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
WO2023240076A1 (en) 2022-06-07 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of pcsk9
WO2023240162A1 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Aav vectors for gene editing
WO2023240157A2 (en) 2022-06-08 2023-12-14 Scribe Therapeutics Inc. Compositions and methods for the targeting of dmd
CN116676291B (zh) * 2022-08-22 2024-02-27 华中农业大学 核酸内切酶Genie scissor及其介导的基因编辑系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5412087A (en) 1992-04-24 1995-05-02 Affymax Technologies N.V. Spatially-addressable immobilization of oligonucleotides and other biological polymers on surfaces
US5695937A (en) 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
WO2010075303A1 (en) 2008-12-23 2010-07-01 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same
WO2012068627A1 (en) 2010-11-24 2012-05-31 The University Of Western Australia Peptides for the specific binding of rna targets
EP3374494A4 (en) 2015-11-11 2019-05-01 Coda Biotherapeutics, Inc. CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY
US11118194B2 (en) 2015-12-18 2021-09-14 The Regents Of The University Of California Modified site-directed modifying polypeptides and methods of use thereof
WO2018064371A1 (en) * 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
WO2018195555A1 (en) 2017-04-21 2018-10-25 The Board Of Trustees Of The Leland Stanford Junior University Crispr/cas 9-mediated integration of polynucleotides by sequential homologous recombination of aav donor vectors
WO2019084148A1 (en) * 2017-10-25 2019-05-02 Monsanto Technology Llc TARGETED RNA GUIDED ENDONUCLEASE ENDONUCLEASE ACTIVITY IN EUKARYOTES
EP3841205A4 (en) * 2018-08-22 2022-08-17 The Regents of The University of California VARIANT TYPE CRISPR/CAS V EFFECTIVE POLYPEPTIDES AND METHODS OF USE THEREOF
CN114375334A (zh) 2019-06-07 2022-04-19 斯克里贝治疗公司 工程化CasX系统
WO2020247883A2 (en) 2019-06-07 2020-12-10 Scribe Therapeutics Inc. Deep mutational evolution of biomolecules
CN115175921A (zh) * 2019-12-06 2022-10-11 斯克里贝治疗公司 颗粒递送系统
EP4069846A1 (en) * 2019-12-07 2022-10-12 Scribe Therapeutics Inc. Compositions and methods for the targeting of htt
JP2023518541A (ja) * 2020-03-18 2023-05-02 スクライブ・セラピューティクス・インコーポレイテッド C9orf72の標的化のための組成物及び方法

Also Published As

Publication number Publication date
CL2023001594A1 (es) 2024-01-05
KR20230128289A (ko) 2023-09-04
AU2021392719A1 (en) 2023-06-22
EP4256054A1 (en) 2023-10-11
WO2022120095A1 (en) 2022-06-09
MX2023006566A (es) 2023-08-07
GB202309876D0 (en) 2023-08-16
PE20231178A1 (es) 2023-08-01
US20240026385A1 (en) 2024-01-25
TW202237836A (zh) 2022-10-01
US20230054437A1 (en) 2023-02-23
GB2616584A (en) 2023-09-13
CA3201258A1 (en) 2022-06-09

Similar Documents

Publication Publication Date Title
JP2023552374A (ja) 操作されたクラス2 v型crisprシステム
US11560555B2 (en) Engineered proteins
KR20220070456A (ko) 면역치료법에 사용하기 위한 조성물 및 방법
US11976277B2 (en) Particle delivery systems
CA3159316A1 (en) Compositions and methods for the targeting of rhodopsin
US20240026386A1 (en) Compositions and methods for the targeting of bcl11a
JP2023510352A (ja) Pcsk9の標的化のための組成物および方法
CA3172178A1 (en) Compositions and methods for the targeting of c9orf72
CA3201392A1 (en) Aav vectors for gene editing
US20240100185A1 (en) Compositions and methods for the targeting of ptbp1
CN117120607A (zh) 工程化2类v型crispr系统
IL303360A (en) CRISPR systems engineered class 2 V type
JP2023550381A (ja) 真核生物遺伝子編集のためのベクター、システムおよび方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20240502