CN116507629A - Rna支架 - Google Patents

Rna支架 Download PDF

Info

Publication number
CN116507629A
CN116507629A CN202180054125.0A CN202180054125A CN116507629A CN 116507629 A CN116507629 A CN 116507629A CN 202180054125 A CN202180054125 A CN 202180054125A CN 116507629 A CN116507629 A CN 116507629A
Authority
CN
China
Prior art keywords
leu
rna
lys
glu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180054125.0A
Other languages
English (en)
Inventor
M·拉什顿
M·安巴尔
K·亨普希尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Damakang Co ltd
HAPLOGEN GENOMICS GmbH
Original Assignee
Damakang Co ltd
HAPLOGEN GENOMICS GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Damakang Co ltd, HAPLOGEN GENOMICS GmbH filed Critical Damakang Co ltd
Publication of CN116507629A publication Critical patent/CN116507629A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/115Aptamers, i.e. nucleic acids binding a target molecule specifically and with high affinity without hybridising therewith ; Nucleic acids binding to non-nucleic acids, e.g. aptamers
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/02Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/16Aptamers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/33Chemical structure of the base
    • C12N2310/334Modified C
    • C12N2310/33415-Methylcytosine

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明公开了RNA支架,其包含tracrRNA;和具有用于靶向基因编辑和相关用途的延伸序列的募集RNA基序。该方法使得能够对基因组进行精确的修饰,同时最小化脱靶效应的可能性,使得该方法特别适合于治疗应用。

Description

RNA支架
本发明涉及用于CRISPR系统的RNA支架。
背景技术
CRISPR-Cas技术正在快速发展,并且CRISPR应用的范围持续延伸(Lau,TheCRISPR Journal,Vol 1,No 6)。CRISPR系统的关键组分是形成RNA支架的一部分的向导RNA(gRNA),其首先将CRISPR系统靶向至基因组中的期望靶标,然后将生物活性效应子递送至靶标以执行期望的功能。RNA支架必须以正确的取向和空间构象精确地递送效应子,从而能够以特定方式有效地执行所述功能,以产生期望的结果而不引起脱靶效果。因此,精确基因组靶向效应子系统需要优化的RNA支架。
本发明人已经设计了用于增强的靶向性能的优化RNA支架。本文提供的RNA支架、系统和方法使得能够对基因组进行精确的修饰,同时最小化脱靶效应的可能性,使得该方法和系统特别适用于治疗应用。
发明内容
在第一方面中,本发明提供了一种RNA支架,其包含:
(a)tracrRNA;和
(b)具有延伸序列的RNA基序。
在一个实施方式中,根据第一方面的RNA支架还包含含有向导RNA序列的crRNA。根据第一方面的RNA支架包括一个或多个修饰。RNA基序通过接头连接到tracrRNA的3’末端。在优选的实施方式中,接头是单链RNA或化学连接。单链RNA接头包含0-10个核苷酸,优选2-6个核苷酸。
在一个实施方式中,根据第一方面的RNA支架包含tracrRNA,所述tracrRNA与含有向导RNA序列的crRNA融合,形成单个RNA分子。在其他实施方式中,根据第一方面的RNA支架包含作为分开的RNA分子合成的tracrRNA和含有向导RNA序列的crRNA。在任何实施方式中,tracrRNA通过重复:反重复区域与crRNA杂交。当被合成为如图10B所示的单个RNA分子时,tracrRNA包括反重复区、四环和gRNA的3'恒定区。当合成为分开的RNA分子时,tracrRNA包含反重复区和sgRNA的3'恒定区,并且如图10D所示的不存在四环。tracrRNA的反重复区域与crRNA的重复区域杂交。在优选的实施方式中,重复:反重复区域是延伸的。
本发明的RNA支架包含一个或多个RNA基序,其中所述一个或多个RNA基序包含一个或多个修饰。所述一个或多个修饰可以在所述一个或多个RNA基序的5’末端和/或3’末端。本发明的RNA支架可包括一个或多个修饰,包括在10位的A碱基被取代为2-氨基嘌呤(2AP)。RNA支架可以使用2’脱氧-2-氨基嘌呤或2’核糖2-氨基嘌呤。本发明的RNA支架可以具有对RNA支架的主链和/或糖部分的一个或多个修饰。RNA基序的延伸序列是双链延伸,其中RNA基序的延伸序列包含2-24个核苷酸。在一个实施方式中,4个核苷酸延伸产生总长度为23个核苷酸的茎(stem)。在另一个实施方式中,10个核苷酸延伸产生总长度为29个核苷酸的茎。在另一个实施方式中,16个核苷酸延伸产生总长度为35个核苷酸的茎。在另一个实施方式中,26个核苷酸延伸产生总长度为45个核苷酸的茎。
本发明的RNA支架包含与适体结合分子结合的一个或多个RNA基序。一个或多个RNA基序选自以下适体:MS2、Ku、PP7、SfMu和Sm7。例如,MS2适体与MCP蛋白质结合。在优选的实施方式中,RNA支架包含一个募集MS2 RNA基序。在其他实施方式中,RNA支架包括两个募集MS2 RNA基序。在优选的实施方式中,所述MS2适体是野生型MS2、突变型MS2或其变体。本文使用的突变型MS2是C-5、F-5杂合体和/或F-5突变体。根据本发明的RNA支架的RNA基序募集效应子模块。如本文所公开的效应子模块包含能够结合至RNA基序的RNA结合结构域和效应子结构域。合适的效应子结构域选自:报告子、标签、分子、蛋白质、微粒和纳米颗粒。在优选实施方式中,效应子结构域是DNA修饰酶。合适的DNA修饰酶选自:AID、CDA、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F或其他APOBEC家族酶、ADA、ADAR家族酶或tRNA腺苷脱氨酶。
在第二方面,本发明提供了一种用于遗传修饰的系统,其包括:
(a)CRISPR蛋白;
(b)如上所定义的本发明的crRNA;
(c)如上所述的本发明的RNA支架;
(d)适体结合分子;
(e)效应子模块;
根据第二方面的系统包括以核酸、蛋白质复合物的形式递送和/或通过任何合适的表达载体表达的组分(a)-(e)。
本文提供的系统可以包含与一个或多个尿嘧啶DNA糖基化酶(UNG)抑制剂肽(UGI)融合的CRISPR蛋白质。在优选实施方式中,根据第二方面的系统中使用的CRISPR是2类II型CRISPR蛋白质,例如cas9。根据第二方面的系统中使用的CRISPR蛋白质和/或效应子模块可以包括一个或多个核定位信号(NLS)。CRISPR蛋白质可以是2类Cas蛋白,其为核酸酶空值或具有切口酶活性。
根据第二方面的系统中使用的效应子模块可以是包括能够与RNA基序结合的RNA结合结构域和效应子结构域的效应子融合蛋白。根据第二方面的系统可以使用RNA基序和效应子模块,包含选自由以下组成的组的RNA结合结构域对:
端粒酶Ku结合基序和Ku蛋白或其RNA结合部分,
端粒酶Sm7结合基序和Sm7蛋白或其RNA结合部分,
MS2噬菌体操纵基因(operator)茎环和MS2衣壳蛋白(MCP)或其RNA结合部分,PP7噬菌体操纵基因茎环和PP7衣壳蛋白(PCP)或其RNA结合部分,
SfMu噬菌体Com茎环和Com RNA结合蛋白或其RNA结合部分。
在第三方面,本发明提供了一种用于遗传修饰细胞的方法,其中该方法包括将根据第二方面的系统引入细胞和/或在细胞中表达。根据第三方面的方法可以用于遗传修饰细胞,包括但不限于校正基因突变或灭活基因的表达或改变基因的表达水平或改变内含子-外显子剪接。根据第三方面中提供的方法的遗传修饰是点突变,任选地,其中点突变引入过早成熟的终止密码子,破坏起始密码子,破坏剪接位点或校正基因突变。
附图说明
图1:图1A显示包括三种结构和功能组分的系统:(1)序列靶向组分(例如,Cas蛋白);(2)RNA支架,用于序列识别和用于效应子募集,其包含crRNA、tracrRNA和RNA基序;和(3)效应子模块(例如,非核酸酶DNA修饰酶,例如融合到与RNA基序结合的小蛋白的AID)。更具体地,如图1A所示,RNA支架介导的募集平台的组分包括:序列靶向组分1(例如dCas9或nCas9D10A);RNA支架2,其包含用于序列靶向的含有向导RNA(和重复:反重复茎的重复)的cRNA2.1、用于Cas蛋白结合的tracrRNA2.2,和用于募集效应子模块的RNA基序2.3,以及效应子模块3,其包含与RNA适体配体3.2融合的效应子结构域3.1(例如胞苷脱氨酶)。图1B显示靶序列处的RNA支架介导的募集复合物的示意图:Cas9(或dCas9或nCas9)与tracrRNA结合,RNA基序(例如,适体)募集效应子模块,形成能够编辑CRISPR R环内的未配对DNA上的靶残基的活性RNA支架介导的募集系统。
图2:(A)具有C-5取代的MS2发夹序列和(B)含有F-5突变体序列的MS2发夹序列,其中在所示的A-10位处A被额外取代为d2AP。
图3:相对于野生型MS2,含有(A)4nt(B)10nt(C)16nt和(D)(26nt)的MS2茎延伸的RNA基序。
图4:RNA支架的模块,其包含tracrRNA、具有延伸序列的RNA基序、和包含向导RNA序列的crRNA。
图5:由于胞嘧啶至胸腺嘧啶碱基改变的合成适体所致的TRAC Ex3 SA剪接位点表型破坏变异。合成crRNA:tracrRNA(具有和不具有适体),其具有电穿孔的nCas9-UGI-UGI和rApobec1和hAID脱氨酶。
图6:由于胞嘧啶至胸腺嘧啶碱基改变的合成适体所致的TRAC Ex3 SA剪接位点碱基变化变异。合成crRNA:tracrRNA(具有和不具有适体),其具有电穿孔的nCas9-UGI-UGI和rApobec1和hAID脱氨酶。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。
图7:用tracrRNA编辑HEK Site2,所述tracrRNA含有具有nCas9-UGI-UGI和rApobec1脱氨酶的MS2发夹序列的4nt或16nt延伸。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。
图8:用tracrRNA编辑HEK Site2和HEK Site3,所述tracrRNA在具有nCas9-UGI-UGI和hAID脱氨酶的RNA基序的3’末端含有1或2个MS2发夹。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。
图9:使用各种RNA支架设计在不同靶基因座处的碱基编辑效率。图9A-C:MS2适体位置和数量以及重复:反重复上部茎的延伸对APOBEC-1介导的碱基编辑的影响。在3x个靶基因座处测量碱基编辑,在实施例1内的表5中显示碱基编辑靶标窗口内的序列和C残基。RNA支架引入单个拷贝的MS2适体(1xMS2)或2个拷贝的MS2适体(2xMS2),并且位于四环(TL)、茎-环2(SL2)或RNA支架(3’)的3’。另外,一些设计引入重复:反重复上部茎的14-碱基延伸(7bp-延伸的US)。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。误差条表示来自3个重复实验的平均值的标准偏差。图9D-H:在另外的5个基因座处测量APOBEC-1导致的编辑,其中先前的最佳的1xMS2_3’7bp-延伸的US与2xMS2_3’7bp延伸的US一起测试。碱基编辑靶窗口内的序列和C残基在实施例1中的表5中示出。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。误差条表示来自3个重复实验的平均值的标准偏差。图9I:重复:反重复上部茎的不同长度延伸对适体依赖性APOBEC-1介导的碱基编辑的影响的比较。分析中包括拥有2bp、5bp、7bp和10bp的上部茎延伸以及上部茎延伸的sgRNA以及非延伸上部茎(1xMS2_3’)sgRNA。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。误差条表示来自3个重复实验的平均值的标准偏差。
图10:注释图说明当合成为单个分子或作为分开的分子时RNA支架的不同部分。图10A:合成为具有两个MS2的单个分子的RNA支架,如现有技术WO2017011721中公开的。图10B:合成为具有如本文所述的一个MS2的单个分子的RNA支架。图10C:合成为具有一个MS2的单个分子的RNA支架,其在反重复:重复区域的任一侧有7bp延伸。图10D:合成为分开的分子的RNA支架,其中不存在四环。图10E:合成为分开的分子的RNA支架,其在MS2茎环的10位具有2AP修饰。图10F:合成为分开的分子的RNA支架,其在MS2茎环的F-5突变体的10位具有2AP修饰。
图11:在nCas9-UGI-UGI U2OS稳定的细胞中,使用化学合成的C-5或F-51xMS2_3′tracrRNA的碱基编辑,其具有crRNA和rApobec1脱氨酶的mRNA。每个cRNA靶向的基因位点是(A)CR0118_PDCD1、(B)CR0107_PDCD1、(C)CR0057-TRAC_EX3、(D)CR0151_CD2、(E)HEK Site2、(F)CR0121_PDCD1和(G)CR0165_CIITA。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。
图12:在nCas9-UGI-UGI U2OS稳定的细胞中使用化学合成的C-5或F-51xMS2_3′tracrRNA的碱基编辑,其具有crRNA和hAID脱氨酶的mRNA。每个cRNA靶向的基因位点是(A)CR0151_CD2、(B)CR0121_PDCD1和(C)CR0165_CIITA。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。
图13:在nCas9-UGI-UGI U2OS稳定的细胞中利用化学合成的1xMS2_3′sgRNAs(C-5)、含有重复:反重复上部茎的7碱基对延伸的1xMS2_3′_7bp-延伸的_US sgRNAs(C-5)、或者1xMS2_3’tracrRNA(C-5)的碱基编辑,其具有crRNA和hAID脱氨酶的mRNA。每个crRNA靶向的基因位点是(A)TRAC_22550571、(B)PDCD1_241852953和(C)CTNNB1。数据显示为在所指示的目标C残基处测序的T的百分比,如通过sanger测序测量的。
图14.在nCas9-UGI-UGI U2OS稳定的细胞中使用化学合成的C-5或F-51xMS2_3′tracrRNA的碱基编辑,其具有crRNA和可变水平的rApobec1脱氨酶的mRNA。每个cRNA靶向的位点是(A)HEK Site 2,(B)CR0107_PDCD1。
具体实施方式
本发明涉及用于靶向基因组和递送功能效应子的新RNA支架。这样的功能效应子包括酶、报告子、标签、分子、蛋白质、微粒、纳米颗粒。
本发明的一个应用涉及CRISPR基因编辑和筛选。本发明可用于任何CRISPR基因编辑系统中。本发明的应用涉及使用RNA支架来将效应子模块募集到基因组中的靶DNA序列。本发明在CRISPR碱基编辑系统(例如RNA支架介导的募集系统)中具有特定应用。
RNA支架介导的募集系统的实例包括以下功能组分:(1)基于CRISPR/Cas的模块,其设计用于序列靶向;(2)基于RNA支架的模块,其用于将平台引导至靶序列以及用于募集效应子模块;和(3)效应子模块,例如胞苷解氨酶(例如,活化诱导的胞苷脱氨酶、AID)。
在第一方面,本文提供RNA支架,其包含:(a)tracrRNA;和(b)具有延伸序列的RNA基序。如本文所公开的,RNA支架被优化用于增强的基因编辑。RNA支架介导的募集系统是许多组分的复合物,其包括需要以特定方式组装以执行精确功能的RNA支架。该复合物必须找到基因组的特定部分,并精确实现正确的取向和空间构象,从而能够以特定的方式有效地编辑基因组,从而得到所需的输出。此外,该复合物必须有效地募集和递送具有生物活性的效应子模块,诸如处于正确取向/构型的酶,以保留酶活性并编辑基因组,而不会引起显著的脱靶效应。先前的碱基编辑系统与在多个区域的不良或有限的编辑相关联。
为了克服这些问题,本发明人已经将一个或多个修饰引入RNA支架介导的募集系统,特别是通过试错法识别的RNA支架。
虽然不希望受任何理论的束缚,但是据认为,这些修饰中的一些对RNA支架介导的募集系统的组分引起构象改变。使用本文公开的RNA支架观察到标记的改善。有利地,包含RNA支架的经优化系统(本身包含具有延伸序列的RNA基序),具有更大的灵活性、稳定性、定位和亲和力,从而有效地编辑包括治疗相关基因座的先前抗性区域,同时维持性能。新RNA支架扩大可编辑靶的库并提高基因编辑的效率。
RNA支架介导的募集系统
用于校正突变的常规核酸酶依赖性精确基因组编辑通常需要引入DNA双链断裂(DSB)和激活同源依赖性修复(HDR)途径。
最近,还开发了RNA介导的碱基编辑系统。该系统通过CRISPR复合物的RNA组分将碱基编辑酶募集到靶DNA序列。该系统包含修饰的gRNA,其在3’末端具有可重新编程的RNA-适体,所述修饰的gRNA募集与效应子(例如脱氨酶效应子)融合的同源适体配体。使用该系统,在原核细胞和包括哺乳动物细胞在内的真核细胞中高精度地实现靶向核苷酸修饰;参见WO2018129129和WO2017011721。测试了在原核细胞中具有增加的特异性和效率的新的、第二代的RNAi介导的碱基编辑系统,并且在哺乳动物细胞中进一步改进。第二代系统/平台展现高特异性、高效率和低的脱靶可能性。利用将核酸修饰模块与核酸识别模块完全分离的模块化设计,RNA介导的碱基编辑系统对通过与序列靶向蛋白融合或直接相互作用来募集效应子提供了替代方案,被替代的方案不能有效地将序列靶向功能与核酸修饰功能分离。本文公开的本发明是RNA支架介导的募集系统,其是RNA介导的碱基编辑系统的模块化设计的改进版本。已经将各种修饰引入到系统的组分,从而提高了所述系统的灵活性、特异性和效率。新型RNA支架介导的募集系统不限于碱基编辑,而是具有许多可能的应用,例如基因组编辑、基因组筛选和基因组标记,提供用于基因工程和治疗开发的强大工具。
图1A和1B中示出的是用于本文提供的方法的示例性RNA支架介导的募集系统的示意图。该系统包括三种结构和功能组分:(1)序列靶向组分(例如,Cas蛋白);(2)RNA支架,用于序列识别和用于效应子募集,其包含crRNA、tracrRNA和RNA基序;和(3)效应子模块(例如,非核酸酶DNA修饰酶,例如融合到与RNA基序结合的小蛋白的AID)。更具体地,如附图1A所示,RNA支架介导的募集平台的组分包括:序列靶向组件1(例如dCas9或nCas9D10A);RNA支架2,其包含含有用于序列靶向的向导RNA(和重复:反重复茎)的cRNA2.1、用于Cas蛋白结合的tracrRNA2.2和用于募集效应子模块的RNA基序2.3,以及效应子模块3,该效应子模块3包含融合到RNA适体配体3.2的效应子结构域3.1(例如胞苷脱氨酶)。图1B显示靶序列处的RNA支架介导的募集复合物的示意图:Cas9(或dCas9或nCas9)与tracrRNA结合,RNA基序(例如,适体)募集效应子模块,形成能够编辑在CRISPR R环内的未配对DNA上的靶残基的活性RNA支架介导的募集系统。这三个组分可以在单个表达载体中或在多个单独的表达载体中构建,或者以无DNA的形式(mRNA或蛋白质和化学合成的RNA分子)引入。三个特定组分的全部和组合构成技术平台的启用。尽管图1B以特定的5’至3’顺序显示RNA支架的三个组分,但是当需要时,组分也可以以不同的顺序布置,例如针对不同的Cas蛋白变体的优化。
如本文所公开的,在募集机制之间存在许多明显区别:RNA支架介导的募集系统相比于Cas9与效应子蛋白系统(BE系统)的直接融合。RNA支架介导的募集系统的模块化设计允许灵活的系统工程化。模块是可互换的,并且可以通过简单地交换募集的RNA适体和同源配体的核苷酸序列来实现不同模块的许多组合。另一方面,通过与序列靶向单元的蛋白质组分的直接融合或直接相互作用来募集效应子总是需要重新设计新的融合蛋白,这在技术上是更困难的,具有不太可预测的结果。此外,RNA支架介导的募集系统可能促进效应子蛋白的寡聚化,而直接融合会阻碍由于空间位阻引起的寡聚物的形成。
由于其使用相对容易和可扩展性,CRISPR/Cas类基因系统准备主导治疗景观,从而使其成为开发具有治疗价值的新型应用的有吸引力的基因编辑技术。如本文所公开的,RNA支架介导的募集系统采用CRISPR/Cas系统的某些方面的优点。为了克服与针对常规CRISPR/Cas基因编辑系统的DSB和HDR的要求相关联的限制,开发了一种称为碱基编辑(BE)的优雅基因编辑方法,其利用缺乏双链裂解活性的Cas9(例如dCas9或nCas9)的DNA靶向能力,与APOBCE-1(APOBEC家族的DNA/RNA胞苷脱氨酶的酶成员)的DNA编辑能力组合。通过将脱氨酶效应子直接融合到称为dCas9的核酸酶缺乏Cas9蛋白,这些工具(称为碱基编辑器)可以在基因组DNA或RNA中引入靶向点突变而不产生DSB或需要HDR活性。实质上,BE系统利用核酸酶缺乏CRISPR/Cas9复合物作为DNA靶向机制,其中突变体Cas9用作锚以通过直接蛋白质-蛋白质融合募集胞苷或腺嘌呤脱氨酶。
另一方面,RNA支架介导的募集系统采用不同的方法。更具体地,在RNA支架介导的募集系统中,CRISPR/Cas9复合物的RNA组分通过将RNA基序(例如适体)包括到RNA分子中来充当用于效应子募集的锚。继而,RNA适体募集效应子模块,例如与RNA适体配体融合的效应子。与通过蛋白质组分的直接蛋白融合或其他募集方法的募集相比,RNA支架介导的募集系统机制具有许多独特的特征,这对于系统工程和实现更好的功能都是有利的。例如,其具有模块化设计,其中核酸序列靶向功能和效应子功能存在于不同的分子中,使得可以独立地重编程功能模块并且复用系统。RNA支架募集介导的系统的重编程仅需要RNA适体序列在gRNA中的改变和同源RNA适体配体融合效应子的交换。它不需要重新设计单独的功能性Cas9融合蛋白。另外,效应子模块的尺寸较小,这可能潜在地允许功能效应子的更有效的寡聚。此外,因为RNA支架介导的募集不需要产生Cas9融合蛋白,这进一步增加Cas9的基因/转录大小,所以系统可以潜在地以对于通过病毒载体、非病毒载体、mRNA分子、机械装置或蛋白质组分包装和递送更有效的方式构造。
如本文所公开的,本发明提供了用于精确基因编辑的RNA支架介导的募集系统的进一步工程化。如本文所证明的,与WO2018129129和WO2017011721中描述的先前RNA介导的碱基编辑系统相比,优化的RNA支架募集系统表现出许多重要的不同特征(全文以引用方式并入本文)。首先,与第一代和第二代RNA介导的碱基编辑系统相比,优化的RNA支架募集系统表现出显著增加的命中靶功效,但仍保持低的可检测离靶效应或不存在可检测离靶效应。第二,优化的RNA支架募集系统由于引入到系统的各种组件中的修饰(例如,RNA基序的3’末端的延伸序列)而具有更大的灵活性。第三,由于RNA基序相对于tracrRNA的定位,经优化的RNA支架具有改善的空间位阻。
a.序列靶向模块
本文提供的方法和系统的序列靶向组件通常利用来自细菌物种的CRISPR/Cas系统的Cas蛋白作为序列靶向蛋白。
在一些实施方式中,Cas蛋白是突变Cas蛋白,例如,在其核酸酶催化结构域包含突变并因此不具有核酸酶活性的dCas蛋白,或在其中一个催化结构域部分突变并因此不具有用于产生DSB的核酸酶活性的nCas蛋白。Cas蛋白由RNA支架的tracrRNA组分特异性地识别,其将Cas蛋白引导至其靶DNA或RNA序列。后者侧接3’PAM。
Cas蛋白
在本发明中可以使用各种Cas蛋白。可互换使用的Cas蛋白、CRISPR相关蛋白或CRISPR蛋白质是指CRISPR-Cas类别1或类别2系统的蛋白质或源自CRISPR-Cas类别1或类别2系统,其具有RNA指导的DNA结合。合适的CRISPR/Cas蛋白的非限制性实例包括Cas3、Cas4、Cas5、Cas5e(或CasD)、Cas6、Cas6e、Cas6f、Cas7、Cas8a1、Cas8a2、Cas8b、Cas8c、Cas9、Cas10、Cas10d、CasF、CasG、CasH、Csy1、Csy2、Csy3、Cse1(或CasA)、Cse2(或CasB)、Cse3(或CasE)、Cse4(或CasC)、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csz1、Csx15、Csf1、Csf2、Csf3、Csf4和Cu1966,例如,Koonin和Makarova,2019,origins and evolutionof crispr cas systems,Review Philos Trans R Soc Lond B Biol Sci.2019May 13;374(1772)。
在一个实施方式中,Cas蛋白源自2类CRISPR-Cas系统。在优选的实施方式中,Cas蛋白是2类2cas系统。在示例性实施方式中,Cas蛋白是Cas9蛋白或源自Cas9蛋白。Cas9蛋白可以来自酿脓链球菌(Streptococcus pyogenes)、嗜热链球菌(Streptococcusthermophilus)、链球菌属(Streptococcus sp.)、达松维尔拟诺卡氏菌(Nocardiopsisdassonvillei)、系始旋链霉菌(Streptomyces pristinaespiralis)、产绿色链球菌(Streptomyces viridochromogenes)、产绿色链球菌(Streptomycesviridochromogenes)、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌(Streptosporangium roseum)、酸热脂环酸芽胞杆菌(Alicyclobacillusacidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒还原芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极地单胞菌属(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌属(Cyanothecesp.)、铜绿微囊藻(Microcystisaeruginosa)、聚球藻属(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobiumarabaticum)、根制氨菌(Ammonifex degensii)、贝氏热解纤维素菌(Caldicelulosiruptorbecscii)、金矿菌(Candidatus Desulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、嗜热丙酸厌氧肠状菌(Pelotomaculumthermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、氧化亚铁嗜酸硫杆菌(Acidithiobacillus ferrooxidans)、长春花异色菌(Allochromatium vinosum)、海杆菌属(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcus watsoni)、盐浮游假性交替单胞菌(Pseudoalteromonashaloplanktis)、消旋纤线杆菌(Ktedonobacter racemifer)、调查甲烷喜盐菌(Methanohalobium evestigatum)、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属物(Arthrospira sp.)、鞘丝藻属(Lyngbyasp.)、喜泥微鞘藻(Microcoleus chthonoplastes)、颤藻属(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、海洋蓝藻菌(Acaryochloris marina)、莎希纤毛菌(Legionella pneumophila)、新弗朗西丝菌(Francisella novicida)、伽玛变形菌属(gamma proteobacterium)HTCC5015、排泄物副沙门氏菌(Parasutterella excrementihominis)、华德萨特菌(Sutter ellawadsworthensis)、硫磺单胞菌属(Sulfurospirillum sp.)SC ADC、瘤胃杆菌属(Ruminobacter sp.)RM87、伯克霍尔德氏菌(Burkholderiales bacterium)1 147、拟杆菌门口腔分类单元(Bacteroidetes oral taxon)274菌株F0058)、产琥珀酸沃廉菌(Wolinella succinogenes)、伯克霍尔德氏菌(Burkholderiales bacterium)YL45、嗜淀粉瘤胃杆菌(Ruminobacter amylophilus)、弯曲杆菌(Campylobacter sp.)P0111、弯曲杆菌(Campylobacter sp.)RM9261、拉尼尔弯曲杆菌(Campylobacter lanienae)菌株RM8001、拉尼尔弯曲杆菌(Camplylobacter lanienae)菌株P0121、鼠伤寒杆菌(Turicimonas muris)、伦敦军团菌(Legionella londiniensis)、沙门盐弧菌(Salinivibrio sharmensis)、钩端螺旋体属(Leptospira sp.)分离株FW.030、白被孢霉属(Moritella sp.)分离株NORP46、内生单胞菌属(Fndozoicomonas sp.)S-B4-1U、盐渍泰米尔纳德杆菌(Tamilnaduibactersalinus)、需钠弧菌(Vibrio natriegens)、斯氏弓形菌(Arcobacter skirrowii)、蜃楼耶尔森氏菌(Francisella philomiragia)、西班牙弗朗西斯菌(Francisella hispaniensis)或嗜盐副内生单胞菌(Parendozoicomonas haliclonae)。
通常,Cas蛋白包含至少一个RNA结合结构域。RNA结合结构域与向导RNA相互作用。Cas蛋白可以是野生型Cas蛋白或修饰形式,不具有核酸酶活性或仅仅具有单链切口活性。可以修饰Cas蛋白以增加核酸结合亲和力和/或特异性、改变酶活性和/或改变蛋白质的另一种性质。例如,可以修饰、缺失或灭活蛋白质的核酸酶(即,DNA酶、RNA酶)结构域。或者,蛋白质可以被截短,以去除对于蛋白质的功能不是必需的结构域。蛋白质也可以被截短或修饰以优化活性。
在一些实施方式中,Cas蛋白可以是野生型Cas蛋白(例如Cas9)或其片段的突变体。在其它实施方式中,Cas蛋白可以源自突变体Cas蛋白。例如,Cas9蛋白质的氨基酸序列可以被修饰以改变蛋白质的一种或多种性质(例如核酸酶活性、亲和力、稳定性等)。或者,可以从蛋白质中去除未参与RNA靶向的Cas9蛋白的结构域,使得修饰的Cas9蛋白小于野生型Cas9蛋白。在一些实施方式中,本系统利用来自酿脓链球菌(S.pyogenes)的Cas9蛋白,其在细菌中编码或经密码子优化以用于在哺乳动物细胞中表达。
突变体Cas蛋白是指野生型蛋白质的多肽衍生物,例如具有一个或多个点突变、插入、缺失、截短的蛋白、融合蛋白或其组合。突变体具有RNA指导的DNA结合活性或RNA指导的核酸酶活性中的至少一个,或两者。通常,经修饰的版本是与野生型蛋白质(例如SEQ IDNO:1)具有至少50%(例如,50%至100%之间的任何数字,例如50%、60%、70%、75%、80%、85%、90%、95%和99%)同一性。
Cas蛋白(以及本发明所述的其它蛋白组分)可以作为重组多肽获得。为了制备重组多肽,编码其的核酸可以与编码融合伴侣的另一核酸(例如,谷胱甘肽-甲基转移酶(GST)、6x-His表位标签或M13基因3蛋白)连接。所得的融合核酸在合适的宿主细胞中表达融合蛋白,所述融合蛋白可以通过本领域已知的方法分离。分离的融合蛋白可以例如通过酶消化进一步处理,以除去融合伴侣并获得本发明的重组多肽。或者,可以使用本领域已知的常规方法或通过本文所述的重组DNA技术并且使用本领域已知的方法化学合成蛋白质。
本发明中描述的Cas蛋白可以纯化或分离的形式提供,或者可以是组合物的一部分。优选地,在组合物中,首先将蛋白质纯化至一定程度上,更优选高水平的纯度(例如,约80%、90%、95%或99%以上)。根据本发明的组合物可以是所需的任何类型的组合物,但通常是适合用作或包含在用于RNA向导靶向的组合物中的水性组合物。本领域技术人员熟知可以包括在这种核酸酶反应组合物中的各种物质。
为了实施本文公开的用于修饰靶核酸的方法,可以经由mRNA、蛋白质RNA复合物(RNP)或任何合适的表达载体在靶细胞中产生蛋白质。表达载体的实例包括染色体、非染色体和合成DNA序列、细菌质粒、微环、噬菌体DNA、杆状病毒、酵母质粒、源自质粒和噬菌体DNA的组合的载体、病毒DNA如牛痘、腺病毒、牛痘病毒和伪狂犬病毒。在下面的表达系统和方法部分中描述了更多细节。
如这里所公开的,可以使用核酸酶死Cas9(dCas9,例如来自酿脓链球菌D10A、H840A突变体蛋白)或核酸酶缺陷性切口酶Cas9(nCas9,例如酿脓链球菌D10A突变蛋白)。dCas9或nCas9也可以源自各种细菌物种。表1列出了Cas9的实例的非穷尽列表及其对应的PAM要求。也可以使用合成Cas替代物,例如Rauch等人,Programmable RNA-GuidedRNAEffector Proteins Built from Human Parts.Cell Volume178,第1期,2019年6月27日122-134页e12中描述的那些。
表1.
N是任何核苷酸(A或G或T或C),R是A或G,W是A或T。
UGI
在本公开的一些实施方式中,上述序列靶向组分包含(a)CRISPR蛋白和(b)第一尿嘧啶DNA糖基化酶(UNG)抑制肽(UGI)之间的融合。例如,融合蛋白可以包括融合到UGI的Cas蛋白(例如Cas9蛋白)。与不包含UGI结构域的融合蛋白相比,这种融合蛋白可以表现出增加的核酸编辑效率。在一些实施方式中,所述UGI包含野生型UGI序列或具有以下氨基酸序列的序列:sp|P14739|UNGI_BPPB2:脲嘧啶-DNA糖基化酶抑制剂(UGI)MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLL TSDAPEYKPWALVIQDSNGENKIKML SEQ ID NO:2。
在一些实施方式中,本文提供的UGI蛋白包括UGI的片段或者与UGI或UGI片段同源的UGI和蛋白质。例如,在一些实施方式中,UGI包含上述氨基酸序列的片段。在一些实施方式中,UGI包含与上述氨基酸序列同源的氨基酸序列或与上述UGI序列中所述的氨基酸序列的片段同源的氨基酸序列。在一些实施方式中,包括UGI或者UGI片段或者UGI片段或UGI片段的同源物被称为“UGI变体”。UGI变体与UGI或其片段具有同源性。例如,UGI变体是如上所述的野生型UGI或UGI序列的至少约70%(例如,至少约80%、90%、95%、96%、97%、98%、99%)。
本文提供合适的UGI蛋白和核苷酸序列,并且另外合适的UGI序列是本领域技术人员已知的,并且包括例如下述公开的那些:Wang等,Uracil-DNAglycosylase inhibitorgene of bacteriophage PBS2 encodes a binding protein specific for uracil-DNAglycosylase.J Biol.Chem.264:1163-1171(1989);Lundquist等,Site-directedmutagenesis and characterization of uracil-DNAglycosylase inhibitorprotein.Role of specific carboxylic amino acids in complex formation withEscherichia coli uracil-DNA glycosylase.J Biol.Chem.272:21408-21419(1997);Ravishankar等,X-ray analysis of acomplex of Escherichia coli uracilDNAglycosylase(EcUDG)with a proteinaceous inhibitor.The structure elucidationof a prokaryotic UDG.Nucleic Acids Res.26:4880-4887(1998);和Putnam等,Proteinmimicry of DNAfrom crystal structures of the uracil-DNAglycosylase inhibitorprotein and its complex with Escherichia coli uracil-DNAglycosylase.JMol.Biol.287:331-346(1999),每一篇的全部内容通过引用并入本文。
b.用于序列识别和效应子募集的RNA支架
本文公开的平台的第二组分是RNA支架,其具有三个子组分:包含向导RNA序列的crRNA、反式激活CRISPR RNA(tracrRNA)和具有延伸序列的RNA基序。该支架可以是单个RNA分子或多个RNA分子的复合物。RNA支架的包含向导RNA的crRNA通过重复:反重复区域连接到tracrRNA,所述重复:反重复区域由7-bp下部茎和4bp上部茎组成,其中插有4个核苷酸凸起结构(bulge structure)。当RNA支架被表达为单个分子时,重复:反重复区域通过包含4个核苷酸的四环连接,如图10B所示。当RNA支架表达为多个RNA分子时,不存在四环,并且重复:反重复区域将crRNA和tracrRNA分子连接,如图10D所示。
如本文所公开的,包括可编程向导RNA的crRNA、tracrRNA和Cas蛋白一起形成用于序列靶向和识别的CRISPR/Cas类模块,同时RNA基序通过RNA-蛋白质结合对募集效应子模块,例如碱基编辑酶,其执行遗传修饰。因此,RNA支架连接效应子模块(例如,碱基编辑酶)和序列识别模块(例如,II型Cas蛋白)。如本文所公开的RNA支架包括一个或多个修饰。
可编程向导RNA(cr RNA)
一个关键的子组分是可编程的向导RNA。由于其简单和效率,CRISPR-Cas系统已经用于在各种生物体的细胞中执行基因组编辑。该系统的特异性由靶DNA和定制设计的向导RNA之间的碱基配对决定。通过工程化和调节向导RNA的碱基配对性质,可以靶向任何感兴趣的序列,条件是存在与靶序列相邻的PAM序列。
在本文公开的RNA支架的亚组分中,向导序列提供靶向特异性。它包括互补的并且能够与预选的感兴趣的目标部位杂交的区域。在各种实施方式中,向导序列的靶指定组分可以包含约10个核苷酸至超过约25个核苷酸。例如,向导序列和对应的靶位点序列之间的碱基配对区域的长度可以为约10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或多于25个核苷酸。在示例性实施方式中,向导序列的长度为约17-20个核苷酸,例如20个核苷酸。
另外,crRNA具有靶指定序列的3’恒定区。该序列形成重复:反重复茎,其将crRNA与RNA支架的tracrRNA组分连接。crRNA的恒定3’序列与tracrRNA的5’序列互补,因此形成双链体茎。RNA支架的重复:反重复区域可以分成3个部分;下部茎、凸起和上部茎。下部茎为通过Watson-Crick和非Watson-Crick碱基配对的7bp长度形式;这之后是4个核苷酸的凸起结构。上部茎由4bp结构组成。当合成为单个RNA分子时,tracrRNA包括反重复区、四环和sgRNA的3’恒定区。当合成为单独的RNA分子时,tracrRNA包括反重复区和sgRNA的3'恒定区,但不存在四环。
选择合适的靶核酸的一个要求是其具有3’PAM位点/序列。每个目标序列及其对应的PAM站点/序列在本文中被称为Cas靶向位点。2类CRISPR系统,例如II型酶,是最熟知的系统之一,仅需要Cas9蛋白和与靶序列互补的向导RNA以实现靶切割。酿脓链球菌的2类II型CRISPR系统例如cas9使用具有N12-20NGG的靶位点,其中NGG表示来自酿脓链球菌的PAM位点,N12-20表示直接5’到PAM位点的12-20个核苷酸。来自其他物种的细菌的另外的PAM位点序列包括NGGNG、NNNNGATT、NNAGAA、NNAGAAW和NAAAAC。参见,例如,US 20140273233,WO2013176772,Cong等人,(2012),Science 339(6121):819–823,Jinek等人,(2012),Science337(6096):816–821,Mali et al,(2013),Science 339(6121):823–826,Gasiunas等人,(2012),Proc Natl Acad Sci U S A.109(39):E2579–E2586,Cho等人,(2013)NatureBiotechnology 31,230–232,Hou等人,Proc Natl Acad Sci U S A.2013Sep24;110(39):15644-9,Mojica等人,Microbiology.2009Mar;155(Pt 3):733-40,and www.addgene.org/CRISPR/。这些文献的内容以全文引用的方式并入本文中。
靶核酸链可以是宿主细胞中基因组DNA上的两条链中的任一条。这种基因组dsDNA的实例包括但不必限于宿主细胞染色体、线粒体DNA和稳定维持的质粒。然而,应当理解,本方法可以在宿主细胞中存在的其它dsDNA上实施,例如非稳定质粒DNA、病毒DNA和噬菌体DNA,只要存在Cas靶向位点,无论宿主细胞dsDNA的性质如何。本方法也可以在RNA上实施。
tracrRNA
除了上述向导序列之外,本发明的RNA支架包括另外的活性或非活性子组分。在一个实例中,支架具有tracrRNA。例如,支架可以是混合RNA分子,其中包括可编程向导RNA的上述crRNA与tracrRNA融合以模拟天然crRNA:tracrRNA双链体。下面示出的是示例性混合crRNA:tracrRNA,gRNA序列SEQ ID NO:3:
5’-(20nt向导)-
GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAG UCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU-3’。各种tracrRNA序列是本领域已知的,并且实例包括以下tracrRNA和其活性部分。如本文所用,tracrRNA的活性部分保留与Cas蛋白(例如Cas9或dCas9或nCas9)形成复合物的能力。用于产生crRNA-tracrRNA混合RNA(也称为单一向导RNA或sgRNA)的方法是本领域已知的。在其中crRNA和tracrRNA作为单一gRNA(sg RNA)提供的一个实施方式中,两个组分通过四茎环连接在一起。在一些实施方式中,重复-反重复区域是延伸的。在重复:反重复区的任一侧存在2、3、4、5、6、7个碱基或超过7个碱基的延伸。在优选的实施方式中,重复:反重复区域在上部茎的任一侧具有7个核苷酸的延伸,如图10C和图10D所示。在上部茎的任一侧的7个碱基的延伸产生14个碱基对长的区域。当RNA支架被合成为一个单一RNA分子时,在上部茎的任一侧的7个碱基延伸导致上部茎在任一侧具有总共11个碱基,以及22个核苷酸的总长度,如图10C所示。当RNA支架被合成为两个单独的RNA分子时,在上部茎的任一侧的7个碱基的延伸导致上部茎在任一侧具有总共11个碱基,以及25个核苷酸的总长度,如图10D所示。在一个实施方式中,当RNA支架被合成为单一RNA分子时,重复:反重复区域的上部茎的总长度为22个核苷酸。在其他实施方式中,当RNA支架被合成为两个单独RNA分子时,重复:反重复区域的上部茎的总长度为25个核苷酸。在其他实施方式中,延伸可以多于7个基部。
参见例如WO 2014099750、US 20140179006和US 20140273226。这些文献的内容以全文引用的方式并入本文中。
具有各种截短和延伸的酿脓链球菌Cas9的TracrRNA如下所示:
GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:4);
UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUC GGUGC(SEQ IDNO:5);
AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCG AGUCGGUGC(SEQID NO:6);
CAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:7);
UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG(SEQ ID NO:8);
UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA(SEQ ID NO:9);和
UAGCAAGUUAAAAUAAGGCUAGUCCG(SEQ ID NO:10)。
在一些实施方式中,tracrRNA来自酿脓链球菌。
在一些实施方式中,tracrRNA和包含向导序列的crRNA为两个单独的RNA分子,其一起形成功能性向导RNA和RNA支架的一部分。在这种情况下,tracrRNA应能够与具有向导序列的crRNA相互作用(通常通过碱配对)以形成两部分向导crRNA:tracRNA。
RNA基序
RNA支架的第三子组分是RNA基序,其实际上将效应子模块(碱基编辑酶)募集到靶DNA。RNA基序也称为募集RNA基序。该连接对于本文所公开的基因编辑系统和方法而言是关键的。如本文所公开的RNA支架可以具有一个或多个RNA基序。
将效应子/DNA编辑酶募集到靶序列的现有技术方法是通过将效应子蛋白直接融合到dCas9。将效应酶直接融合到序列识别所需的蛋白质(例如dCas9)已在序列特异性转录激活或抑制方面获得成功,但蛋白质-蛋白质融合设计可呈现空间阻碍,这对于需要形成用于其活性的多聚复合体的酶是不理想的。事实上,大多数核苷酸编辑酶(例如AID或APOBEC3G)需要形成二聚体、四聚体或更高级的寡聚物,用于其DNA编辑催化活性。以定义的构象锚定到DNA的到dCas9的直接融合将阻碍在正确位置形成功能性的寡聚酶复合物。
相比之下,本文提供的RNA支架介导的募集系统和方法基于RNA支架介导的效应子蛋白募集。更具体地,平台利用各种RNA基序/RNA结合蛋白结合对。为此,RNA支架被设计成使得特异性结合适体结合分子(例如RNA结合蛋白(例如,MS2衣壳蛋白,MCP))的RNA基序(例如,MS2操纵基因基序),在tracrRNA的3’末端经由接头序列连接到RNA支架。接头可以是单链RNA或化学连接。在一个实施方式中,单链接头包含0-10个核苷酸,优选2-6个核苷酸。单链序列可以包含GC核苷酸。有利地,接头例如单链接头将RNA基序的环与tracrRNA的大体积茎环分离。如本文所公开的一个或多个RNA基序具有延伸序列。在优选的实施方式中,所述延伸序列是双链延伸。延伸序列的长度包括2-24个核苷酸不等。在一些实施方式中,所述一个或多个RNA基序包括一个或多个修饰。一个或多个修饰可以在一个或多个RNA基序的5’末端和/或3’末端处。
因此,本文公开的平台的该RNA支架组分是设计的RNA分子,其不仅包含用于特异性DNA/RNA序列识别的crRNA、用于Cas蛋白结合的tracrRNA,还包含用于效应子募集的RNA基序(图1B)。以这种方式,可以通过其结合RNA基序的能力将募集的效应子模块募集到靶位点。由于RNA支架介导的募集的灵活性,功能单体以及二聚体、四聚体或寡聚物可以在靶DNA或RNA序列附近相对容易地形成。这些RNA基序/结合蛋白对可以源自天然来源(例如RNA噬菌体或酵母端粒酶)或可以人工设计(例如RNA适体及其相应的结合蛋白配体)。可以在本文提供的方法和系统中使用的募集RNA基序/RNA结合蛋白对的实例的非穷举列表总结于表2中。
表2.可以在本发明中使用的募集RNA基序的实例,以及它们的配对RNA结合蛋白/蛋白结构域。
*募集蛋白融合至效应子蛋白,例如参见表3。
以下列出上述结合对的序列。
1.端粒酶Ku双合基序/Ku异二聚体
a.Ku结合发夹
5’-UUCUUGUCGUACUUAUAGAUCGCUACGUUAUUUCAAUUUUGAAAAUCUGAGUCCUGGGAGUGCGGA-3’SEQ ID NO:11
Ku异二聚体SEQ ID NO:12
MSGWESYYKTEGDEEAEEEQEENLEASGDYKYSGRDSLIFLVDASKAMFESQSEDELTPFDMSIQCIQSVYISKIISSDRDLLAVVFYGTEKDKNSVNFKNIYVLQELDNPGAKRILELDQFKGQQGQKRFQDMMGHGSDYSLSEVLWVCANLFSDVQFKMSHKRIMLFTNEDNPHGNDSAKASRARTKAGDLRDTGIFLDLMHLKKPGGFDISLFYRDIISIAEDEDLRVHFEESSKLEDLLRKVRAKETRKRALSRLKLKLNKDIVISVGIYNLVQKALKPPPIKLYRETNEPVKTKTRTFNTSTGGLLLPSDTKRSQIYGSRQIILEKEETEELKRFDDPGLMLMGFKPLVLLKKHHYLRPSLFVYPEESLVIGSSTLFSALLIKCLEKEVAALCRYTPRRNIPPYFVALVPQEEELDDQKIQVTPPGFQLVFLPFADDKRKMPFTEKIMATPEQVGKMKAIVEKLRFTYRSDSFENPVLQQHFRNLEALALDLMEPEQAVDLTLPKVEAMNKRLGSLVDEFKELVYPPDYNPEGKVTKRKHDNEGSGSKRPKVEYSEEELKTHISKGTLGKFTVPMLKEACRAYGLKSGLKKQELLEALTKHFQD>
MVRSGNKAAVVLCMDVGFTMSNSIPGIESPFEQAKKVITMFVQRQVFAENKDEIALVLFGTDGTDNPLSGGDQYQNITVHRHLMLPDFDLLEDIESKIQPGSQQADFLDALIVSMDVIQHETIGKKFEKRHIEIFTDLSSRFSKSQLDIIIHSLKKCDISERHSIHWPCRLTIGSNLSIRIAAYKSILQERVKKTWTVVDAKTLKKEDIQKETVYCLNDDDETEVLKEDIIQGFRYGSDIVPFSKVDEEQMKYKSEGKCFSVLGFCKSSQVQRRFFMGNQVLKVFAARDDEAAAVALSSLIHALDDLDMVAIVRYAYDKRANPQVGVAFPHIKHNYECLVYVQLPFMEDLRQYMFSSLKNSKKYAPTEAQLNAVDALIDSMSLAKKDEKTDTLEDLFPTTKIPNPRFQRLFQCLLHRALHPREPLPPIQQHIWNMLNPPAEVTTKSQIPLSKIKTLFPLIEAKKKDQVTAQEIFQDNHEDGPTAK
‘>’分开两个二聚体。
2.端粒酶Sm7结合基序/Sm7同七聚体
a.Sm一致位点(单链)
5’-AAUUUUUGGA-3’SEQ ID NO:13
单体Sm-样蛋白(古细菌)SEQ ID NO:14
GSVIDVSSQRVNVQRPLDALGNSLNSPVIIKLKGDREFRGVLKSFDLHMNLVLNDAEELEDGEVTRRLGTVLIRGDNIVYISP
3.MS2噬菌体操纵基因茎环/MS2衣壳蛋白
a.MS2噬菌体操纵基因茎环
5’-ACAUGAGGAUCACCCAUGU-3’SEQ ID NO:15
MS2衣壳蛋白质SEQ ID NO:16
MASNFTQFVLVDNGGTGDVTVAPSNFANGIAEWISSNSRSQAYKVTCSVRQSSAQNRKYTIKVEVPKGAWRSYLNMELTIPIFATNSDCELIVKAMQGLLKDGNPIPSAIAANSGIY
4.PP7噬菌体操纵基因茎环/PP7衣壳蛋白
a.PP7噬菌体操纵基因茎环
5’-aUAAGGAGUUUAUAUGGAAACCCUUA-3’SEQ ID NO:17
PP7衣壳蛋白(PCP)SEQ ID NO:18
MSKTIVLSVGEATRTLTEIQSTADRQIFEEKVGPLVGRLRLTASLRQNGAKTAYRVNLKLDQADVVDCSTSVCGELPKVRYTQVWSHDVTIVANSTEASRKSLYDLTKSLVATSQVEDLVVNLVPLGR
5.SfMu Com茎环/SfMu Com结合蛋白
a.SfMu Com茎环
5’-CUGAAUGCCUGCGAGCAUC-3’SEQ ID NO:19
a.SfMu Com结合蛋白SEQ ID NO:20
MKSIRCKNCNKLLFKADSFDHIEIRCPRCKRHIIMLNACEHPTEKHCGKREKIT HSDETVRY
RNA支架可以是单一RNA分子或多个RNA分子的复合物。例如,向导RNA、tracrRNA和RNA基序可以是一个长的单一RNA分子的三个区段。或者,它们中的一个、两个或三个可以在单独的分子上。在后一种情况下,三个组分可以通过共价或非共价连接或结合(包括例如Watson-Crick碱基配对)连接在一起以形成支架。
在一个实例中,RNA支架可包含两个单独的RNA分子。第一RNA分子可以包含含有可编程的向导RNA的crRNA和可以形成具有互补区域的茎双链体结构的区域。第二RNA分子除了tracrRNA和RNA基序之外还可以包含互补区。经由该茎双链体结构,第一RNA分子和第二RNA分子形成本发明的RNA支架。在一个实施方式中,第一RNA分子和第二RNA分子各自包括与另一序列碱基配对的序列(约6至约20个核苷酸)。同样地,tracrRNA和RNA基序也可以在不同的RNA分子上,并与另一个茎双链体连接在一起。
本发明的RNA和相关支架可以通过本领域已知的各种方法制备,包括基于细胞的表达、体外转录和化学合成或其组合。化学合成相对长的RNA(长达200个以上)的能力允许产生具有优于由4个基本核糖核苷酸(A、C、G和U)实现的那些的特殊特征的RNA。
可以使用利用本领域已知的宿主细胞系统或体外翻译转录系统的重组技术制备Cas蛋白-向导RNA支架复合物。这样的系统和技术的细节可以见于例如WO2014144761、WO2014144592、WO2013176772、US20140273226和US20140273233中找到,其内容以全文引用的方式并入本文。可以将复合物从细胞的细胞材料或其中产生其的体外翻译-转录系统分离或纯化,至少至一定程度。
修饰
如本文所公开的RNA支架可以包括一个或多个修饰。
这样的修饰可以包括包含和/或去除至少一种非天然存在的核苷酸或修饰的核苷酸或其类似物。此类修饰的实例包括但不限于添加核苷酸以延伸序列、取代核苷酸、添加接头序列、去除核苷酸和修饰RNA支架的各种组分的定位。一个或多个修饰是针对RNA支架的主链和/或糖部分。
核苷酸可以在核糖、磷酸盐连接和/或碱基部分处修饰。经修饰的核苷酸可以包括2′-O-甲基类似物、2′-氟类似物或2′-脱氧类似物或2′-核糖类似物。核酸主链可以被修饰,例如,可以使用硫代磷酸酯主链。使用锁核酸(LNA)或桥接核酸(BNA)也是可行的。经修饰的碱基的其它实例包括但不限于2-氨基嘌呤、5-溴-尿苷、5-甲基胞苷、5-甲氧基尿苷、假尿苷、肌苷、7-甲基鸟苷。这些修饰可应用于RNA支架的任何组分。这些修饰可以应用于CRISPR系统的任何组分。在优选的实施方式中,对RNA组分(例如,向导RNA序列)进行这些修饰。
在一些实施方式中,上述RNA支架或其亚部分可以包含一个或多个修饰,例如,碱基修饰、主链修饰等,以提供具有新的或增强的特征(例如,改善的稳定性)的核酸。
经修饰的主链和经修饰的核苷间键
含有修饰的合适核酸的实例包括含有修饰的主链、碱基、糖或非天然核苷间键的核酸。核酸(具有经修饰的主链)包括将磷原子保留在主链中的那些和在主链中不具有磷原子的那些。
其中含有磷原子的合适的经修饰的寡核苷酸主链包括,例如硫代磷酸酯类、手性硫代磷酸酯类、二硫代磷酸酯类、膦酸三酯类、氨基烷基膦三酯类、甲基和其他烷基膦酸酯类,包括3’-亚烷基膦酸酯、5’-亚烷基膦酸酯和手性膦酸酯、氨基磷酸酯类,包括3’-氨基磷酸酯和氨基烷基磷酰胺、磷二酰胺类(phosphorodiamidates)、硫代磷酰胺类、硫烷基膦酸酯类、硫烷基磷酸三酯类、具有正常3’-5’键的硒磷酸酯类和硼磷酸酯类、这些的2’-5’连接类似物,以及具有反极性的那些,其中一个或多个核苷酸间键是3’-3’、5’-5’或2’-2’键。具有反转极性的合适的寡核苷酸包括在最3'核苷酸间键处的单个3’至3’键,即,可以是碱性的单个倒置的核苷残基(核碱基缺失或具有取代其的羟基)。还包括各种盐(例如钾或钠)、混合盐和游离酸形式。
在一些实施方式中,主题核酸包含一个或多个硫代磷酸酯和/或杂原子核苷间键,特别是—CH2—NH—O—CH2—、—CH2—N(CH3)—O—CH2-(称为亚甲基(甲基亚氨基)或MMI主链)、—CH2—O—N(CH3)—CH2—、—CH2—N(CH3)—N(CH3)—CH2—和—O—N(CH3)—CH2—CH2—(其中天然磷酸二酯核苷间键表示为—O—P(═O)(OH)—O—CH2—)。MMI型核苷间键公开于以上引用的美国专利No.5,489,677中。合适的酰胺核苷间键公开于美国专利No.5,602,240中。
还合适的是具有吗啉代主链结构的核酸,如例如美国专利No.5,034,506中所述的。例如,在一些实施方式中,主题核酸包含6元吗啉代环代替核糖环。在这些实施方式中的一些中,磷酸二酯酶或其它非磷酸二酯核苷间键代替磷酸二酯键。
其中不包括磷原子的合适的经修饰的多核苷酸主链具有由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键、或一个或多个短链杂原子或杂环核苷间键形成的主链。这些包括具有下述的那些:吗啉键(部分地由核苷的糖部分形成);硅氧烷主链;硫化物、亚砜和砜主链;甲酰基(formacetyl)和硫代甲酰基主链;亚甲基甲酰基和硫代甲酰基主链;核糖乙酰基(riboacetyl)主链;含烯烃主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和磺酰胺主链;酰胺主链;以及具有混合N、O、S和CH2组分部分的其它主链。
模拟物
主题核酸可以是核酸模拟物。应用于多核苷酸的术语“模拟物”旨在包括其中仅有呋喃糖环或所述呋喃糖环和所述核苷酸间键两者被非呋喃核糖基团替换的多核苷酸,仅替换所述呋喃糖环在本领域中也被称为糖替代物。杂环基碱基或经修饰的杂环基碱基被维持用于与适当的靶核酸杂交。一种这样的核酸是已经显示具有优异杂交性质的多核苷酸模拟物,被称为肽核酸(PNA)。在PNA中,多核苷酸的糖主链被含酰胺的主链取代,特别是氨基乙基甘氨酸主链。保留核苷酸并直接或间接结合到主链的酰胺部分的氮杂氮原子上。
已经报道具有优异杂交性能的一种多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的主链是两个以上连接的氨基乙基甘氨酸单元,其提供PNA含酰胺的主链。杂环碱基直接或间接结合到主链的酰胺部分的氮杂氮原子上。描述PNA化合物的制备的代表性美国专利包括但不限于:美国专利Nos.5,539,082;5,714,331和5,719,262。
已经研究的另一类多核苷酸模拟物是基于具有连接到吗啉代环的杂环碱基的连接的吗啉代单元(吗啉代核酸)。已经报道了连接吗啉代核酸中的吗啉代单体单元的多个连接基团。一类连接基团已被选择以给出非离子的寡聚化合物。基于非离子吗啉代类寡聚化合物不太可能与细胞蛋白具有不期望的相互作用。基于吗啉的多核苷酸是寡核苷酸的非离子模拟物,其不太可能与细胞蛋白形成不期望的相互作用(Dwaine A.Braasch and DavidR.Corey,Biochemistry,2002,41(14),4503-4510)。基于吗啉的多核苷酸公开于美国专利No.5,034,506中。已经制备了吗啉代类的多核苷酸内的多种化合物,其具有连接单体亚单元的各种不同的连接基团。
另一类多核苷酸模拟物被称为环己烯核酸(CeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯环取代。CeNADMT保护的亚磷酰胺单体已经制备并用于在经典亚磷酰胺化学之后的寡聚化合物合成。已经制备和研究了完全修饰的CeNA寡聚化合物和具有用CeNA修饰的特定位置的寡核苷酸(参见Wang等,J.Am.Chem.Soc.,2000,122,8595-8602)。通常,将CeNA单体结合到DNA链中提高了其DNA/RNA杂交体的稳定性。CeNA寡腺苷酸形成与RNA和DNA互补的复合物,具有与天然复合物类似的稳定性。通过NMR和圆二色性显示将CeNA结构结合到天然核酸结构中的研究,以进行容易的构象适应。
进一步的修饰包括锁核酸(LNA),其中2′-羟基连接到糖环的4′碳原子,从而形成2′-C、4′-C-氧亚甲基键,从而形成双环糖部分。该键可以是亚甲基(—CH2—)、桥接2′氧原子和4′碳原子的基团,其中n是1或2(Singh等,Chem.Commun.,1998,4,455-456)。LNA和LNA类似物显示具有互补DNA和RNA的非常高的双联体热稳定性(Tm=+3至+10℃)、针对3'-外核降解的稳定性和良好的溶解度性质。已经描述了含有LNA的具有毒性和无毒的反义寡核苷酸(Wahlestedt等人,Proc.Natl.Acad.Sci.U.S.A.,2000,97,5633-5638)。
已经描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基-胞嘧啶、胸腺嘧啶和尿嘧啶连同它们的寡聚化和核酸识别性质的合成和制备(Koshkin等,Tetrahedron,1998,54,3607-3630)。在WO 98/39352和WO 99/14226中也描述了LNA及其制备。
修饰的糖部分
主题核酸还可以包括一个或多个取代糖部分。合适的多核苷酸包括选自以下的糖取代基:OH;H;F;O-、S-或N-烷基;O-、S-或N-烯基;O-、S-或N-炔基;或O-烷基-Co-烷基,其中烷基、烯基和炔基可以是取代或未取代的C1-C10烷基或C2-C10烯基和炔基。特别合适的是O((CH2)nO)mCH3、O(CH2)nOCH3、O(CH2)nNH2、O(CH2)nCH3、O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其他合适的多核苷酸包括选自以下的糖取代基:C1至C10低级烷基、取代低级烷基、烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONO2、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨基烷基氨基、多烷基氨基、取代甲硅烷基、RNA切割基团、报告基团、嵌入剂、用于改善寡核苷酸的药代动力学性质的基团、或用于改善寡核苷酸的药代动力学性质的基团,以及具有类似性质的其他取代基。合适的修饰包括2′-甲氧基乙氧基(2′—O—CH2 CH2OCH3,,也称为2′-O-(2-甲氧基乙基)或2′-MOE)(Martin等人,Helv.Chim.Acta,1995,78,486-504),即烷氧基烷氧基。进一步合适的修饰包括2′-二甲基氨基氧基乙氧基,即O(CH2)2ON(CH3)2基团,也称为2′-DMAOE,如下文实例中所述,和2′-二甲基氨基乙氧基乙氧基(在本领域中也称为2′-O-二甲基-氨基-乙氧基-乙基或2′-DMAEOE),即2′—O—CH2—O—CH2—N(CH3)2
其它合适的糖取代基包括甲氧基(—O—CH3)、氨基丙氧基(—O CH2 CH2CH2NH2)、烯丙基(—CH2—CH═CH2)、-O-烯丙基CH2—CH═CH2)和氟(F)。2′-糖取代基可以是在阿拉伯(上)位置或核糖(下)位置。合适的2'-阿拉伯糖修饰是2'-F。也可以在寡聚化合物上的其他位置,特别是在3'末端核苷或2'-5'连接寡核苷酸上的糖的3'位置和5'末端核苷酸的5'位置,进行类似的修饰。寡聚化合物也可以具有糖模拟物,例如环丁基部分代替戊呋喃糖基糖。
碱基修饰和取代
主题核酸还可以包括核碱基(在本领域中通常简称为“碱基”)修饰或取代。如本文所用,“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G),和嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。经修饰的核碱基包括其它合成和天然核碱基,例如5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基和其它烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其它烷基衍生物,2-硫尿嘧啶,2-硫代胸腺嘧啶和2-硫代胞嘧啶,5-卤代尿嘧啶和胞嘧啶,5-丙炔基(—C═C—CH3)尿嘧啶和胞嘧啶和嘧啶碱基的其它炔基衍生物,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤代、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其它8-取代的腺嘌呤和鸟嘌呤,5-卤代特别是5-溴、5-三氟甲基和其它5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,2-F-腺嘌呤、2-氨基-腺嘌呤、8-氮杂鸟嘌呤和8-氮杂腺嘌呤、7-脱氮杂鸟嘌呤和7-脱氮杂腺嘌呤和3-脱氮杂鸟嘌呤和3-脱氮杂腺嘌呤。进一步修饰的核碱基包括三环嘧啶如苯并噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻唑啉-2(3H)-酮)、G-夹(clamps)如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3′,2′:4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可以包括其中嘌呤或嘧啶碱基被其它杂环取代的那些,例如7-脱氮杂-腺嘌呤、7-脱氮杂-鸟苷、2-氨基吡啶和2-吡啶酮。另外的核碱基包括在美国专利No.3,687,808中公开的那些,The Concise Encyclopedia Of Polymer Science AndEngineering,pages 858-859,Kroschwitz,J.I.,ed.John Wiley&Sons,1990中公开的那些,Englisch等,Angewandte Chemie,International Edition,1991,30,613中公开的那些,和Sanghvi,Y.S.,Chapter 15,Antisense Research and Applications,pages 289-302,Crooke,S.T.and Lebleu,B.,ed.,CRC Press,1993公开的那些。这些核碱基中的某些可用于增加寡聚化合物的结合亲和力。这些包括5-取代嘧啶、6-氮杂嘧啶和N-2、N-6和O-6取代嘌呤,包括2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。已经显示5-甲基胞嘧啶取代增加核酸双链体稳定性0.6-1.2℃(Sanghvi等,eds.,Antisense Research andApplications,CRC Press,Boca Raton,1993,pp.276-278)并且是合适的甲基取代,例如,当与2′-O-甲氧基乙基糖修饰组合时。
如本文所公开的修饰可以并入RNA支架的各种位置,例如在sgRNA的四环处,crRNA:tracrRNA组分的重复:反重复区域,在tracrRNA的任何位置,例如在5'端、3'端、茎环1、2或3,以及在RNA基序。本文公开的修饰包括但不限于sgRNA的重复-反重复的延伸或2部分组分的crRNA:tracrRNA,其将RNA基序定位在在tracrRNA基序的3’末端,将RNA基序接头连接到CRISPR基序,修饰RNA基序的核苷酸并延伸RNA基序。
RNA基序的定位
RNA基序可以位于RNA支架的各种位置,如实施例1所述。本发明的RNA支架可以具有一个MS2 RNA基序或可以具有两个MS2 RNA基序。RNA基序(例如,MS2适体)可以定位在tracrRNA的3'端,在sgRNA的四环处,在tracrRNA的茎环2处,并且在tracrRNA的茎环3处。适体(例如,MS2适体)的定位是至关重要的,这是由于可以由大体积环产生的空间位阻。在优选实施方式中,所述MS2适体处于CRISPR基序的3'端。有利地,MS2适体定位在CRISPR基序的3'末端处因此在空间上减少了具有RNA支架的其他大体积环的空间位阻。
接头
RNA基序可以通过接头连接到tracrRNA基序。接头可以是单链RNA或化学连接。单链RNA接头可以是2、3、4、5、6、7或多于7个核苷酸。有利地,接头序列为RNA支架提供了灵活性。接头序列可包括GC核苷酸。
修饰RNA基序的核苷酸
可以对RNA基序(例如,适体序列)进行修饰。在优选实施方式中,RNA基序包括一个或多个修饰。例如,合适的修饰是指C-5和F-5适体突变体。在优选的实施方式中,对适体的修饰是在位置10将腺嘌呤取代为2-氨基嘌呤(2-AP)。有利地,取代诱导构象改变,导致与野生型MS2相比更大的亲和力。尽管不希望受任何理论的束缚,但据认为由2-AP诱导的构象改变导致位置10位处的2-AP核苷酸的环外氨基与主链处的羰基B59之间的氢键形成。据认为,用较高亲和力的MS2序列替代MS2发夹序列将导致增加的基因编辑效率,因为取代氨基酸有助于将RNA茎环排序成更好地由衣壳蛋白识别的构象。
以上列出了对RNA基序的合适的修饰,例如2′脱氧-2-氨基嘌呤、2′核糖-2-氨基嘌呤、硫代磷酸酯修饰(mods)、2′-O甲基修饰(mods)、2′-氟修饰(mods)和LNA修饰(mods)。有利地,所述修改有助于增加稳定性并促进所需发夹的更强的键/折叠结构。
其他合适的修饰可以在一个或多个RNA基序的5’末端和/或3’末端。
RNA基序的延伸
RNA基序延伸的长度可以是可变的。RNA基序的延伸可以为2-24个核苷酸不等。RNA基序的延伸可以大于24个核苷酸。图3A-D显示募集RNA基序相对于野生型MS2的多个延伸,并且下面显示延伸的序列。图3A是4核苷酸(2bp)延伸,其产生总长度为23个核苷酸的茎(SEQ ID NO:21)。图3B是10个核苷酸(5bp)延伸,其产生总长度为29个核苷酸的茎(SEQ IDNO:22)。图3C是16个核苷酸(8bp)延伸,其产生总长度为35个核苷酸的茎(SEQ ID NO:23)。图3D是26个核苷酸(13bp)延伸,其产生总长度为45个核苷酸的茎(SEQ ID NO:24)。有利地,RNA基序的延伸增加基序的灵活性。RNA基序的延伸可以是双链或单链延伸。双链延伸提供了RNA支架的更大稳定性。在优选的实施方式中,RNA基序的延伸是双链。
RNA基序延伸的序列
延伸(SEQ ID NO:21)
延伸(SEQ ID NO:22)
延伸(SEQ IDNO:23)
延伸(SEQ ID NO:24)
说明
GC接头带下划线,核苷酸延伸以粗体示出,并且适体是斜体的。
重复:反重复区域
crRNA和tracrRNA可以作为sgRNA或作为两个单独的组分提供。crRNA通过重复:反重复区域与tracrRNA杂交。crRNA的重复区域与tracrRNA的反重复区域杂交。重复:反重复区域可以延伸以增加组分的灵活性、适当的折叠和稳定性。重复:反重复区域可在区域的任一侧延伸2、3、4、5、6、7个碱基或超过7个碱基。重复:反重复区域可以总共延伸14个核苷酸。重复:反重复还可以包括如上所述的其他修饰。
修饰的组合
RNA支架可以具有一个或多个上述修饰。对RNA支架的一个或多个修饰是一个或多个上述修饰,例如重复:反重复区域的延伸、募集RNA基序的延伸或核苷酸被2AP取代。一个或多个修饰可以在RNA支架的不同组分上,例如sgRNA的重复:反重复区域的延伸,或2部分crRNA:tracrRNA,以及RNA基序的延伸。一个或多个修饰或可以在RNA支架的相同组分上,例如RNA基序的延伸和RNA基序核苷酸的取代。修饰可以是两个以上、三个以上、四个以上或五个以上。在一个实施方式中,修饰可以是RNA基序的延伸和/或可以是RNA基序核苷酸的取代。例如,修饰可以是RNA基序的延伸或RNA基序核苷酸的取代。在其它情况下,RNA基序可以具有延伸的长度和核苷酸取代。
适体
在一些实施方式中,适体结合蛋白可以是野生型蛋白质、野生型蛋白质的突变体或其变体。如本文中所用的RNA基序的实例是MS2适体。RNA基序与适体结合分子结合。MS2基序特异性结合MS2噬菌体衣壳蛋白(MCP)。重复体外选择过程,产生一系列适体家族。适体家族成员中的两个包括MS2 C-5突变体和MS2 F-5突变体。野生型MS2以及C-5和F-5突变体之间的显著差异之一是在适体环的5位将尿嘧啶核苷酸取代为胞嘧啶。与野生型和适体家族的其它成员相比,已经报道了F-5突变体对衣壳蛋白具有更高的亲和力。适当地,C-5突变体和F-5突变体都用作本发明中的适体。在一个实施方式中,所述MS2适体是野生型MS2、突变型MS2或其变体。在另一个实施方式中,所述MS2适体包含C-5和/或F-5突变。链接到CRISPR基序的MS2蛋白质可以是单拷贝(即,一个MS2环)或双拷贝(即,两个MS2环)。在优选的实施方式中,RNA支架具有一个RNA基序。在其他实施方式中,RNA支架具有多于一个、多于两个、多于三个RNA基序。在其他实施方式中,RNA支架具有两个RNA基序。
c.效应子模块
本发明公开的平台的第三组分是非核酸酶效应子。如本文所公开的效应子模块包括能够结合RNA基序和效应子结构域的RNA结合结构域。如本文所用的效应子结构域包括但不限于酶、报告子、标签、分子、蛋白质、微粒、纳米颗粒。在一个实施方式中,效应子结构域是DNA修饰酶。
效应子不是核酸酶,并且不具有任何核酸酶活性,而是可以具有其他类型的DNA修饰酶的活性,例如碱基编辑。酶活性的实例包括但不限于脱胺活性、甲基转移酶活性、脱乙酰酶活性、DNA修复活性、DNA损伤活性、歧化酶活性、切口酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性。在一些实施方式中,效应子具有胞苷脱氨酶(例如,AID、APOBEC3G)、腺苷脱氨酶(例如ADA)、DNA甲基转移酶和DNA脱乙酰酶的活性。在一些实施方式中,效应子来自不同脊椎动物的动物物种并具有不同的活性特性。
在优选的实施方式中,该第三组分是具有RNA结合结构域和效应子结构域的缀合物或融合蛋白。这两个结构域可以经由接头连接。
在一些实施方式中,在一些细胞类型(例如,过表达脱氨酶的癌系)中不需要效应子。在这种情况下,可以对内源性效应子(例如,APOBEC、AID等)进行基因编辑以包括募集模块,因此不需要外源性编辑器。这适用于表达感兴趣的编辑器的细胞类型,例如淋巴样(B+T细胞)和某些癌细胞。此外,切口酶活性不必来自Cas模块,而是可以从效应子募集–例如,dCas9可以具有适体以经由相同的gRNA募集来募集切口酶和编辑器。如本文所用的效应子蛋白可以是野生型、经基因工程改造的或嵌合的酶。
RNA结合结构域
尽管在本发明中可以使用各种RNA结合结构域,但不应使用Cas蛋白的RNA结合结构域(例如Cas9)或其变体(例如dCas9)。如上所述,与dCas9的直接融合(其以限定构象锚定到DNA)将阻碍在正确位置形成功能性的寡聚酶络合物。相反,本发明具有各种其它RNA基序-RNA结合蛋白结合对的优点。实例包括表2中列出的那些。
以这种方式,可以通过RNA结合结构域结合募集RNA基序的能力将效应子蛋白募集到靶位点。由于RNA支架介导的募集的灵活性,功能性单体以及二聚体、四聚体或寡聚物可以在靶DNA或RNA序列附近相对容易地形成。
效应子结构域
效应子部件包括活性部分,即,效应子结构域。在一个实施方式中,如本文所用的效应子结构域包括但不限于酶、报告子、标签、分子、蛋白质、微粒、纳米颗粒。在一些实施方式中,效应子结构域包括非核酸酶蛋白质(例如脱氨酶)的天然存在的活性部分。在其它实施方式中,效应子结构域包括非核酸酶蛋白质的天然存在的活性部分的修饰氨基酸序列(例如,取代、缺失、插入)。效应子结构域具有酶活性。该活性的实例包括脱胺活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性、糖基化酶活性、DNA甲基化、组蛋白乙酰化活性或组蛋白甲基化活性。非核酸酶蛋白(例如,脱氨酶)中的一些修饰可以帮助减少脱靶效应。例如,如下所述,可以通过将AID中的Ser38突变为Ala来减少AID到脱靶位点的募集。
接头
上述两个结构域以及本文所公开的其它结构域可以通过接头连接,例如但不限于化学修饰、肽接头、化学接头、共价或非共价键、或蛋白质融合或通过本领域技术人员已知的任何方法。连接可以是永久性的或可逆的。参见例如美国专利Nos.4625014、5057301和5514363、US Application Nos.20150182596和20100063258以及WO2012142515,其内容通过引用以其整体并入本文。在一些实施方式中,可以包括几个接头,以便利用每个接头和缀合物中的每个蛋白质结构域的所需性质。例如,柔性接头和预期增加缀合物的溶解度的接头单独使用或与其他接头一起使用。肽接头可以通过将编码接头的DNA表达至缀合物中的一个或多个蛋白质结构域来连接。接头可以是酸切割性的、光切割性的和热敏感性接头。用于缀合的方法是本领域技术人员公知的,并且包含在本发明用途中。
在一些实施方式中,RNA结合结构域和效应子结构域可以通过肽接头连接。肽接头可以通过框内表达编码两个结构域和接头的核酸来连接。任选地,连接肽可在结构域的氨基末端和羧基末端中的任一个或两个处接合。在一些实例中,接头是如美国专利Nos.6,165,476,5,856,456,美国申请Nos.20150182596和2010/0063258,以及国际申请WO2012/142515中所公开的免疫球蛋白铰链区接头,其每一篇通过引用整体上并入本文。
其他结构域
效应子融合蛋白可包含其他结构域。在某些实施方式中,效应子融合蛋白可包含至少一种核定位信号(NLS)。通常,NLS包括一段碱性氨基酸的拉伸。核定位信号在本领域中是已知的(参见,例如,Lange等人,J.Biol.Chem.,2007,282:5101-5105)。NLS可以位于融合蛋白的N末端、C末端或内部位置。
在一些实施方式中,融合蛋白可包含至少一个细胞穿透结构域以促进蛋白递送到靶细胞中。在一个实施方式中,细胞穿透结构域可以是细胞穿透肽序列。各种细胞穿透肽序列在本领域中是已知的,并且实例包括HIV-1TAT蛋白的细胞穿透肽序列、人类HBV的TLM、Pep-1、VP22和聚精氨酸肽序列。
在其它实施方式中,融合蛋白可包含至少一个标记结构域。标记结构域的非限制性实例包括荧光蛋白、纯化标签和表位标签。在一些实施方式中,标记结构域可以是荧光蛋白。在其它实施例中,标记域可以是纯化标签和/或表位标签。参见例如US 20140273233。
在一个实施方式中,AID被用作实例以说明系统如何工作。AID是胞苷脱氨酶,其可以催化胞苷在DNA或RNA背景下的脱氨反应。当被带到靶向地点时,AID将C碱基改变为U碱基。在分裂细胞中,这可能导致C到T点突变。或者,C到U的改变可以触发细胞DNA修复路径,主要是切除修复路径,其将去除错配的U-G碱基对,并用T-A、A-T、C-G或G-C对来替换。结果,将在靶C-G位点生成点突变。由于切除修复途径存在于大多数(如果不是全部)体细胞中,则向靶位点募集AID可以将C-G碱基对校正为其它。在这种情况下,如果C-G碱基对是体组织/细胞中引起潜在疾病的遗传突变,则上述方法可以用于校正突变并由此治疗疾病。
出于同样原因,如果引起遗传突变的潜在疾病是在特定位点的A-T碱基对,则可以使用相同的方法来将腺苷脱氨酶募集到特定部位,其中腺苷脱氨酶可以将A-T碱基对校正为其它。预期其它效应子酶在碱基配对中产生其它类型的改变。DNA/RNA修饰酶的实例的非穷举列表在表3中详述。
表3.可用于本发明的效应子蛋白质的实例
效应子蛋白全名
AID:活化诱导的胞苷脱氨酶,也称为AICDA
APOBEC1:载脂蛋白B mRNA编辑酶,催化多肽样1.
APOBEC3A:载脂蛋白B mRNA编辑酶,催化多肽样3A
APOBEC3B:载脂蛋白B mRNA编辑酶,催化多肽样3B
APOBEC3C:载脂蛋白B mRNA编辑酶,催化多肽样3C
APOBEC3D:载脂蛋白B mRNA编辑酶,催化多肽样3D
APOBEC3F:载脂蛋白B mRNA编辑酶,催化多肽样3F
APOBEC3G:载脂蛋白B mRNA编辑酶,催化多肽样3G
APOBEC3H:载脂蛋白B mRNA编辑酶,催化多肽样3H
CDA:胞苷脱氨酶
ADA:腺苷脱氨酶
ADAR1:作用在RNA1上的腺苷脱氨酶
ADAR2:作用在RNA2上的腺苷脱氨酶
ADAR3:作用在RNA3上的腺苷脱氨酶
tadA:tRNA-特异性腺苷脱氨酶
Dnmt1:DNA(胞嘧啶-5-)-甲基转移酶1
Dnmt3a:DNA(胞嘧啶-5-)-甲基转移酶3α
Dnmt3b:DNA(胞嘧啶-5-)-甲基转移酶3β
Tet1:10-11易位1
Tet2:10-11易位2
Tdg:胸腺嘧啶DNA糖基化酶
上述三个特定组分构成了技术平台。每个组分可以分别选自表1-3中的列表以实现特定的治疗/效用目标。
可以使用下述来构建RNA支架介导的募集系统系统:(i)作为序列靶向蛋白的来自酿脓链球菌的dCas9/nCas9,(ii)含有crRNA的RNA支架,所述crRNA包含向导RNA序列、tracrRNA和RNA基序例如MS2操纵基因基序,和(iii)含有人类AID的的效应子模块,所述人类AID融合至结合MCP蛋白的MS2操纵基因。组分的序列列于以下:
酿脓链球菌dCas9蛋白序列(SEQ ID NO:25)
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
(带下划线残基:D10A(D→A),H840A(H→A)活性位点突变)
Cas9 D10A蛋白(带下划线残基:D10A,)(SEQ ID NO:26)
编码Cas9D10A蛋白的DNA(29A>C)(SEQ ID NO:27)
/>
/>
/>
RNA支架表达盒(酿脓链球菌),含有20个核苷酸的可编程序列、CRISPR RNA基序(tracrRNA)和MS2操纵基因基序:
SEQ ID NO:28
(N20::可编程序列;带下划线:CRISPR RNA基序(tracrRNA);粗体:MS2基序;斜体:终止子;粗体且斜体:GC接头;粗体且带下划线:MS2的延伸)
上述RNA支架包含一个MS2环(1xMS2)。下面示出了包含两个MS2环(2xMS2)的RNA支架,其中,MS2支架是带下划线的:
SEQ ID NO:29
效应子AID–MCP融合:
SEQ ID NO:30
符号说明:
与上述Cas蛋白一样,非核酸酶效应子也可以作为重组多肽获得。用于制备重组多肽的技术是本领域已知的。
如本文所述,通过将AID中的Ser38突变成Ala,可以减少AID向脱靶位点的募集。下面列出的是野生型AID以及AID_S38A(磷酸化无效,pnAID)的DNA和蛋白质序列:
wtAID cDNA(Ser38密码子为粗体且带下划线):
SEQ ID NO:31
wtAID蛋白(Ser38为粗体且带下划线):
SEQ ID NO:32
EGLHENSVRLSRQLRRILLPLYEVDDLRDAFRTLGL
AID_S38A cDNA(S38A突变为粗体且带下划线)
SEQ ID NO:33
AID_S38A蛋白(S38A突变为粗体且带下划线)
SEQ ID NO:34
示例性序列
下面示出了在该研究中开发的多个示例性序列。
ARNA支架介导的募集系统nu构建体的蛋白质序列(SEQ ID NO:35):
/>
符号说明:
/>
ARNA支架介导的募集系统nu.2构建体的蛋白质序列(SEQ ID NO:36):
/>
符号说明:
RNA支架介导的募集系统的蛋白质序列(SEQ ID NO:37):
/>
符号说明:
2xUGI碱基编辑器序列由SEQ ID NO:186表示。
下面示出了本研究中使用的gRNA构建体的多个示例性RNA序列。每个从5’末端到3’末端包含可定制化靶、gRNA支架和一个或两个拷贝的MS2适体。
1.gRNA_MS2构建体的序列(SEQ ID NO:38):
符号说明:
2.gRNA_2xMS2构建体的序列(SEQ ID NO:39):
符号说明:
本文公开的平台/系统的上述三个组分可以使用一个、两个或三个表达载体来表达。系统可以被编程为实质上靶向任何DNA或RNA序列。类似的RNA支架募集系统可以通过改变系统的模块化组分来生成,包括任何合适的Cas直系同源物、脱氨酶直系同源物和其他DNA修饰酶。
细胞类型/治疗用途
本发明的RNA支架募集系统可以用于遗传修饰细胞,包括但不限于动物细胞、真菌细胞和植物细胞。在优选的实施方式中,本发明的RNA支架可用于遗传修饰人细胞。本发明可以应用于主细胞系、永生化细胞系、分离自人的原代细胞。人类细胞的实例包括但不限于已分化细胞或分化中细胞或干细胞。合适的人类细胞包括源自三个胚胎生殖细胞层(即,内胚层、中胚层和外胚层)中的任一个的那些细胞。例如,人类细胞是在以下器官中发现的细胞:骨骼肌、骨骼、皮肤真皮、结缔组织、泌尿生殖系统、心脏、血液(淋巴结)和脾脏(中胚层);胃、结肠、肝、胰腺、膀胱;尿道内衬、气管、肺、咽、甲状腺、副甲状腺、肠的上皮部分(内胚层);或中枢神经系统、视网膜和晶状体、颅和感觉、神经节和神经、色素细胞、头部结缔组织、表皮、毛发、乳腺(外胚层)。在优选的实施方式中,RNA支架用于遗传修饰原代免疫细胞或免疫细胞系。免疫细胞包括T细胞、NK细胞、B细胞、CD34+造血干细胞(HSV)和参与产生淋巴细胞和血液、骨髓、脾脏、淋巴结和胸腺的细胞的其他细胞。免疫细胞,特别是天然存在于宿主动物或患者体内或源自诱导多能干细胞[iPSC]的原代免疫细胞可被遗传修饰。免疫细胞包括T细胞、NK细胞、B细胞、多能细胞如造血干细胞(HSC),其是能分化成免疫细胞的多能细胞和参与产生淋巴细胞和血液、骨髓、脾脏、淋巴结和胸腺的细胞的其他细胞。
本文提供了用于在体外、体内或离体的细胞中进行基因组工程化的方法(例如,用于改变或操纵一种或多种基因或一种或多种基因产物的表达的方法)。具体地,本文提供的方法可用于哺乳动物细胞中的靶向碱基编辑中断。
在另一方面,本文提供了靶向疾病以进行碱基编辑校正的方法。靶序列可以是本领域中已经建立的任何疾病相关多核苷酸或基因。内源基因序列的突变或“校正“的有用应用的实例包括疾病相关基因突变的改变、编码剪接位点的序列的改变、调控序列的改变、引起功能获得突变的序列的改变、和/或引起功能损失突变的序列的改变、以及编码蛋白质的结构特性的序列的靶向改变。
在一些情况下,使用本文所述的方法对细胞进行遗传修饰将是有利的,使得细胞表达嵌合抗原受体(CAR)和/或T细胞受体(TCR)。“嵌合抗原受体(CAR)”有时称为“嵌合受体”、“T-体”或“嵌合免疫受体(CIR)”。如本文所用,术语“嵌合抗原受体(CAR)”是指人工构建的杂交蛋白或多肽,其包括与跨膜结构域和至少一个细胞内结构域可操作连接的抗体细胞外抗原结合结构域(例如单链可变片段(scFv))。通常,CAR的抗原结合结构域对在感兴趣的靶细胞的表面上表达的特定抗原具有特异性。例如,T细胞可以被设计成表达对B细胞淋巴瘤上的CD19具有特异性的CAR。对于不受供体匹配限制的同种异体抗肿瘤细胞治疗剂,细胞可被工程化为分离编码CAR的核酸,但也敲除负责供体匹配的基因(TCR和HLA标记物)。
如本文所用,术语“经基因修饰的”和“经基因工程化的”可互换地使用并且指包括外源多核苷酸的原核或真核细胞,而不管用于插入的方法如何。在一些情况下,所述效应子细胞已被修饰以包含非天然存在的核酸分子,所述非天然存在的核酸分子已由人工产生或修饰(例如,使用重组DNA技术)或源自此类分子(例如,通过转录、翻译等)。包含外源、重组、合成和/或以其他方式修饰的多核苷酸的效应子细胞被认为是工程化细胞。
细胞疗法和离体疗法
本发明的各种实施方式还提供根据本发明的任何其它实施方式生产或使用的用于治疗的细胞。在一个实施方式中,本发明涉及用于产生治疗细胞的方法,例如经工程化以表达嵌合抗原受体(CAR-T)或T细胞受体(TCR-T)的T细胞。CAR-T/TCR-T细胞可源自原代T细胞或与由干细胞分化。合适的干细胞包括但不限于哺乳动物干细胞,如人干细胞,包括但不限于造血、神经、胚胎、诱导多能干细胞(iPSC)、间充质、中胚层、肝、胰腺、肌肉和视网膜干细胞。其它干细胞包括但不限于哺乳动物干细胞,例如小鼠干细胞,例如小鼠胚胎干细胞。
在各种实施方式中,本发明可用于敲除、碱基改变、修饰单个基因或多个基因在各种类型的细胞或细胞系中的表达,包括但不限于来自真核生物的细胞例如人类细胞。本发明可以用于多重修饰,即一个或多个碱基编辑,其可以同时或顺序引入。该技术可用于许多应用,包括但不限于通过使非宿主细胞无免疫原性至宿主而从基因中敲除以预防移植物抗宿主病,或通过使非宿主细胞耐受宿主攻击来预防宿主抗移植病。这些方法也与生成同种异体(现成的)或自体(患者特异性)的基于细胞的疗法相关。此类基因包括但不限于T细胞受体(TRAC)、主要组织相容性复合物(MHCI类和II类)基因,包括B2M、共受体(HLA-F、HLA-G)、在先天免疫应答中涉及的基因(MICA、MICB、HCP5、STING、DDX41和Toll样受体(TLR))、炎症(NKBBiL、LTA、TNF、LTB、LST1、NCR3、AIF1)、热休克蛋白(HSPA1L、HSPA1A、HSPA1B)、补体级联、调节受体(NOTCH家族成员)、抗原处理(TAP、HLA-DM、HLA-DO)、增加的效力或持久性(诸如PD-1、CTLA-4和B7家族检查点蛋白的其他成员)、免疫抑制免疫细胞中涉及的基因(诸如FOXP3和白介素(IL)-10)、T细胞与肿瘤微环境的相互作用中涉及的基因(包括但不限于细胞因子的受体,诸如TGFB、IL-4、IL-7、IL-2、IL-15、IL-12、IL-18、IFNγ)、有助于细胞因子释放综合征的基因(包括但不限于IL-6、IFNγ、IL-8(CXCL8)、IL-10、GM-CSF、MIP-1α/β、MCP-1(CCL2)、CXCL9和CXCL10(IP-10)、编码由CAR/TCR靶向的抗原的基因(例如,CAR被设计为对照CS1的内源性CS1)或发现对CAR-T/TCR-T(诸如TET2)有益的其他基因或其他基于细胞的治疗剂,包括但不限于CAR-NK。CAR-B等。参见,例如,DeRenzo等,GeneticModification Strategies to Enhance CAR T Cell Persistence for Patients WithSolid Tumors.Front.Immunol.,2019年2月15日。
该技术还可以用于敲低或修饰在免疫细胞(例如T细胞和NK细胞)互相杀伤中涉及的基因或警告患者或动物(外来细胞、颗粒或分子已经进入患者或动物)的免疫系统的基因,或编码蛋白质的基因,所述蛋白质是用于分别损害或增强免疫应答的当前治疗靶标(例如,CD52和PD1)。
一种应用是将骨髓细胞的HLA等位基因工程化以增加单倍型匹配。工程化细胞可以用于治疗白血病的骨髓移植。另一应用是将造血干细胞中胎儿血红蛋白基因的负调控元件工程化,以用于治疗镰状细胞贫血和β-地中海贫血。负调节元件将是突变的,并且在造血干细胞中重新激活胎儿血红蛋白基因的表达,从而补偿由于成人α或β血红蛋白基因中的突变引起的功能损失。另外的应用是将iPS细胞工程化以产生用于包括帕金森病(神经元细胞损失)、1型糖尿病(胰腺β细胞损失)在内的各种退行性疾病的同种异体治疗细胞。其它示例性应用包括通过使CCR5基因和编码HIV进入细胞所需的受体的其它基因失活来工程化具有HIV感染抗性的T-细胞。
遗传修饰的类型
因此,本文提供了靶向干扰靶基因的转录或翻译的方法。具体地,所述方法包括通过干扰起始密码子、引入过早终止密码子和/或靶向干扰内含子/外显子位点的靶基因的转录或翻译的靶向破坏。
使用本文所述的方法,可以提高和/或敲除原代细胞中的一种或多种感兴趣的基因,其具有改善的效率和降低的脱靶插入或缺失形成的速率。在优选的实施方式中,所述方法用于包括基因敲入、基因敲除和错义突变的多重碱基编辑。
如以下段落和实施例所述,发明人的用于基因组工程化的流式方法采用碱基编辑器(例如,第三代和第四代碱基编辑器、腺嘌呤碱基编辑器),以用于通过敲除和错义突变的靶向基因干扰,以及在DNA供体模板的存在下的靶向基因敲入。本文所述的方法非常适用于研究造血细胞生物学和基因功能、建模疾病(例如主要免疫缺陷)以及校正引起疾病的点突变,以及生成用于治疗应用的新型细胞产物(例如T细胞产物)。
将组分递送到细胞中
在下面的实施例中提供了用于将碱基编辑组分递送到细胞的合适的方法。
在本文提供的实施方式中,RNA支架是化学合成的RNA并且通过任何合适的技术(例如电穿孔)引入细胞中。碱基编辑酶组分和2类Cas酶组分可以作为mRNA或蛋白质引入细胞中。
在实施方式中,包括碱基编辑器和向导分子的组分可以在体外、离体或体内递送至细胞。在一些情况下,病毒或质粒载体系统用于递送本文所述的碱基编辑组分。优选地,载体是病毒载体,如慢病毒或杆状病毒或优选腺病毒/腺相关病毒(AAV)载体,但其他递送方式是已知的(例如酵母系统、微囊泡、基因枪/将载体附着于金纳米颗粒的手段)并且是可预期的。在某些实施方式中,编码gRNA和碱基编辑器融合蛋白的核酸被包装用于在一个或多个病毒递送载体中递送至细胞。合适的病毒递送载体包括但不限于,腺病毒/腺相关病毒(AAV)载体、慢病毒载体。在一些情况下,本领域已知的非病毒转移方法可用于在哺乳动物细胞中引入核酸或蛋白质。核酸和蛋白质可以与药学上可接受的载体一起递送,或例如封装在脂质体中。其它递送方式是已知的(例如酵母系统、微囊泡、基因枪/将载体附着于金纳米颗粒的手段)并且是可预期的。在一些情况下,将细胞电穿孔以用于摄取gRNA和碱基编辑器(例如,BE3、BE4、ABE)。在一些情况下,在通过电穿孔引入gRNA、碱基编辑器和载体后,通过将病毒上清液添加到培养基中,将DNA供体模板作为腺相关病毒类型6(AAV6)载体递送。
插入或缺失(indel)形成的速率可以通过适当的方法来确定。例如,Sanger测序或下一代测序(NGS)可以用于检测indel形成的速率。优选地,所述接触导致在碱基编辑时小于20%的脱靶indel形成。该接触导致在碱基编辑时预期产物与非预期产物为至少2:1。
表达系统
为了使用上述平台,可能需要从编码它们的核酸表达一种或多种蛋白质和RNA组分。这可以以各种方式来执行。例如,编码RNA支架或蛋白质的核酸可以克隆到一个或多个中间载体中,以用于引入原核或真核细胞以进行复制和/或转录。中间载体通常是原核载体,例如质粒或穿梭载体,或昆虫载体,以用于存储或操纵编码RNA支架或蛋白质的核酸,用于生产RNA支架或蛋白质。核酸还可以克隆到一个或多个表达载体中,以施用至植物细胞、动物细胞、优选哺乳动物细胞或人细胞、真菌细胞、细菌细胞或原生动物细胞。因此,本发明提供编码上述任何RNA支架或蛋白质的核酸。优选地,分离和/或纯化核酸。
本发明还提供了具有编码上述一种或多种RNA支架或蛋白的序列的重组构建体或载体。所述构建体的实例包括载体,例如质粒或病毒载体,本发明的核酸序列以正向或反向取向插入所述载体中。在优选的实施方式中,所述构建体还包括调控序列,包括可操作地连接到所述序列的启动子。大量合适的载体和启动子是本领域技术人员已知的,并且是可商购的。适当的克隆和表达载体用于与本领域已知的原核和真核宿主一起使用。
载体是指能够传输与其连接的另一核酸的核酸分子。载体能够自主复制或集成到宿主DNA中。载体的实例包括质粒、粘粒或病毒载体。本发明的载体包括适于在宿主细胞中表达核酸的形式的核酸。优选地,载体包括可操作地连接到待表达的核酸序列的一个或多个调控序列。“调控序列”包括启动子、增强子和其它表达控制元件(例如聚腺苷酸化信号)。调控序列包括引导核苷酸序列的组成性表达以及诱导型调控序列的那些。表达载体的设计可以取决于诸如要转化、转染或转导的宿主细胞的选择、所期望的RNA或蛋白质的表达水平等因素。
表达载体的实例包括染色体、非染色体和合成DNA序列、细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、源自质粒和噬菌体DNA的组合的载体、病毒DNA如牛痘、腺病毒、禽痘病毒和伪狂犬病毒。然而,可以使用任何其他载体,只要它是可复制的并且在宿主中是可行的。可通过多种程序将合适的核酸序列插入到载体中。通常,编码上述RNA或蛋白质之一的核酸序列可以通过本领域已知的程序插入适当的限制性内切核酸酶位点。这样的程序和相关的子克隆程序在本领域技术人员的范围内。
该载体可以包括用于扩增表达的适当序列。此外,表达载体优选含有一种或多种可选标记基因以提供用于选择转化的宿主细胞的表型性状,例如用于真核细胞培养的二氢叶酸还原酶或新霉素抗性,或例如在大肠杆菌中的四环素或氨苄青霉素抗性。大肠杆菌。
表达RNA的载体可包括用于驱动RNA表达的RNApol III启动子,例如HI、U6或7SK启动子。这些人类启动子允许在质粒转染后在哺乳动物细胞中表达RNA。或者,可以使用T7启动子,例如用于体外转录,并且RNA可以体外转录和纯化。
含有如上文所描述的适当核酸序列以及适当启动子或控制序列的载体可用于转化、转染或感染适当的宿主以允许宿主表达上文所述的RNA或蛋白质。合适的表达宿主的实例包括细菌细胞(例如大肠杆菌、链霉菌、鼠伤寒沙门氏菌(Salmonella typhimurium)、真菌细胞(酵母)、昆虫细胞(例如,果蝇和草地贪夜蛾(Spodoptera frugiperda,Sf9))、动物细胞(例如,CHO、COS和HEK293)、腺病毒和植物细胞。适当宿主的选择在本领域技术人员的范围内。在一些具体实施方式中,本发明提供通过用表达载体转化、转染或感染宿主细胞产生上述RNA或蛋白的方法,所述表达载体具有编码RNA或多肽或蛋白之一的核苷酸序列。然后在合适的条件下培养宿主细胞,这允许RNA或蛋白质的表达。
可以使用本领域已知的用于将外来核苷酸序列引入宿主细胞中的任何程序。实例包括使用磷酸钙转染、聚凝胺(polybrene)、原生质融合、电穿孔、核转染、脂质体、显微注射、裸DNA、质粒载体、病毒载体、游离和整合,以及用于将克隆的基因组DNA、cDNA、合成DNA或其它外来遗传物质引入宿主细胞的任何其它众所周知的方法。
培养细胞
所述方法还包括在适当的条件下维持所述细胞,使得向导RNA将效应子蛋白引导至所述靶序列中的靶向位点,并且效应子结构域修饰靶序列。
通常,可以在适合于细胞生长和/或维持的条件下维持细胞。合适的细胞培养条件是本领域技术人员熟知的,本领域技术人员理解用于培养细胞的方法在本领域中是已知的,并且可以根据细胞类型而变化。在所有情况下,可以使用常规优化来确定用于特定细胞类型的最佳技术。
可用于本文提供的方法的细胞可以是新鲜分离的原代细胞或从原代细胞培养物的冷冻等分试样获得。在一些情况下,细胞被电穿孔以用于摄取gRNA和碱基编辑融合蛋白。如以下实施例中所述,一些测定(例如,针对T细胞)的电穿孔条件可包括1400伏特、10毫秒的脉冲宽度、3个脉冲。电穿孔后,使电穿孔的T细胞在细胞培养基中恢复,然后在T细胞扩增培养基中培养。在一些情况下,允许电穿孔的细胞在细胞培养基中恢复约5分钟至约30分钟(例如,约5分钟、10分钟、15分钟、20分钟、25分钟、30分钟)。优选地,恢复的细胞培养基不含抗生素或其它选择剂。在一些情况下,T细胞扩增培养基是完全CTS OpTmizer T-细胞扩增培养基。
应用
本发明的RNA支架可用于以下应用:基因组编辑、基因组筛选、治疗细胞的产生、基因组标记、表观基因组编辑、核型工程化、染色质成像、转录组和代谢途径工程化、基因电路工程化、细胞信号传导传感、细胞事件记录、谱系信息重建、基因驱动、DNA基因分型、miRNA定量、体内克隆、位点向导诱变、基因组多样化和原位蛋白质组分析。
应用还包括对人类疾病的研究,例如癌症免疫疗法、抗病毒疗法、噬菌体疗法、癌症诊断、病原体筛选、微生物群系重塑、干细胞重编程、免疫基因组工程化、疫苗开发和抗体生产。
定义
核酸或多核苷酸是指DNA分子(例如但不限于cDNA或基因组DNA)或RNA分子(例如但不限于mRNA),并且包括DNA或RNA类似物。DNA或RNA类似物可由核苷酸类似物合成。DNA或RNA分子可以包括不是天然存在的部分,例如修饰的碱基、修饰的主链、RNA中的脱氧核糖核苷酸等。核酸分子可以是单链或双链。本领域技术人员将理解尿嘧啶是取代RNA格式的胸腺嘧啶的核苷酸。如本文所公开的DNA序列将具有胸腺嘧啶核苷酸,并且相应的RNA序列将在相同位置具有尿嘧啶核苷酸。
当提及核酸分子或多肽时,术语“分离的”是指核酸分子或多肽基本上不含与其相关联或在性质上一起发现的至少一种其它组分。
如本文所用,术语“向导RNA”通常是指可以结合CRISPR蛋白质并将CRISPR蛋白靶向至靶DNA内的特定位置的RNA分子(或总称一组RNA分子)。向导RNA可包含两个区段:DNA靶向向导区段和蛋白质结合区段。DNA靶向区段包含与靶序列互补(或至少可在严格条件下杂交)的核苷酸序列。蛋白质结合区段与CRISPR蛋白(例如Cas9或Cas9相关多肽)相互作用。这两个区段可以位于同一RNA分子中或两个以上单独的RNA分子中。当两个区段在单独的RNA分子中时,包含DNA靶向向导区段的分子有时称为CRISPR RNA(cr RNA),而包含蛋白质结合区段的分子称为反式激活RNA(tracrRNA)。
如本文所用,术语“靶核酸”或“靶”是指含有靶核酸序列的核酸。靶核酸可以是单链或双链的,并且通常是双链DNA。如本文所用,“靶核酸序列”、“靶序列”或“靶区域”是指希望使用CRISPR系统结合或修饰的特定序列或其互补序列。靶序列可以在细胞的基因组内的体外或体内的核酸内,其可以是单链或双链核酸的任何形式。
“靶核酸链”是指靶核酸的链,其进行与如本文所公开的向导RNA碱基配对。也就是说,与crRNA和向导序列杂交的靶核酸的链被称为“靶核酸链”。靶核酸的另一条链,与引导序列不互补,被称为“非互补链”。在双链靶核酸(例如DNA)的情况下,只要有合适的PAM位点,每条链都可以是“靶核酸链”,从而设计crRNA和向导RNA,并用于实施本发明的方法。
如本文中所使用,术语“源自”是指其中第一组分(例如,第一分子)或来自所述第一组分的信息用于分离、导出或制备不同的第二组分(例如,不同于所述第一分子的第二分子)的过程。例如,哺乳动物的密码子优化的Cas9多核苷酸源自野生型Cas9蛋白氨基酸序列。另外,变体哺乳动物密码子优化的Cas9多核苷酸,包括Cas9单突变切口酶(nCas9,例如nCas9D10A)和Cas9双突变体null-核酸酶(dCas9,例如dCas9D10AH840A)源自编码野生型哺乳动物密码子优化的Cas9蛋白的多核苷酸。
如本文所使用的,术语“野生型”是本领域技术人员所理解的本领域的术语,并且是指生物体、菌株、基因或特性天然存在时的典型形式,与突变体或变体形式区分开。
如本文所用,术语“变体”是指与第二组成(例如,第二分子,也称为“亲本”分子)相关的第一组成(例如,第一分子)。变体分子可以源自亲本分子、分离自亲本分子、基于亲本分子或与亲本分子同源。例如,哺乳动物的密码子优化的Cas9(hspCas9)的突变体形式,包括Cas9单个突变体的切口酶和Cas9双突变体的null-核酸酶,是哺乳动物密码子优化的野生型Cas9的变体(hspCas9)。术语变体可用于描述多核苷酸或多肽。
如应用于多核苷酸,变体分子可以具有与原始亲本分子的整个核苷酸序列同一性,或者,可以具有与亲本分子具有小于100%的核苷酸序列同一性。例如,基因核苷酸序列的变体可以是与原始核苷酸序列相比核苷酸序列至少50%、60%、70%、80%、90%、95%、98%、99%以上相同的第二核苷酸序列。多核苷酸变体还包括包含整个亲本多核苷酸的多核苷酸,并且还包含另外的融合核苷酸序列。多核苷酸变体还包括作为亲本多核苷酸的部分或子序列的多核苷酸,例如本发明也涵盖本文所公开的多核苷酸的独特子序列(例如,如通过标准序列比较和比对技术确定的)。
在另一个方面,多核苷酸变体包括核苷酸序列,所述核苷酸序列包含对亲本核苷酸序列的微小的、不重要的或无关紧要的改变。例如,微小的、不重要的或无关紧要的改变包括对核苷酸序列的改变,其(i)不改变相应多肽的氨基酸序列,(ii)发生在多核苷酸的蛋白质编码开放阅读框之外,(iii)导致的缺失或插入可能影响相应的氨基酸序列,但对多肽的生物活性几乎没有影响或没有影响,(iv)核苷酸改变导致氨基酸被化学相似的氨基酸取代。在多核苷酸不编码蛋白质(例如,tRNA或crRNA或tracrRNA)的情况下,该多核苷酸的变体可以包括不导致多核苷酸的功能损失的核苷酸变化。在另一方面,本发明涵盖所公开的产生功能上相同的核苷酸序列的核苷酸序列的保守变体。本领域技术人员将了解,本发明涵盖所公开的核苷酸序列的许多变体。
如应用于蛋白质,变体多肽可以具有与原始亲本多肽的整个氨基酸序列同一性,或者,可以具有与亲本蛋白质具有小于100%的氨基酸同一性。例如,氨基酸序列的变体可以是与原始氨基酸序列相比,氨基酸序列至少50%、60%、70%、80%、90%、95%、96%、97%、98%、99%以上相同的第二氨基酸序列。
多肽变体包括包含整个亲本多肽的多肽,并且还包含另外的融合氨基酸序列。多肽变体还包括作为亲本多肽的部分或子序列的多肽,例如本发明也涵盖本文所公开的多肽的独特子序列(例如,如通过标准序列比较和比对技术确定的)。
在另一个方面,多肽变体包括含有对亲本氨基酸序列的微小的、不重要的或无关紧要的改变的多肽。例如,微小的、不重要的或无关紧要的变化包括氨基酸变化,所述氨基酸变化对多肽的生物活性几乎没有影响或没有影响(包括取代、缺失和插入),并且产生功能上相同的多肽,包括添加非功能性肽序列。在其它方面,本发明的变体多肽改变亲本分子的生物活性,例如,修饰或损失核酸酶活性的Cas9多肽的突变体变异。本领域领域技术人员将了解,本发明涵盖所公开的多肽的许多变体。
在一些方面,本发明的多核苷酸或多肽变体可以包括改变、添加或删除小百分比的核苷酸或氨基酸位置(例如通常小于约10%、小于约5%、小于4%、小于2%或小于1%)的变体分子。
如本文所用,核苷酸或氨基酸序列中的术语“保守性取代”是指以下核苷酸序列的改变:(i)由于三重态密码子编码的冗余而不导致氨基酸序列中的任何相应改变,或(ii)导致用具有化学类似结构的氨基酸取代原始亲本氨基酸。提供功能上类似的氨基酸的保守取代表在本领域中是众所周知的,其中一个氨基酸残基被具有类似化学性质(例如,芳族侧链或带正电荷侧链)的另一氨基酸残基取代,并且因此基本上不改变所得多肽分子的功能性质。
以下是含有类似化学性质的天然氨基酸的分组,其中组内的取代是“保守性”氨基酸取代。下面指示的这种分组不是刚性的,因为当考虑不同的功能特性时,这些天然氨基酸可以被放置在不同的分组中。具有非极性和/或脂肪族侧链的氨基酸包括:甘氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸和脯氨酸。具有极性、不带电侧链的氨基酸包括:丝氨酸、苏氨酸、半胱氨酸、甲硫氨酸、天冬酰胺和谷氨酰胺。具有芳香族侧链的氨基酸包括:苯丙氨酸、酪氨酸和色氨酸。具有带正电荷侧链的氨基酸包括:赖氨酸、精氨酸和组氨酸。具有带负电荷的侧链的氨基酸包括天冬氨酸盐和谷氨酸盐。
“Cas9突变体”或“Cas9变体”是指野生型Cas9蛋白如酿脓链球菌Cas9蛋白的蛋白或多肽衍生物,例如具有一个或多个点突变、插入、缺失、截短、融合蛋白或其组合的蛋白。其基本上保留Cas9蛋白的RNA靶向活性。蛋白质或多肽可包含酿脓链球菌Cas9蛋白的片段,由其组成,或基本上由其组成。通常,突变体/变体是与酿脓链球菌Cas9蛋白具有至少50%(例如,50%与100%之间的任何数字,包括0和100%)同一性。突变体/变体可以与RNA分子结合并且经由RNA分子靶向特定的DNA序列,并且可以另外具有核酸酶活性。这些结构域的实例包括RuvC样基序(酿脓链球菌Cas9蛋白的7-22、759-766和982-989位氨基酸)和HNH基序(837-863位氨基酸)。参见,Gasiunas等人,Proc Natl Acad Sci U S A.2012年9月25日;109(39):E2579–E2586和WO2013176772。
“互补性”是指核酸通过传统的Watson-Crick碱基配对或其他非传统类型与另一核酸序列形成氢键的能力。百分比互补性指示核酸分子中残基的百分比,其可与第二核酸序列(例如,10分之5、6、7、8、9、10为50%、60%、70%、80%、90%和100%互补)形成氢键(例如,Watson-Crick碱基配对)。“完美互补”是指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基形成氢键。如本文所用,“基本上互补的”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个以上核苷酸的区域上至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%的互补性程度,或是指在严格条件下杂交的两种核酸。
如本文所用,杂交的“严格条件”是指与靶序列具有互补性的核酸主要与靶序列杂交且基本上不与非靶序列杂交的条件。严格条件一般是序列依赖性的,并且根据许多因素而变化。通常,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例在Tijssen(1993),Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes,第I部分第二章"Overview ofprinciples of hybridization and the strategy of nucleic acid probe assay",Elsevier,N.Y中详述。
“杂交”是指其中完全或部分互补的核酸链在指定的杂交条件下一起形成双链结构或区域的过程,在双链结构或区域中,两个组成链通过氢键连接。尽管氢键通常在腺嘌呤和胸腺嘧啶或尿嘧啶(A和T或U)或胞苷和鸟嘌呤(C和G)之间形成,但是可以形成其它碱基对(例如,Adams等人,The Biochemistry of the Nucleic Acids,11th ed.,1992)。
如本文所用,“表达”是指从DNA模板转录多核苷酸的过程(例如转录成mRNA或其它RNA转录物)和/或转录的mRNA随后转化为肽、多肽或蛋白质的过程。转录和编码的多肽可以统称为“基因产物”。如果多核苷酸源自基因组DNA,则表达可以包括将mRNA剪接在真核细胞中。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用以指代任何长度的氨基酸的聚合物。聚合物可以是直链或支链的,其可以包含修饰的氨基酸,并且其可以被非氨基酸中断。所述术语还涵盖已修饰的氨基酸聚合物;例如二硫键形成、糖基化、脂化、乙酰化、磷酸化、聚乙二醇化或任何其它操作,例如与标记组分的缀合。如本文所用,术语“氨基酸”包括天然和/或非天然或合成氨基酸,包括甘氨酸和D或L光学异构体,以及氨基酸类似物和肽模拟物。
术语“融合多肽”或“融合蛋白”是指通过将两个以上多肽序列连接在一起而产生的蛋白质。本发明涵盖的融合多肽包含嵌合基因构建体的翻译产物,所述嵌合基因构建体将编码第一多肽(例如RNA结合结构域)的核酸序列与编码第二多肽(例如效应子结构域)的核酸序列连接以形成单个开放阅读框。换句话说,“融合多肽”或“融合蛋白”是通过肽键或经由若干肽连接的两个以上蛋白的重组蛋白。融合蛋白还可以包含两个结构域之间的肽接头。
术语“接头”是指用于连接两个以上实体的任何手段、实体或部分。接头可以是共价接头或非共价接头。共价键的实例包括共价连接到待连接的一个或多个蛋白质或结构域的共价键或接头部分。接头也可以是非共价键,例如通过诸如铂原子的金属中心的有机金属键。对于共价键,可以使用各种官能团,例如酰胺基团,包括碳酸衍生物、醚、酯(包括有机和无机酯)、氨基、氨基甲酸酯、脲等。为了提供连接,可以通过氧化、羟化、取代、还原等来修饰结构域,以提供用于耦合的位点。用于缀合的方法是本领域技术人员公知的,并且被涵盖用于在本发明中。接头部分包括但不限于化学接头部分,或例如肽接头部分(接头序列)。应当理解,不显著降低RNA结合结构域和效应子结构域的功能的修饰是优选的。
如本文所使用的,如本文所使用的术语“缀合物”或“共轭”或“连接”是指两个以上实体的连接以形成一个实体。缀合物涵盖肽-小分子缀合物以及肽-蛋白质/肽缀合物。
术语“受试者”和“患者”在本文中可互换使用以指代脊椎动物,优选哺乳动物,更优选人。哺乳动物包括但不限于:鼠类、猿、人、农场动物、体育动物和宠物。还涵盖在体内获得或在体外培养的生物实体的组织、细胞和它们的后代。在一些实施方式中,受试者可以是无脊椎动物,例如昆虫或线虫;而在其他实施方式中,受试者可以是植物或真菌。
如本文所用,“治疗”或“缓解”或“改善”可互换使用。这些术语是指用于获得有益或所需结果的方法,包括但不限于治疗有益效果和/或预防有益效果。治疗有益效果是指治疗中的一种或多种疾病、病症或症状的任何治疗相关的改善或影响。对于预防益处,可以以发展特定疾病、病症或症状的风险向受试者施用组合物,或向报告疾病的一个或多个生理症状的受试者施用组合物,即使疾病、病症或症状尚未表现出来。
如本文所用,术语“接触”在用于任何组分组时包括任何过程,由此待接触的组分混合到相同的混合物中(例如,被添加到相同的隔室或溶液中),并且不一定需要所述组分之间的实际物理接触。所述组分可以以任何顺序或任何组合(或子组合)接触,并且可以包括其中随后任选地在添加其它所述组分之前从混合物中去除所述组分中的一种或一些的情况。例如,“使A与B和C接触”包括以下情形中的任一个和全部:(i)A与C混合,然后将B添加到混合物中;(ii)A和B混合成混合物;从混合物中除去B,然后将C添加到混合物中;和(iii)A添加到B和C的混合物中。将靶核酸或细胞与一种或多种反应组分(例如Cas蛋白或向导RNA)“接触”包括以下情况中的任一种或全部:(i)使靶或细胞与反应混合物的第一组分接触以产生混合物;然后反应混合物的其他组分以任何顺序或组合添加至混合物;和(ii)在与靶或细胞进行混合之前完全形成反应混合物。
如本文所用,术语“混合物”是指散布的并且不以任何特定顺序的要素的组合。混合物是多相的,并且不在空间上可分离成其不同的成分。要素的混合物的实例包括溶解在相同水溶液中的许多不同元素,或以随机或无特定次序连接到固体载体的许多不同要素,其中不同要素在空间上不是不同的。换句话说,混合物是不可寻址的。
如本文所公开的,提供了多个值范围。应当理解,除非上下文另有明确说明,否则在该范围的上限和下限之间的每个中间值,到下限单位的十分之一也被具体公开。在所述范围内的任何所述值或中间值与所述范围内的任何其他所述值或中间值之间的每个较小范围包含在本发明内。这些较小范围的上限和下限可以独立地包括在范围中或排除在范围中,并且其中包括在较小范围中的任何一个或两者都包括在较小范围内或两者都不包括在较小范围内的每个范围也包含在本发明内,受制于在所述范围中的任何具体排除的限制。在所述范围包括一个或两个极限的情况下,排除那些包括的极限中的任一个或两个的范围也包括在本发明中。术语“约”通常指的是所指示的数量的±10%。例如,“约10%”可以表示9%至11%的范围,并且“约20”可以表示18至22。“约”的其它含义可从上下文显而易见,例如四舍五入,因此,例如“约1”也可意指从0.5到1.4。
现在在以下实施例中描述根据本发明的组合物和方法的各种示例性实施方式。
实施例
实施例1-对RNA支架的修饰
sgRNA序列设计
使用的sgRNA设计及其序列的完整列表显示在表4中。所有sgRNA设计都基于酿脓链球菌sgRNA,其由靶特异性20nt间隔物序列、76nt b恒定区sgRNA序列和7nt聚-T U6终止信号组成。所有修饰都是对sgRNA的恒定组分进行,并由包含RNA适体发夹和/或茎的重复:反重复的延伸组成。将单个拷贝(1xMS2)或2个拷贝的(2xMS2)MS2发夹序列(C5变体)引入sgRNA的四环、茎环2或3’中。对于2xMS2tracrRNA,追求两种设计,其中一个将2个拷贝的C5MS2变体整合到sgRNA的3'中,并且第二设计由定位在茎环2处的C5变体和同化到sgRNA的3'中的工程化MCP蛋白质结合f6适体组成。f6适体是用于2x MS2质粒设计的不同变体。重复:反重复的上部茎的各种延伸引入茎的任一侧,并且在每种情况下,延伸引入天然酿脓链球菌序列。
表4.不同sgRNA的设计和序列。N表示20nt的靶特异性间隔物序列。如先前描述的恒定sgRNA序列以粗体突出显示,延伸的重复:反重复序列带下划线。以斜体字显示MS2(C5变体)或f6适体序列,同时以斜体字和带下划线显示适体和接头序列的延伸。US=重复:反重复的上部茎;TL=四环;SL2=茎环2。
质粒设计
除了sgRNA之外,碱基编辑系统的所有组分都在一个载体上编码,并且表示为来自CMV启动子的单个多顺反子单元。载体编码通过其C末端与UGI融合的APOBEC-1-MCP融合蛋白和nCas9(D10A)的表达–nCas9-UGI融合蛋白在nCas9的C末端和UGI的N末端处侧接有2个拷贝的SV40 NLS。另外,载体编码turboRFP的表达以允许监测转染效率。
在单独的载体上表达碱基编辑系统的sgRNA组分,其中表达由RNA聚合酶III U6启动子驱动。sgRNA表达为涵盖通过前述人工四环连接的酿脓链球菌Cas9的crRNA和tracrRNA组分的单个单元。在表5中示出sgRNA靶sgRNA序列的列表,如果靶不具有5’G,则为了从U6启动子表达需要加入G。
BE4max碱基编辑器的表达的设计如前所述。
表5.用于碱基编辑的gRNA靶位点序列。位于编辑窗口内的Cs以粗体示出。
靶名称 靶序列
位点2 GAAC1AC2AAAGCATAGACTGC(SEQ ID NO:53)
位点3 GGC1C2C3AGACTGAGCACGTGA(SEQ ID NO:54)
CTNNB1 CTGGAC2TC3TGGAATCCATTC(SEQ ID NO:55)
EGFR ATC1AC2GCAGCTCATGCCCTT(SEQ ID NO:56)
PCSK9 CAGGTTC2C3ACGGGATGCTCT(SEQ ID NO:57)
FANCF GGAATC1C2C3TTCTGCAGCACC(SEQ ID NO:58)
TRAC TTC1GTATC2TGTAAAACCAAG(SEQ ID NO:59)
B2M CTTAC2C3C4C5ACTTAACTATCT(SEQ ID NO:60)
CR0118_PDCD1 CAGTTCCAAACCCTGGTGGT(SEQ ID NO:61)
CR0107_PDCD1 GGGGGTTCCAGGGCCTGTCT(SEQ ID NO:62)
CR0057-TRAC_EX3 TTCGTATCTGTAAAACCAAG(SEQ ID NO:63)
CR0151_CD2 GTTCAGCCAAAACCTCCCCA(SEQ ID NO:64)
CR0121_PDCD1 GGAGTCTGAGAGATGGAGAG(SEQ ID NO:65)
CR0165_CIITA CAGCTCACAGTGTGCCACCA(SEQ ID NO:66)
TRAC_22550571 TTCAAAACCTGTCAGTGATT(SEQ ID NO:67)
PDCD1_241852953 GGGGGTTCCAGGGCCTGTCT(SEQ ID NO:68)
CTNNB1 CTGGACTCTGGAATCCATTC(SEQ ID NO:69)
细胞培养和转染
HEK293细胞在补充有10%FBS的DMEM(杜尔贝科改良伊格尔培养基)中培养。转染前24小时将50,000个细胞接种到24孔板的单个孔中,以实现70%汇合从而用于转染。24小时后,使用Lipofectamine 3000试剂(ThermoFisher scientific)用200ng质粒DNA(150ngpin-point/BE4max载体和50ng sgRNA表达载体)对细胞进行脂质转染。
细胞裂解和流式细胞术
转染后72小时后,除去培养基,用PBS洗涤细胞1x并用100μl的TrypLE表达酶(ThermoFisher scientific)从孔脱离。然后将离解的细胞在室温下在300x rpm下离心5分钟,倾析出上清液。将沉淀细胞在PBS中洗涤1x,并再次在300x rpm下离心5分钟,并丢弃上清液,此后将沉淀细胞再悬浮在100ul的PBS中。将20μl的再悬浮细胞转移到96孔板中,并在以下条件下与36μl的DirectPCR裂解试剂(Viagen biotech)一起温育:55℃进行0分钟,然后95℃进行30分钟,细胞裂解物储存在-20℃。剩余80μl的再悬浮细胞转移至96孔板并通过在室温下在300x rpm离心5分钟。倾析上清液,并且将细胞再悬浮在补充有0.5%BSA的50μlMACS缓冲液(Miltenyi Biotec)中,准备流式细胞术分析。使用iQue3(Sartorius)进行所有流式细胞术。
靶向区域的PCR扩增
每个PCR反应使用1μl的使用DirectPCR裂解试剂获得的细胞裂解物。将Q5高保真度2x master mix(NEB)用于sgRNA靶位点的扩增,将反应混合物如下设定:
PCR反应在以下热循环条件下进行:
使用的引物及其退火温度在下表6中详述:
未经纯化的PCR扩增子通过Genewiz进行Sanger测序。
实施例2-修饰的RNA支架的碱基编辑效率
RNA合成
通过使用2’-乙酰氧基乙基原酸酯(2’-ACE)或2’-叔丁基二甲基甲硅烷基(2’-TBDMS)保护化学的Horizon Discovery合成所有crRNA和tracrRNA。在所注释的地方包括化学修饰,包括在crRNA的5′端和tracrRNA的3′端处的两个2’-O-甲基核苷酸和两个硫代磷酸酯键(2xMS修饰)。RNA寡核苷酸是2’-脱保护/脱盐的,并通过高效液相色谱(HPLC)或聚丙烯酰胺凝胶电泳(PAGE)纯化。电穿孔前,将寡核苷酸再悬浮在10mM Tris pH7.5缓冲液中。
电穿孔
使用InvitrogenTM NeonTM转染系统10μL试剂盒对HEK 293T细胞(ATCC,#CRL-11268)进行电穿孔。将50,000个细胞、1μg的mRNA和6μM的合成crRNA:tracrRNA的混合物在1150V电穿孔20ms和2个脉冲。将mRNA(通过标准方法从TriLink或体外转录内部(in house)获得)以3:1摩尔比的nCas9-UGI与MCP-AID或MCP-APOBEC混合。将细胞平板接种在具有全血清生长培养基的96孔板中,并在72小时后收获,以用于进一步加工。
细胞处理
将细胞在56℃下在包含蛋白酶K(Thermo Scientific,#FEREO0492)、RNase A(Thermo Scientific,#FEREN0531)和Phusion HF缓冲液(Thermo Scientific,#F-518L)的100μL缓冲液中裂解30分钟,然后在95℃下5分钟热失活。该细胞裂解物用于生成横跨包含碱基编辑位点的区域的200-400个核苷酸PCR扩增子。未经纯化的PCR扩增子通过Genewiz进行Sanger测序。
编辑分析
使用Chimera分析工具(开放源工具BEAT的改编)从AB1文件计算碱基编辑效率。Chimera通过首先减去背景噪声以定义样品中的预期可变性来确定编辑效率。这允许估计编辑效率,而不需要相对于对照样品归一化。在此之后,Chimera使用Median AbsoluteDeviation(MAD)方法从噪声滤除任何异常值,然后评估碱基编辑器在20bp输入向导序列的跨度上的编辑效率。
实施例3:利用慢病毒整合的sgRNA应用于人类原代免疫细胞的碱基编辑系统
在此实施例中,使用原代人类Pan T淋巴细胞来证明在具有RNA适体的组成性表达sgRNA存在下,在PolIII启动子的控制下,原代免疫细胞中的碱基编辑mRNA组分的效用。PanT细胞使用抗CD3和抗CD28活化,然后使用富集和浓缩的慢病毒颗粒转导。使用嘌呤霉素选择来选择成功转导的细胞,以确保>95%的群体具有至少一个拷贝的慢病毒插入物。在选择T细胞被抗CD3和抗CD28再激活的过程中,细胞用mRNA组分电穿孔,用于脱氨酶-MCP和nCas9-UGI-UGI组分。然后将细胞温育另外72-96小时,并且通过流式细胞术检查细胞的表面KO,并且通过靶向PCR扩增和Sanger测序来检查碱基编辑。
实施例4:利用合成crRNA和tracrRNA-适体引导物应用于人类原代免疫细胞的碱 基编辑系统
在该实施例中,使用原代人类Pan T淋巴细胞来证明具有crRNA和适体修饰的tracrRNA组分的碱基编辑系统在原代免疫细胞中效用。使用抗CD3和抗CD28活化Pan T细胞,然后用mRNA组分电穿孔细胞以用于脱氨酶-MCP、nCas9-UGI-UGI组分、tracrRNA-适体和crRNA。然后将细胞温育另外72-96小时,并且通过流式细胞术检查细胞的表面KO,并且通过靶向PCR扩增和Sanger测序来检查碱基编辑。
数据显示了碱基编辑系统可以编辑原代免疫细胞,而不需要将DNA整合到基因组中(通过慢病毒盒),利用不同的crRNA和tracrRNA-适体与mRNA组分。结果显示了具有用于单个RNA基序的偏好的Apobec1的不同RNA适体和脱氨酶特异性,而AID脱氨酶在该上下文中偏好双RNA基序。结果显示碱基编辑系统对于通过表面染色和流式细胞术以及通过DNA水平的改变而改变用于功能蛋白质敲除的特定碱基而言高效用。
材料和方法
指引
使用内部生成的数据来指定在距PAM基序(NGG)的设定距离处计算的碱基编辑窗口。该数据用于开发算法以预测用于以下基因的表型或基因KO适用向导序列:TRAC、TRBC1、TRBC2、PDCD-1、B2M和CD52(表7)。crRNA和tracrRNA由Horizon Discovery(之前的Dharmacon)和Agilent合成。
合成crRNA序列(SEQ ID NO:86):
mN*mN*NNNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUUUUG
2’OMe(m)和硫代磷酸酯(*)修饰的残基
合成的1xMS2 tracrRNA-适体序列(SEQ ID NO:87):
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAA AGUGGCACCGAGUCGGUGCGCGCACAUGAGGAUCACCCAUGUGCUUUUmU*mU*U
2’OMe(m)和硫代磷酸酯(*)修饰的合成2xMS2 tracrRNA-适体序列(SEQ ID NO:88):
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGGGAGCACAUGAGGAUCACCCAUGUGCCACGAGCGACAUGAGGAUCACCCAUGUCGCUCGUGUUCCCUUUUmU*mU*U
2’OMe(m)和硫代磷酸酯(*)修饰的残基
慢病毒sgRNA序列(SEQ ID NO:89):
NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCgggagcACAUGAGGAUCACCCAUGUgccacgagcgACAUGAGGAUCACCCAUGUcgcUcgUgUUcccUUUU
mRNA组分生成
信使RNA分子是由利用经修饰核苷酸的Trilink定制的:假尿苷和5-甲基-胞嘧啶。mRNA组分转化为以下蛋白质:脱氨酶AID=NLS-hAID-接头-MCP,脱氨酶Apobec1=NLS-rApobec1-接头-MCP,和Cas9-UGI-UGI=NLS-nCas9-UGI-UGI-NLS质粒构建
慢病毒构建体包括另外的选择性标记物(例如,抗生素、荧光蛋白),以确保在靶细胞群体的基因组内存在单个整合拷贝。将用于特定向导序列的序列(通过T4 DNA连接酶技术)克隆到由IIS型限制酶位点产生的悬垂物(overhangs)中。靶构建体确保了向导序列完全在帧中,以从人类U6 PolIII启动子有效转录(如果不是在序列的5’,则包括G核苷酸),并且延伸到在终止序列之前的Cas9支架和适体序列中。在扩增大规模质粒制备(例如,大规模制备)之前,通过Sanger测序和限制消化QC检查质粒克隆。
慢病毒颗粒生成
使用第三代质粒系统(Horizon Discovery),在功能性慢病毒颗粒中制备sgRNA-适体慢病毒构建体。然后通过渗滤浓缩病毒颗粒并将其等分以用于转导。
慢病毒转导
将T细胞活化>48小时,通过Retronectin(T100B,Takara-bio)处理的板以0.1的MOI转导并在37℃和5%CO2下温育过夜。
冷冻T细胞培养
将冷冻的CD3+T细胞(Hemacare)的来源解冻,然后在37℃和5%CO2下将其培养在具有1x青霉素/链霉素(Thermofisher)Immunocult XT培养基(STEMCELLTechnologies)中。
T细胞电穿孔
在激活48-72小时后,使用Neon电穿孔仪(Thermofisher)或4D成核剂(Lonza)对T细胞进行电穿孔。Neon电穿孔仪条件为1600v/10ms/3个脉冲,其具有10ul尖端和250k个细胞,mRNA合计量为1-5ug,用于脱氨酶-MCP和nCas9-UGI-UGI两者,并且其中适用的0.2-1.8umol的复合crRNA:tracrR或sgRNA。4D成核剂条件为EO-115以及20ul比色皿,500k,mRNA合计量为1-5ug,对于脱氨酶-MCP和nCas9-UGC-UGI(由Trilink合成)和0.2-1.8umol的复合crRNA:tracrR或sgRNA(Horizon Discovery)。将电穿孔后的细胞转移到具有100U IL-2、100U IL-7和100U IL-15(STEMCELL Technologies)的Immunocult XT培养基,并在37℃和5%CO2下培养48-72小时。
CD3+T细胞活化
通过在37℃和5%CO2下在100U/ml IL-2(STEMCELL Technologies)和1x青霉素/链霉素(Thermofisher)的存在下在Immunocult XT培养基(STEMCELL Technologies)中培养的Dynabeads Human T Activator CD3/CD28珠(Thermofisher)利用1:1珠粒:细胞比率,而活化T细胞。活化后,通过放置在磁体上并将细胞转移回培养物中而除去珠。
流式细胞术
通过CD3抗体染色(Biolegend)确认T细胞身份和QC。T细胞活化通过CD25染色确认。表型基因KO:TRAC由CD3和TCRab抗体染色(Biolegend)确认,B2M通过B2M-抗体(Biolegend)确认;任何表型数据是仅通过DAPI染色(BD Bioscience)确定的存活细胞上相对于参考材料的百分比变化。
基因组DNA分析
在电穿孔48-72小时后,从裂解细胞释放基因组DNA。通过PCR扩增感兴趣的基因座,然后发送产物用于Sanger测序(Genewiz)。通过专有的内部软件分析数据。
表7:用于TRAC、TRBC1、TRBC2、PDCD1、CD52和B2M功能敲除碱基编辑的单向导RNA(sg RNA)
/>
/>
/>
/>
用于sgRNA和crRNA格式的指南设计的示例性列表,其可以使用所例示的碱基编辑技术来创建功能性敲除。该列表包括特定于引入由内部专有软件生成的过早停止密码子和剪接中断位点的指导。
实施例5:crRNA:tracrRNA和sgRNA中经修饰RNA支架的碱基编辑效率
RNA合成
使用2′-乙酰氧基乙基原酸酯(2′-ACE)或2′-叔丁基二甲基甲硅烷基(2′-TBDMS)保护化学合成所有crRNA、tracrRNA和sgRNA。如所注释的包括化学修饰,包括在crRNA的5’末端和tracrRNA的3’末端的两个2’-O-甲基核苷酸和两个硫代磷酸酯(2xMS修饰)。2’OMe表示为m,硫代磷酸酯表示为*。RNA寡核苷酸是2'-脱保护/脱盐的,并通过高效液相色谱(HPLC)或聚丙烯酰胺凝胶电泳(PAGE)纯化。在转染前,将寡核苷酸再悬浮在10mM TrispH7.5缓冲液中。每个cRNA靶向的基因位点是(A)CR0118_PDCD1、(B)CR0107_PDCD1、(C)CR0057-TRAC_EX3、(D)CR0151_CD2、(E)Site 2、(F)CR0121_PDCD1和(G)CR0165_CIITA,如图11A-G所示,A)CR0151_CD2、(B)CR0121_PDCD1和(C)CR0165_CIITA,如图12A-C所示,以及(A)TRAC_22550571、(B)PDCD1_241852953和(C)CTNNB1,如图13A-C所示。用于碱基编辑的sgRNA目标位点序列列于表5中。
转染
用DharmaFECT Duo、25nM合成crRNA:tracrRNA和200ng的(a)rAPOBEC或(b)hAIDmRNA转染U2OS nCas9稳定转染细胞。在72小时收获细胞。
细胞处理
将细胞在56℃下在100μL含有蛋白酶K(Thermo Scientific,#FEREO0492)、RNaseA(Thermo Scientific,#FEREN0531)和Phusion HF缓冲液(Thermo Scientific,#F-518L)的缓冲液中裂解30分钟,然后在95℃下进行5分钟的热失活。该细胞裂解物用于生成横跨包含碱基编辑位点的区域的200-400个核苷酸PCR扩增子。未经纯化的PCR扩增子通过Genewiz进行Sanger测序。
编辑分析
使用Chimera分析工具从AB1文件(开放源工具BEAT的改编)计算碱基编辑效率。Chimera通过首先减去背景噪声以定义样品中的预期可变性来确定编辑效率。这允许估计编辑效率,而不需要相对于对照样品归一化。在此之后,Chimera使用Median AbsoluteDeviation(MAD)方法从噪声滤除任何异常值,然后评估碱基编辑器在20bp输入向导序列的跨度上的编辑效率。图11显示在tracrRNA的3'末端引入单个拷贝的C-5或F-5MS2变体的碱基编辑系统的比较编辑效率。针对以下crRNA展示数据:(A)CR0118_PDCD1、(B)CR0107_PDCD1、(C)CR0057-TRAC_EX3、(D)CR0151_CD2、(E)Site 2、(F)CR0121_PDCD1和(G)CR0165_CIITA。所检测到的C至T编辑的百分比指示C-5和F-5变体在所研究的所有基因座处提供相当水平的碱基编辑,另外编辑的窗口在两个MS2变体之间是多义的(equivocal)。图12显示在用于以下crRNA的tracrRNA的3'末端引入单个拷贝的C-5或F-5MS2变体的碱基编辑系统的比较编辑效率:(A)CR0151_CD2、(B)CR0121_PDCD1和(C)CR0165_CIITA。图13显示具有化学合成的1xMS2_3′sgRNAs(C-5)或1xMS2_3′_7bp-延伸_US sgRNAs(C-5)的碱基编辑的水平,其含有重复:反重复上部茎的7-碱基对延伸。图14表明,当将MCP-脱氨基酶的量降低至20ng时,与C-5MS2相比,较高亲和力的F-5MS2 tracrRNA导致C至T编辑的更高百分比。
如实施例5中使用的合成的1xMS2 tracrRNA-适体序列:
1x MS2_3′tracrRNA(C-5)SEQ ID NO:87
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGCGCACAUG A GGAUCACCCAUGUGCUUUUmU*mU*U
1x MS2_3′tracrRNA(F-5)SEQ ID NO:185
AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCGCGGCCCGG-2AdP-GGAUCACCACGGGCCUUUU mU*mU*U
2’OMe表示为m,并且硫代磷酸酯表示为*。
RNA支架介导的募集系统的蛋白质序列(2xUGI):
SEQ ID NO:186
/>
序列表
<110> 地平线探索有限公司
<120> RNA支架
<130> P33290WO1
<160> 186
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> 野生型 Cas9蛋白
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> 尿嘧啶-DNA 糖基化酶抑制剂 (UGI)
<400> 2
Met Thr Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu
1 5 10 15
Val Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
20 25 30
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
35 40 45
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu
50 55 60
Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
65 70 75 80
Ile Lys Met Leu
<210> 3
<211> 93
<212> DNA
<213> 人工序列
<220>
<223> 示例性混合crRNA:tracrRNA, gRNA序列
<400> 3
guuuaagagc uaugcuggaa acagcauagc aaguuuaaau aaggcuaguc cguuaucaac 60
uugaaaaagu ggcaccgagu cggugcuuuu uuu 93
<210> 4
<211> 79
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 1
<400> 4
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugc 79
<210> 5
<211> 60
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 2
<400> 5
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc gagucggugc 60
<210> 6
<211> 64
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 3
<400> 6
agcauagcaa guuaaaauaa ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg 60
gugc 64
<210> 7
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 4
<400> 7
caaaacagca uagcaaguua aaauaaggcu aguccguuau caacuugaaa aaguggcacc 60
gagucggugc 70
<210> 8
<211> 45
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 5
<400> 8
uagcaaguua aaauaaggcu aguccguuau caacuugaaa aagug 45
<210> 9
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 6
<400> 9
uagcaaguua aaauaaggcu aguccguuau ca 32
<210> 10
<211> 26
<212> RNA
<213> 人工序列
<220>
<223> tracrRNA 7
<400> 10
uagcaaguua aaauaaggcu aguccg 26
<210> 11
<211> 66
<212> RNA
<213> 人工序列
<220>
<223> 端粒酶Ku结合基序
<400> 11
uucuugucgu acuuauagau cgcuacguua uuucaauuuu gaaaaucuga guccugggag 60
ugcgga 66
<210> 12
<211> 1094
<212> PRT
<213> 人工序列
<220>
<223> 端粒酶Ku异二聚体
<400> 12
Met Ser Gly Trp Glu Ser Tyr Tyr Lys Thr Glu Gly Asp Glu Glu Ala
1 5 10 15
Glu Glu Glu Gln Glu Glu Asn Leu Glu Ala Ser Gly Asp Tyr Lys Tyr
20 25 30
Ser Gly Arg Asp Ser Leu Ile Phe Leu Val Asp Ala Ser Lys Ala Met
35 40 45
Phe Glu Ser Gln Ser Glu Asp Glu Leu Thr Pro Phe Asp Met Ser Ile
50 55 60
Gln Cys Ile Gln Ser Val Tyr Ile Ser Lys Ile Ile Ser Ser Asp Arg
65 70 75 80
Asp Leu Leu Ala Val Val Phe Tyr Gly Thr Glu Lys Asp Lys Asn Ser
85 90 95
Val Asn Phe Lys Asn Ile Tyr Val Leu Gln Glu Leu Asp Asn Pro Gly
100 105 110
Ala Lys Arg Ile Leu Glu Leu Asp Gln Phe Lys Gly Gln Gln Gly Gln
115 120 125
Lys Arg Phe Gln Asp Met Met Gly His Gly Ser Asp Tyr Ser Leu Ser
130 135 140
Glu Val Leu Trp Val Cys Ala Asn Leu Phe Ser Asp Val Gln Phe Lys
145 150 155 160
Met Ser His Lys Arg Ile Met Leu Phe Thr Asn Glu Asp Asn Pro His
165 170 175
Gly Asn Asp Ser Ala Lys Ala Ser Arg Ala Arg Thr Lys Ala Gly Asp
180 185 190
Leu Arg Asp Thr Gly Ile Phe Leu Asp Leu Met His Leu Lys Lys Pro
195 200 205
Gly Gly Phe Asp Ile Ser Leu Phe Tyr Arg Asp Ile Ile Ser Ile Ala
210 215 220
Glu Asp Glu Asp Leu Arg Val His Phe Glu Glu Ser Ser Lys Leu Glu
225 230 235 240
Asp Leu Leu Arg Lys Val Arg Ala Lys Glu Thr Arg Lys Arg Ala Leu
245 250 255
Ser Arg Leu Lys Leu Lys Leu Asn Lys Asp Ile Val Ile Ser Val Gly
260 265 270
Ile Tyr Asn Leu Val Gln Lys Ala Leu Lys Pro Pro Pro Ile Lys Leu
275 280 285
Tyr Arg Glu Thr Asn Glu Pro Val Lys Thr Lys Thr Arg Thr Phe Asn
290 295 300
Thr Ser Thr Gly Gly Leu Leu Leu Pro Ser Asp Thr Lys Arg Ser Gln
305 310 315 320
Ile Tyr Gly Ser Arg Gln Ile Ile Leu Glu Lys Glu Glu Thr Glu Glu
325 330 335
Leu Lys Arg Phe Asp Asp Pro Gly Leu Met Leu Met Gly Phe Lys Pro
340 345 350
Leu Val Leu Leu Lys Lys His His Tyr Leu Arg Pro Ser Leu Phe Val
355 360 365
Tyr Pro Glu Glu Ser Leu Val Ile Gly Ser Ser Thr Leu Phe Ser Ala
370 375 380
Leu Leu Ile Lys Cys Leu Glu Lys Glu Val Ala Ala Leu Cys Arg Tyr
385 390 395 400
Thr Pro Arg Arg Asn Ile Pro Pro Tyr Phe Val Ala Leu Val Pro Gln
405 410 415
Glu Glu Glu Leu Asp Asp Gln Lys Ile Gln Val Thr Pro Pro Gly Phe
420 425 430
Gln Leu Val Phe Leu Pro Phe Ala Asp Asp Lys Arg Lys Met Pro Phe
435 440 445
Thr Glu Lys Ile Met Ala Thr Pro Glu Gln Val Gly Lys Met Lys Ala
450 455 460
Ile Val Glu Lys Leu Arg Phe Thr Tyr Arg Ser Asp Ser Phe Glu Asn
465 470 475 480
Pro Val Leu Gln Gln His Phe Arg Asn Leu Glu Ala Leu Ala Leu Asp
485 490 495
Leu Met Glu Pro Glu Gln Ala Val Asp Leu Thr Leu Pro Lys Val Glu
500 505 510
Ala Met Asn Lys Arg Leu Gly Ser Leu Val Asp Glu Phe Lys Glu Leu
515 520 525
Val Tyr Pro Pro Asp Tyr Asn Pro Glu Gly Lys Val Thr Lys Arg Lys
530 535 540
His Asp Asn Glu Gly Ser Gly Ser Lys Arg Pro Lys Val Glu Tyr Ser
545 550 555 560
Glu Glu Glu Leu Lys Thr His Ile Ser Lys Gly Thr Leu Gly Lys Phe
565 570 575
Thr Val Pro Met Leu Lys Glu Ala Cys Arg Ala Tyr Gly Leu Lys Ser
580 585 590
Gly Leu Lys Lys Gln Glu Leu Leu Glu Ala Leu Thr Lys His Phe Gln
595 600 605
Asp Met Val Arg Ser Gly Asn Lys Ala Ala Val Val Leu Cys Met Asp
610 615 620
Val Gly Phe Thr Met Ser Asn Ser Ile Pro Gly Ile Glu Ser Pro Phe
625 630 635 640
Glu Gln Ala Lys Lys Val Ile Thr Met Phe Val Gln Arg Gln Val Phe
645 650 655
Ala Glu Asn Lys Asp Glu Ile Ala Leu Val Leu Phe Gly Thr Asp Gly
660 665 670
Thr Asp Asn Pro Leu Ser Gly Gly Asp Gln Tyr Gln Asn Ile Thr Val
675 680 685
His Arg His Leu Met Leu Pro Asp Phe Asp Leu Leu Glu Asp Ile Glu
690 695 700
Ser Lys Ile Gln Pro Gly Ser Gln Gln Ala Asp Phe Leu Asp Ala Leu
705 710 715 720
Ile Val Ser Met Asp Val Ile Gln His Glu Thr Ile Gly Lys Lys Phe
725 730 735
Glu Lys Arg His Ile Glu Ile Phe Thr Asp Leu Ser Ser Arg Phe Ser
740 745 750
Lys Ser Gln Leu Asp Ile Ile Ile His Ser Leu Lys Lys Cys Asp Ile
755 760 765
Ser Glu Arg His Ser Ile His Trp Pro Cys Arg Leu Thr Ile Gly Ser
770 775 780
Asn Leu Ser Ile Arg Ile Ala Ala Tyr Lys Ser Ile Leu Gln Glu Arg
785 790 795 800
Val Lys Lys Thr Trp Thr Val Val Asp Ala Lys Thr Leu Lys Lys Glu
805 810 815
Asp Ile Gln Lys Glu Thr Val Tyr Cys Leu Asn Asp Asp Asp Glu Thr
820 825 830
Glu Val Leu Lys Glu Asp Ile Ile Gln Gly Phe Arg Tyr Gly Ser Asp
835 840 845
Ile Val Pro Phe Ser Lys Val Asp Glu Glu Gln Met Lys Tyr Lys Ser
850 855 860
Glu Gly Lys Cys Phe Ser Val Leu Gly Phe Cys Lys Ser Ser Gln Val
865 870 875 880
Gln Arg Arg Phe Phe Met Gly Asn Gln Val Leu Lys Val Phe Ala Ala
885 890 895
Arg Asp Asp Glu Ala Ala Ala Val Ala Leu Ser Ser Leu Ile His Ala
900 905 910
Leu Asp Asp Leu Asp Met Val Ala Ile Val Arg Tyr Ala Tyr Asp Lys
915 920 925
Arg Ala Asn Pro Gln Val Gly Val Ala Phe Pro His Ile Lys His Asn
930 935 940
Tyr Glu Cys Leu Val Tyr Val Gln Leu Pro Phe Met Glu Asp Leu Arg
945 950 955 960
Gln Tyr Met Phe Ser Ser Leu Lys Asn Ser Lys Lys Tyr Ala Pro Thr
965 970 975
Glu Ala Gln Leu Asn Ala Val Asp Ala Leu Ile Asp Ser Met Ser Leu
980 985 990
Ala Lys Lys Asp Glu Lys Thr Asp Thr Leu Glu Asp Leu Phe Pro Thr
995 1000 1005
Thr Lys Ile Pro Asn Pro Arg Phe Gln Arg Leu Phe Gln Cys Leu
1010 1015 1020
Leu His Arg Ala Leu His Pro Arg Glu Pro Leu Pro Pro Ile Gln
1025 1030 1035
Gln His Ile Trp Asn Met Leu Asn Pro Pro Ala Glu Val Thr Thr
1040 1045 1050
Lys Ser Gln Ile Pro Leu Ser Lys Ile Lys Thr Leu Phe Pro Leu
1055 1060 1065
Ile Glu Ala Lys Lys Lys Asp Gln Val Thr Ala Gln Glu Ile Phe
1070 1075 1080
Gln Asp Asn His Glu Asp Gly Pro Thr Ala Lys
1085 1090
<210> 13
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> 端粒酶Sm7一致位点(单链)
<400> 13
aauuuuugga 10
<210> 14
<211> 83
<212> PRT
<213> 人工序列
<220>
<223> 单体Sm-样蛋白(古细菌)
<400> 14
Gly Ser Val Ile Asp Val Ser Ser Gln Arg Val Asn Val Gln Arg Pro
1 5 10 15
Leu Asp Ala Leu Gly Asn Ser Leu Asn Ser Pro Val Ile Ile Lys Leu
20 25 30
Lys Gly Asp Arg Glu Phe Arg Gly Val Leu Lys Ser Phe Asp Leu His
35 40 45
Met Asn Leu Val Leu Asn Asp Ala Glu Glu Leu Glu Asp Gly Glu Val
50 55 60
Thr Arg Arg Leu Gly Thr Val Leu Ile Arg Gly Asp Asn Ile Val Tyr
65 70 75 80
Ile Ser Pro
<210> 15
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> MS2噬菌体操纵基因茎环
<400> 15
acaugaggau cacccaugu 19
<210> 16
<211> 117
<212> PRT
<213> 人工序列
<220>
<223> MS2 衣壳蛋白
<400> 16
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile
65 70 75 80
Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met
85 90 95
Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala
100 105 110
Asn Ser Gly Ile Tyr
115
<210> 17
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> PP7噬菌体操纵基因茎环
<400> 17
auaaggaguu uauauggaaa cccuua 26
<210> 18
<211> 128
<212> PRT
<213> 人工序列
<220>
<223> PP7 衣壳蛋白 (PCP)
<400> 18
Met Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr Leu
1 5 10 15
Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys Val
20 25 30
Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln Asn
35 40 45
Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala Asp
50 55 60
Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro Lys Val Arg
65 70 75 80
Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala Asn Ser Thr
85 90 95
Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala
100 105 110
Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg
115 120 125
<210> 19
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> SfMu Com茎环
<400> 19
cugaaugccu gcgagcauc 19
<210> 20
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> SfMu Com 结合蛋白
<400> 20
Met Lys Ser Ile Arg Cys Lys Asn Cys Asn Lys Leu Leu Phe Lys Ala
1 5 10 15
Asp Ser Phe Asp His Ile Glu Ile Arg Cys Pro Arg Cys Lys Arg His
20 25 30
Ile Ile Met Leu Asn Ala Cys Glu His Pro Thr Glu Lys His Cys Gly
35 40 45
Lys Arg Glu Lys Ile Thr His Ser Asp Glu Thr Val Arg Tyr
50 55 60
<210> 21
<211> 25
<212> RNA
<213> 人工序列
<220>
<223> 4nt MS2 延伸
<220>
<221> misc_feature
<222> (1)..(2)
<223> GC 接头
<220>
<221> misc_feature
<222> (3)..(4)
<223> 延伸
<220>
<221> misc_feature
<222> (4)..(23)
<223> MS2 适体
<220>
<221> misc_feature
<222> (24)..(25)
<223> 延伸
<400> 21
gcgcacauga ggaucaccca ugugc 25
<210> 22
<211> 31
<212> RNA
<213> 人工序列
<220>
<223> 10nt MS2 延伸
<220>
<221> misc_feature
<222> (1)..(2)
<223> 接头
<220>
<221> misc_feature
<222> (3)..(7)
<223> 延伸
<220>
<221> misc_feature
<222> (8)..(26)
<223> MS2 适体
<220>
<221> misc_feature
<222> (27)..(31)
<223> 延伸
<400> 22
gcgagcgaca ugaggaucac ccaugucgcu c 31
<210> 23
<211> 37
<212> RNA
<213> 人工序列
<220>
<223> 16 nt MS2 延伸
<220>
<221> misc_feature
<222> (1)..(2)
<223> 接头
<220>
<221> misc_feature
<222> (3)..(10)
<223> 延伸
<220>
<221> misc_feature
<222> (11)..(29)
<223> MS2 适体
<220>
<221> misc_feature
<222> (30)..(37)
<223> 延伸
<400> 23
gccacgagcg acaugaggau cacccauguc gcucgug 37
<210> 24
<211> 47
<212> RNA
<213> 人工序列
<220>
<223> 26nt MS2 延伸
<220>
<221> misc_feature
<222> (1)..(2)
<223> 接头
<220>
<221> misc_feature
<222> (3)..(15)
<223> 接头
<220>
<221> misc_feature
<222> (16)..(34)
<223> MS2 适体
<220>
<221> misc_feature
<222> (35)..(47)
<223> 延伸
<400> 24
gccgucagac gagcgacaug aggaucaccc augucgcucg ucugacg 47
<210> 25
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> 酿脓链球菌dCas9蛋白序列
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> 活性位点突变体D10A
<220>
<221> MISC_FEATURE
<222> (840)..(840)
<223> 活性位点突变体H840A
<400> 25
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 26
<211> 1367
<212> PRT
<213> 人工序列
<220>
<223> Cas9 D10A蛋白
<220>
<221> 突变
<222> (10)..(10)
<223> D10A
<400> 26
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
1 5 10 15
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
20 25 30
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
35 40 45
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
50 55 60
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
65 70 75 80
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
85 90 95
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
100 105 110
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
115 120 125
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
130 135 140
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
145 150 155 160
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
165 170 175
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
180 185 190
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
195 200 205
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
210 215 220
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
225 230 235 240
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
245 250 255
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
260 265 270
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
275 280 285
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
290 295 300
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
305 310 315 320
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
325 330 335
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
340 345 350
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
355 360 365
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
370 375 380
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys
385 390 395 400
Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly
405 410 415
Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu
420 425 430
Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro
435 440 445
Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met
450 455 460
Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val
465 470 475 480
Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn
485 490 495
Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu
500 505 510
Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr
515 520 525
Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys
530 535 540
Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val
545 550 555 560
Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser
565 570 575
Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr
580 585 590
Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn
595 600 605
Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
610 615 620
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His
625 630 635 640
Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr
645 650 655
Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys
660 665 670
Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala
675 680 685
Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys
690 695 700
Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His
705 710 715 720
Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
725 730 735
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 27
<211> 4104
<212> DNA
<213> 人工序列
<220>
<223> DNA,编码Cas9 D10A蛋白
<220>
<221> misc_feature
<222> (29)..()
<223> A to C
<220>
<221> misc_feature
<222> (29)..(29)
<223> A to C
<400> 27
atggataaaa agtattctat tggtttagcc atcggcacta attccgttgg atgggctgtc 60
ataaccgatg aatacaaagt accttcaaag aaatttaagg tgttggggaa cacagaccgt 120
cattcgatta aaaagaatct tatcggtgcc ctcctattcg atagtggcga aacggcagag 180
gcgactcgcc tgaaacgaac cgctcggaga aggtatacac gtcgcaagaa ccgaatatgt 240
tacttacaag aaatttttag caatgagatg gccaaagttg acgattcttt ctttcaccgt 300
ttggaagagt ccttccttgt cgaagaggac aagaaacatg aacggcaccc catctttgga 360
aacatagtag atgaggtggc atatcatgaa aagtacccaa cgatttatca cctcagaaaa 420
aagctagttg actcaactga taaagcggac ctgaggttaa tctacttggc tcttgcccat 480
atgataaagt tccgtgggca ctttctcatt gagggtgatc taaatccgga caactcggat 540
gtcgacaaac tgttcatcca gttagtacaa acctataatc agttgtttga agagaaccct 600
ataaatgcaa gtggcgtgga tgcgaaggct attcttagcg cccgcctctc taaatcccga 660
cggctagaaa acctgatcgc acaattaccc ggagagaaga aaaatgggtt gttcggtaac 720
cttatagcgc tctcactagg cctgacacca aattttaagt cgaacttcga cttagctgaa 780
gatgccaaat tgcagcttag taaggacacg tacgatgacg atctcgacaa tctactggca 840
caaattggag atcagtatgc ggacttattt ttggctgcca aaaaccttag cgatgcaatc 900
ctcctatctg acatactgag agttaatact gagattacca aggcgccgtt atccgcttca 960
atgatcaaaa ggtacgatga acatcaccaa gacttgacac ttctcaaggc cctagtccgt 1020
cagcaactgc ctgagaaata taaggaaata ttctttgatc agtcgaaaaa cgggtacgca 1080
ggttatattg acggcggagc gagtcaagag gaattctaca agtttatcaa acccatatta 1140
gagaagatgg atgggacgga agagttgctt gtaaaactca atcgcgaaga tctactgcga 1200
aagcagcgga ctttcgacaa cggtagcatt ccacatcaaa tccacttagg cgaattgcat 1260
gctatactta gaaggcagga ggatttttat ccgttcctca aagacaatcg tgaaaagatt 1320
gagaaaatcc taacctttcg cataccttac tatgtgggac ccctggcccg agggaactct 1380
cggttcgcat ggatgacaag aaagtccgaa gaaacgatta ctccatggaa ttttgaggaa 1440
gttgtcgata aaggtgcgtc agctcaatcg ttcatcgaga ggatgaccaa ctttgacaag 1500
aatttaccga acgaaaaagt attgcctaag cacagtttac tttacgagta tttcacagtg 1560
tacaatgaac tcacgaaagt taagtatgtc actgagggca tgcgtaaacc cgcctttcta 1620
agcggagaac agaagaaagc aatagtagat ctgttattca agaccaaccg caaagtgaca 1680
gttaagcaat tgaaagagga ctactttaag aaaattgaat gcttcgattc tgtcgagatc 1740
tccggggtag aagatcgatt taatgcgtca cttggtacgt atcatgacct cctaaagata 1800
attaaagata aggacttcct ggataacgaa gagaatgaag atatcttaga agatatagtg 1860
ttgactctta ccctctttga agatcgggaa atgattgagg aaagactaaa aacatacgct 1920
cacctgttcg acgataaggt tatgaaacag ttaaagaggc gtcgctatac gggctgggga 1980
cgattgtcgc ggaaacttat caacgggata agagacaagc aaagtggtaa aactattctc 2040
gattttctaa agagcgacgg cttcgccaat aggaacttta tgcagctgat ccatgatgac 2100
tctttaacct tcaaagagga tatacaaaag gcacaggttt ccggacaagg ggactcattg 2160
cacgaacata ttgcgaatct tgctggttcg ccagccatca aaaagggcat actccagaca 2220
gtcaaagtag tggatgagct agttaaggtc atgggacgtc acaaaccgga aaacattgta 2280
atcgagatgg cacgcgaaaa tcaaacgact cagaaggggc aaaaaaacag tcgagagcgg 2340
atgaagagaa tagaagaggg tattaaagaa ctgggcagcc agatcttaaa ggagcatcct 2400
gtggaaaata cccaattgca gaacgagaaa ctttacctct attacctaca aaatggaagg 2460
gacatgtatg ttgatcagga actggacata aaccgtttat ctgattacga cgtcgatcac 2520
attgtacccc aatccttttt gaaggacgat tcaatcgaca ataaagtgct tacacgctcg 2580
gataagaacc gagggaaaag tgacaatgtt ccaagcgagg aagtcgtaaa gaaaatgaag 2640
aactattggc ggcagctcct aaatgcgaaa ctgataacgc aaagaaagtt cgataactta 2700
actaaagctg agaggggtgg cttgtctgaa cttgacaagg ccggatttat taaacgtcag 2760
ctcgtggaaa cccgccaaat cacaaagcat gttgcacaga tactagattc ccgaatgaat 2820
acgaaatacg acgagaacga taagctgatt cgggaagtca aagtaatcac tttaaagtca 2880
aaattggtgt cggacttcag aaaggatttt caattctata aagttaggga gataaataac 2940
taccaccatg cgcacgacgc ttatcttaat gccgtcgtag ggaccgcact cattaagaaa 3000
tacccgaagc tagaaagtga gtttgtgtat ggtgattaca aagtttatga cgtccgtaag 3060
atgatcgcga aaagcgaaca ggagataggc aaggctacag ccaaatactt cttttattct 3120
aacattatga atttctttaa gacggaaatc actctggcaa acggagagat acgcaaacga 3180
cctttaattg aaaccaatgg ggagacaggt gaaatcgtat gggataaggg ccgggacttc 3240
gcgacggtga gaaaagtttt gtccatgccc caagtcaaca tagtaaagaa aactgaggtg 3300
cagaccggag ggttttcaaa ggaatcgatt cttccaaaaa ggaatagtga taagctcatc 3360
gctcgtaaaa aggactggga cccgaaaaag tacggtggct tcgatagccc tacagttgcc 3420
tattctgtcc tagtagtggc aaaagttgag aagggaaaat ccaagaaact gaagtcagtc 3480
aaagaattat tggggataac gattatggag cgctcgtctt ttgaaaagaa ccccatcgac 3540
ttccttgagg cgaaaggtta caaggaagta aaaaaggatc tcataattaa actaccaaag 3600
tatagtctgt ttgagttaga aaatggccga aaacggatgt tggctagcgc cggagagctt 3660
caaaagggga acgaactcgc actaccgtct aaatacgtga atttcctgta tttagcgtcc 3720
cattacgaga agttgaaagg ttcacctgaa gataacgaac agaagcaact ttttgttgag 3780
cagcacaaac attatctcga cgaaatcata gagcaaattt cggaattcag taagagagtc 3840
atcctagctg atgccaatct ggacaaagta ttaagcgcat acaacaagca cagggataaa 3900
cccatacgtg agcaggcgga aaatattatc catttgttta ctcttaccaa cctcggcgct 3960
ccagccgcat tcaagtattt tgacacaacg atagatcgca aacgatacac ttctaccaag 4020
gaggtgctag acgcgacact gattcaccaa tccatcacgg gattatatga aactcggata 4080
gatttgtcac agcttggggg tgac 4104
<210> 28
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> NA支架表达盒(酿脓链球菌),含有20个核苷酸的可编程序列、CRISPR RNA基序(tracrRNA)和MS2操纵基因基序
<220>
<221> misc_feature
<222> (1)..(20)
<223> 20-核苷酸可编程序列
<220>
<221> misc_feature
<222> (21)..(96)
<223> CRISPR RNA 基序(tracrRNA)
<220>
<221> misc_feature
<222> (97)..(98)
<223> GC 接头
<220>
<221> misc_feature
<222> (99)..(100)
<223> 延伸
<220>
<221> misc_feature
<222> (101)..(119)
<223> MS2基序
<220>
<221> misc_feature
<222> (120)..(121)
<223> 延伸
<220>
<221> misc_feature
<222> (122)..(128)
<223> 终止子
<400> 28
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat cacccatgtg 120
cttttttt 128
<210> 29
<211> 150
<212> DNA
<213> 人工序列
<220>
<223> RNA支架,含2个MS2环 (2xMS2)
<220>
<221> misc_feature
<222> (83)..(101)
<223> MS2 支架
<220>
<221> misc_feature
<222> (112)..(130)
<223> MS2 支架
<400> 29
gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 60
ggcaccgagt cggtgcggga gcacatgagg atcacccatg tgccacgagc gacatgagga 120
tcacccatgt cgctcgtgtt cccttttttt 150
<210> 30
<211> 340
<212> PRT
<213> 人工序列
<220>
<223> 效应子AID –MCP融合
<220>
<221> MISC_FEATURE
<222> (1)..(198)
<223> AID
<220>
<221> MISC_FEATURE
<222> (199)..(223)
<223> MCP
<220>
<221> MISC_FEATURE
<222> (224)..(340)
<223> UGI
<400> 30
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu Glu Leu Lys Thr Pro Leu Gly Asp Thr Thr
195 200 205
His Thr Ser Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Met
210 215 220
Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr Gly
225 230 235 240
Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Ile Ala Glu Trp
245 250 255
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
260 265 270
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
275 280 285
Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro
290 295 300
Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln
305 310 315 320
Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn
325 330 335
Ser Gly Ile Tyr
340
<210> 31
<211> 594
<212> DNA
<213> 人工序列
<220>
<223> wtAID cDNA
<220>
<221> misc_feature
<222> (112)..(114)
<223> Ser38 密码
<400> 31
atggacagcc tcttgatgaa ccggaggaag tttctttacc aattcaaaaa tgtccgctgg 60
gctaagggtc ggcgtgagac ctacctgtgc tacgtagtga agaggcgtga cagtgctaca 120
tccttttcac tggactttgg ttatcttcgc aataagaacg gctgccacgt ggaattgctc 180
ttcctccgct acatctcgga ctgggaccta gaccctggcc gctgctaccg cgtcacctgg 240
ttcacctcct ggagcccctg ctacgactgt gcccgacatg tggccgactt tctgcgaggg 300
aaccccaacc tcagtctgag gatcttcacc gcgcgcctct acttctgtga ggaccgcaag 360
gctgagcccg aggggctgcg gcggctgcac cgcgccgggg tgcaaatagc catcatgacc 420
ttcaaagatt atttttactg ctggaatact tttgtagaaa accatgaaag aactttcaaa 480
gcctgggaag ggctgcatga aaattcagtt cgtctctcca gacagcttcg gcgcatcctt 540
ttgcccctgt atgaggttga tgacttacga gacgcatttc gtactttggg actt 594
<210> 32
<211> 198
<212> PRT
<213> 人工序列
<220>
<223> wtAID蛋白
<220>
<221> MISC_FEATURE
<222> (38)..(38)
<223> Ser38
<400> 32
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ser Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 33
<211> 594
<212> DNA
<213> 人工序列
<220>
<223> AID_S38A cDNA
<220>
<221> misc_feature
<222> (112)..(114)
<223> S38A 突变
<400> 33
atggacagcc tcttgatgaa ccggaggaag tttctttacc aattcaaaaa tgtccgctgg 60
gctaagggtc ggcgtgagac ctacctgtgc tacgtagtga agaggcgtga cgccgctaca 120
tccttttcac tggactttgg ttatcttcgc aataagaacg gctgccacgt ggaattgctc 180
ttcctccgct acatctcgga ctgggaccta gaccctggcc gctgctaccg cgtcacctgg 240
ttcacctcct ggagcccctg ctacgactgt gcccgacatg tggccgactt tctgcgaggg 300
aaccccaacc tcagtctgag gatcttcacc gcgcgcctct acttctgtga ggaccgcaag 360
gctgagcccg aggggctgcg gcggctgcac cgcgccgggg tgcaaatagc catcatgacc 420
ttcaaagatt atttttactg ctggaatact tttgtagaaa accatgaaag aactttcaaa 480
gcctgggaag ggctgcatga aaattcagtt cgtctctcca gacagcttcg gcgcatcctt 540
ttgcccctgt atgaggttga tgacttacga gacgcatttc gtactttggg actt 594
<210> 34
<211> 198
<212> PRT
<213> 人工序列
<220>
<223> AID_S38A蛋白
<220>
<221> MISC_FEATURE
<222> (38)..(38)
<223> S38A 突变
<400> 34
Met Asp Ser Leu Leu Met Asn Arg Arg Lys Phe Leu Tyr Gln Phe Lys
1 5 10 15
Asn Val Arg Trp Ala Lys Gly Arg Arg Glu Thr Tyr Leu Cys Tyr Val
20 25 30
Val Lys Arg Arg Asp Ala Ala Thr Ser Phe Ser Leu Asp Phe Gly Tyr
35 40 45
Leu Arg Asn Lys Asn Gly Cys His Val Glu Leu Leu Phe Leu Arg Tyr
50 55 60
Ile Ser Asp Trp Asp Leu Asp Pro Gly Arg Cys Tyr Arg Val Thr Trp
65 70 75 80
Phe Thr Ser Trp Ser Pro Cys Tyr Asp Cys Ala Arg His Val Ala Asp
85 90 95
Phe Leu Arg Gly Asn Pro Asn Leu Ser Leu Arg Ile Phe Thr Ala Arg
100 105 110
Leu Tyr Phe Cys Glu Asp Arg Lys Ala Glu Pro Glu Gly Leu Arg Arg
115 120 125
Leu His Arg Ala Gly Val Gln Ile Ala Ile Met Thr Phe Lys Asp Tyr
130 135 140
Phe Tyr Cys Trp Asn Thr Phe Val Glu Asn His Glu Arg Thr Phe Lys
145 150 155 160
Ala Trp Glu Gly Leu His Glu Asn Ser Val Arg Leu Ser Arg Gln Leu
165 170 175
Arg Arg Ile Leu Leu Pro Leu Tyr Glu Val Asp Asp Leu Arg Asp Ala
180 185 190
Phe Arg Thr Leu Gly Leu
195
<210> 35
<211> 1835
<212> PRT
<213> 人工序列
<220>
<223> ARNA支架介导的募集系统nu构建体的蛋白质序列
<220>
<221> MISC_FEATURE
<222> (1)..(7)
<223> 核定位信号(NLS)
<220>
<221> MISC_FEATURE
<222> (8)..(205)
<223> AID
<220>
<221> MISC_FEATURE
<222> (206)..(230)
<223> 接头
<220>
<221> MISC_FEATURE
<222> (231)..(347)
<223> MCP
<220>
<221> MISC_FEATURE
<222> (351)..(368)
<223> T2A 肽
<220>
<221> MISC_FEATURE
<222> (371)..(1737)
<223> nCAS9D10A
<220>
<221> MISC_FEATURE
<222> (1742)..(1824)
<223> UGI
<220>
<221> MISC_FEATURE
<222> (1829)..(1835)
<223> 核定位信号(NLS)
<400> 35
Pro Lys Lys Lys Arg Lys Val Met Asp Ser Leu Leu Met Asn Arg Arg
1 5 10 15
Lys Phe Leu Tyr Gln Phe Lys Asn Val Arg Trp Ala Lys Gly Arg Arg
20 25 30
Glu Thr Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser
35 40 45
Phe Ser Leu Asp Phe Gly Tyr Leu Arg Asn Lys Asn Gly Cys His Val
50 55 60
Glu Leu Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly
65 70 75 80
Arg Cys Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp
85 90 95
Cys Ala Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser
100 105 110
Leu Arg Ile Phe Thr Ala Arg Leu Tyr Phe Cys Glu Asp Arg Lys Ala
115 120 125
Glu Pro Glu Gly Leu Arg Arg Leu His Arg Ala Gly Val Gln Ile Ala
130 135 140
Ile Met Thr Phe Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu
145 150 155 160
Asn His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu Asn Ser
165 170 175
Val Arg Leu Ser Arg Gln Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu
180 185 190
Val Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu Glu Leu Lys
195 200 205
Thr Pro Leu Gly Asp Thr Thr His Thr Ser Pro Pro Cys Pro Ala Pro
210 215 220
Glu Leu Leu Gly Gly Pro Met Ala Ser Asn Phe Thr Gln Phe Val Leu
225 230 235 240
Val Asp Asn Gly Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe
245 250 255
Ala Asn Gly Ile Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala
260 265 270
Tyr Lys Val Thr Cys Ser Val Arg Gln Ser Ser Ala Gln Asn Arg Lys
275 280 285
Tyr Thr Ile Lys Val Glu Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu
290 295 300
Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu
305 310 315 320
Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile
325 330 335
Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr Gly Ser Gly Glu Gly
340 345 350
Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
355 360 365
Gly Thr Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser
370 375 380
Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys
385 390 395 400
Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu
405 410 415
Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg
420 425 430
Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile
435 440 445
Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp
450 455 460
Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys
465 470 475 480
Lys His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala
485 490 495
Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val
500 505 510
Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala
515 520 525
His Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn
530 535 540
Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr
545 550 555 560
Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp
565 570 575
Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu
580 585 590
Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly
595 600 605
Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn
610 615 620
Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr
625 630 635 640
Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala
645 650 655
Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser
660 665 670
Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala
675 680 685
Ser Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu
690 695 700
Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe
705 710 715 720
Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala
725 730 735
Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met
740 745 750
Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu
755 760 765
Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
770 775 780
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro
785 790 795 800
Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg
805 810 815
Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala
820 825 830
Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu
835 840 845
Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met
850 855 860
Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His
865 870 875 880
Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val
885 890 895
Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu
900 905 910
Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val
915 920 925
Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe
930 935 940
Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu
945 950 955 960
Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu
965 970 975
Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
980 985 990
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr
995 1000 1005
Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg
1010 1015 1020
Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly
1025 1030 1035
Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys
1040 1045 1050
Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp
1055 1060 1065
Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser
1070 1075 1080
Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
1085 1090 1095
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val
1100 1105 1110
Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile
1115 1120 1125
Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln
1130 1135 1140
Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys
1145 1150 1155
Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr
1160 1165 1170
Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly
1175 1180 1185
Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
1190 1195 1200
Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys Asp
1205 1210 1215
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
1220 1225 1230
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met
1235 1240 1245
Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln
1250 1255 1260
Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser
1265 1270 1275
Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr
1280 1285 1290
Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met
1295 1300 1305
Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys
1310 1315 1320
Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp
1325 1330 1335
Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala
1340 1345 1350
His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys
1355 1360 1365
Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys
1370 1375 1380
Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile
1385 1390 1395
Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn
1400 1405 1410
Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys
1415 1420 1425
Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp
1430 1435 1440
Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met
1445 1450 1455
Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly
1460 1465 1470
Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu
1475 1480 1485
Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe
1490 1495 1500
Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val
1505 1510 1515
Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu
1520 1525 1530
Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile
1535 1540 1545
Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu
1550 1555 1560
Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly
1565 1570 1575
Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn
1580 1585 1590
Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala
1595 1600 1605
Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln
1610 1615 1620
Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile
1625 1630 1635
Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp
1640 1645 1650
Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp
1655 1660 1665
Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr
1670 1675 1680
Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr
1685 1690 1695
Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp
1700 1705 1710
Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg
1715 1720 1725
Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Thr Asn
1730 1735 1740
Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile
1745 1750 1755
Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile
1760 1765 1770
Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp
1775 1780 1785
Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro
1790 1795 1800
Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu
1805 1810 1815
Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys Arg
1820 1825 1830
Lys Val
1835
<210> 36
<211> 1941
<212> PRT
<213> 人工序列
<220>
<223> ARNA支架介导的募集系统nu.2构建体的蛋白质序列
<220>
<221> MISC_FEATURE
<222> (1)..(7)
<223> 核定位信号(NLS)
<220>
<221> MISC_FEATURE
<222> (8)..(205)
<223> AID
<220>
<221> MISC_FEATURE
<222> (206)..(230)
<223> 接头
<220>
<221> MISC_FEATURE
<222> (231)..(347)
<223> MCP
<220>
<221> MISC_FEATURE
<222> (351)..(368)
<223> T2A 肽
<220>
<221> MISC_FEATURE
<222> (371)..(377)
<223> 核定位信号(NLS)
<220>
<221> MISC_FEATURE
<222> (378)..(1744)
<223> nCAS9D10A
<220>
<221> MISC_FEATURE
<222> (1755)..(1837)
<223> UGI
<220>
<221> MISC_FEATURE
<222> (1848)..(1930)
<223> UGI
<220>
<221> MISC_FEATURE
<222> (1935)..(1941)
<223> 核定位信号(NLS)
<400> 36
Pro Lys Lys Lys Arg Lys Val Met Asp Ser Leu Leu Met Asn Arg Arg
1 5 10 15
Lys Phe Leu Tyr Gln Phe Lys Asn Val Arg Trp Ala Lys Gly Arg Arg
20 25 30
Glu Thr Tyr Leu Cys Tyr Val Val Lys Arg Arg Asp Ser Ala Thr Ser
35 40 45
Phe Ser Leu Asp Phe Gly Tyr Leu Arg Asn Lys Asn Gly Cys His Val
50 55 60
Glu Leu Leu Phe Leu Arg Tyr Ile Ser Asp Trp Asp Leu Asp Pro Gly
65 70 75 80
Arg Cys Tyr Arg Val Thr Trp Phe Thr Ser Trp Ser Pro Cys Tyr Asp
85 90 95
Cys Ala Arg His Val Ala Asp Phe Leu Arg Gly Asn Pro Asn Leu Ser
100 105 110
Leu Arg Ile Phe Thr Ala Arg Leu Tyr Phe Cys Glu Asp Arg Lys Ala
115 120 125
Glu Pro Glu Gly Leu Arg Arg Leu His Arg Ala Gly Val Gln Ile Ala
130 135 140
Ile Met Thr Phe Lys Asp Tyr Phe Tyr Cys Trp Asn Thr Phe Val Glu
145 150 155 160
Asn His Glu Arg Thr Phe Lys Ala Trp Glu Gly Leu His Glu Asn Ser
165 170 175
Val Arg Leu Ser Arg Gln Leu Arg Arg Ile Leu Leu Pro Leu Tyr Glu
180 185 190
Val Asp Asp Leu Arg Asp Ala Phe Arg Thr Leu Gly Leu Glu Leu Lys
195 200 205
Thr Pro Leu Gly Asp Thr Thr His Thr Ser Pro Pro Cys Pro Ala Pro
210 215 220
Glu Leu Leu Gly Gly Pro Met Ala Ser Asn Phe Thr Gln Phe Val Leu
225 230 235 240
Val Asp Asn Gly Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe
245 250 255
Ala Asn Gly Ile Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala
260 265 270
Tyr Lys Val Thr Cys Ser Val Arg Gln Ser Ser Ala Gln Asn Arg Lys
275 280 285
Tyr Thr Ile Lys Val Glu Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu
290 295 300
Asn Met Glu Leu Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu
305 310 315 320
Leu Ile Val Lys Ala Met Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile
325 330 335
Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr Gly Ser Gly Glu Gly
340 345 350
Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro
355 360 365
Gly Thr Pro Lys Lys Lys Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly
370 375 380
Leu Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu
385 390 395 400
Tyr Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg
405 410 415
His Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly
420 425 430
Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr
435 440 445
Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn
450 455 460
Glu Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser
465 470 475 480
Phe Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly
485 490 495
Asn Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr
500 505 510
His Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg
515 520 525
Leu Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe
530 535 540
Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu
545 550 555 560
Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro
565 570 575
Ile Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu
580 585 590
Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu
595 600 605
Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu
610 615 620
Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu
625 630 635 640
Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala
645 650 655
Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu
660 665 670
Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile
675 680 685
Thr Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His
690 695 700
His Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro
705 710 715 720
Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala
725 730 735
Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile
740 745 750
Lys Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys
755 760 765
Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly
770 775 780
Ser Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg
785 790 795 800
Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile
805 810 815
Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala
820 825 830
Arg Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr
835 840 845
Ile Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala
850 855 860
Gln Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn
865 870 875 880
Glu Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
885 890 895
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys
900 905 910
Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu
915 920 925
Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr
930 935 940
Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu
945 950 955 960
Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile
965 970 975
Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu
980 985 990
Glu Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
995 1000 1005
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val
1010 1015 1020
Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu
1025 1030 1035
Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
1040 1045 1050
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn
1055 1060 1065
Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
1070 1075 1080
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
1085 1090 1095
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
1100 1105 1110
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
1115 1120 1125
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
1130 1135 1140
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
1145 1150 1155
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
1160 1165 1170
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
1175 1180 1185
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu
1190 1195 1200
Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
1205 1210 1215
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
1220 1225 1230
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1235 1240 1245
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1250 1255 1260
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1265 1270 1275
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1280 1285 1290
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1295 1300 1305
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1310 1315 1320
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1325 1330 1335
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1340 1345 1350
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1355 1360 1365
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1370 1375 1380
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1385 1390 1395
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1400 1405 1410
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1415 1420 1425
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1430 1435 1440
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1445 1450 1455
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1460 1465 1470
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1475 1480 1485
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1490 1495 1500
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1505 1510 1515
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1520 1525 1530
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1535 1540 1545
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1550 1555 1560
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1565 1570 1575
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1580 1585 1590
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1595 1600 1605
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1610 1615 1620
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1625 1630 1635
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1640 1645 1650
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1655 1660 1665
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1670 1675 1680
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1685 1690 1695
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1700 1705 1710
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1715 1720 1725
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1730 1735 1740
Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
1745 1750 1755
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu
1760 1765 1770
Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
1775 1780 1785
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
1790 1795 1800
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1805 1810 1815
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
1820 1825 1830
Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr
1835 1840 1845
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1850 1855 1860
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
1865 1870 1875
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1880 1885 1890
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
1895 1900 1905
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
1910 1915 1920
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys
1925 1930 1935
Arg Lys Val
1940
<210> 37
<211> 1866
<212> PRT
<213> 人工序列
<220>
<223> RNA支架介导的募集系统的蛋白质序列
<220>
<221> MISC_FEATURE
<222> (1)..(7)
<223> 核定位信号(NLS)
<220>
<221> MISC_FEATURE
<222> (8)..(235)
<223> AID
<220>
<221> MISC_FEATURE
<222> (236)..(261)
<223> 接头
<220>
<221> MISC_FEATURE
<222> (262)..(378)
<223> MCP
<220>
<221> MISC_FEATURE
<222> (382)..(399)
<223> T2A 肽
<220>
<221> MISC_FEATURE
<222> (402)..(1768)
<223> nCAS9D10A
<220>
<221> MISC_FEATURE
<222> (1772)..(1855)
<223> UGI
<220>
<221> MISC_FEATURE
<222> (1860)..(1866)
<223> 核定位信号(NLS)
<400> 37
Pro Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val Ala
1 5 10 15
Val Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val
20 25 30
Phe Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu
35 40 45
Ile Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn
50 55 60
Thr Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu
65 70 75 80
Arg Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser
85 90 95
Trp Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser
100 105 110
Arg Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His
115 120 125
His Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser
130 135 140
Gly Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp
145 150 155 160
Arg Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg
165 170 175
Tyr Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile
180 185 190
Ile Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro
195 200 205
Gln Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg
210 215 220
Leu Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Glu Leu Lys Thr
225 230 235 240
Pro Leu Gly Asp Thr Thr His Thr Ser Pro Pro Cys Pro Ala Pro Glu
245 250 255
Leu Leu Gly Gly Pro Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val
260 265 270
Asp Asn Gly Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala
275 280 285
Asn Gly Ile Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr
290 295 300
Lys Val Thr Cys Ser Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr
305 310 315 320
Thr Ile Lys Val Glu Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn
325 330 335
Met Glu Leu Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu
340 345 350
Ile Val Lys Ala Met Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro
355 360 365
Ser Ala Ile Ala Ala Asn Ser Gly Ile Tyr Gly Ser Gly Glu Gly Arg
370 375 380
Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Gly
385 390 395 400
Thr Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
405 410 415
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
420 425 430
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
435 440 445
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
450 455 460
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
465 470 475 480
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
485 490 495
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
500 505 510
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
515 520 525
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
530 535 540
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
545 550 555 560
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
565 570 575
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
580 585 590
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
595 600 605
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
610 615 620
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
625 630 635 640
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
645 650 655
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
660 665 670
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
675 680 685
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
690 695 700
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
705 710 715 720
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
725 730 735
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
740 745 750
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
755 760 765
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
770 775 780
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
785 790 795 800
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
805 810 815
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
820 825 830
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
835 840 845
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
850 855 860
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
865 870 875 880
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
885 890 895
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
900 905 910
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
915 920 925
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
930 935 940
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
945 950 955 960
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
965 970 975
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
980 985 990
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
995 1000 1005
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu
1010 1015 1020
Thr Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr
1025 1030 1035
Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg
1040 1045 1050
Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn
1055 1060 1065
Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu
1070 1075 1080
Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His
1085 1090 1095
Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
1100 1105 1110
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala
1115 1120 1125
Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val
1130 1135 1140
Val Asp Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn
1145 1150 1155
Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly
1160 1165 1170
Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile
1175 1180 1185
Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn
1190 1195 1200
Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
1205 1210 1215
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
1220 1225 1230
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
1235 1240 1245
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn
1250 1255 1260
Arg Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys
1265 1270 1275
Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr
1280 1285 1290
Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu
1295 1300 1305
Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu
1310 1315 1320
Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg
1325 1330 1335
Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val
1340 1345 1350
Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys
1355 1360 1365
Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His
1370 1375 1380
Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile
1385 1390 1395
Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr
1400 1405 1410
Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu
1415 1420 1425
Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met
1430 1435 1440
Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg
1445 1450 1455
Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val
1460 1465 1470
Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser
1475 1480 1485
Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly
1490 1495 1500
Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys
1505 1510 1515
Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly
1520 1525 1530
Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys
1535 1540 1545
Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu
1550 1555 1560
Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro
1565 1570 1575
Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp
1580 1585 1590
Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn
1595 1600 1605
Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly
1610 1615 1620
Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu
1625 1630 1635
Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu
1640 1645 1650
Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu
1655 1660 1665
Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala
1670 1675 1680
Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg
1685 1690 1695
Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe
1700 1705 1710
Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp
1715 1720 1725
Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu
1730 1735 1740
Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr
1745 1750 1755
Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Gly Gly Ser Thr
1760 1765 1770
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1775 1780 1785
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
1790 1795 1800
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1805 1810 1815
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
1820 1825 1830
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
1835 1840 1845
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Pro Lys Lys Lys
1850 1855 1860
Arg Lys Val
1865
<210> 38
<211> 128
<212> RNA
<213> 人工序列
<220>
<223> gRNA_MS2构建体的序列
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表可定制的目标序列
<220>
<221> misc_feature
<222> (21)..(96)
<223> gRNA 支架
<220>
<221> misc_feature
<222> (101)..(119)
<223> MS2 适体
<400> 38
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcgcgc acaugaggau cacccaugug 120
cuuuuuuu 128
<210> 39
<211> 168
<212> DNA
<213> 人工序列
<220>
<223> gRNA_2xMS2构建体的序列
<220>
<221> misc_feature
<222> (1)..(20)
<223> N代表可定制的目标序列
<220>
<221> misc_feature
<222> (21)..(96)
<223> gRNA 支架
<220>
<221> misc_feature
<222> (103)..(121)
<223> MS2 适体s
<220>
<221> misc_feature
<222> (132)..(150)
<223> MS2 适体s
<220>
<221> misc_feature
<222> (164)..(170)
<223> 终止子
<400> 39
nnnnnnnnnn nnnnnnnngu uuuagagcua gaaauagcaa guuaaaauaa ggcuaguccg 60
uuaucaacuu gaaaaagugg caccgagucg gugcgggagc acaugaggau cacccaugug 120
ccacgagcga caugaggauc acccaugucg ctcgtgttcc cuuuuuuu 168
<210> 40
<211> 103
<212> DNA
<213> 人工序列
<220>
<223> S. pyrogenes sgRNA
<220>
<221> misc_feature
<222> (1)..(20)
<223> N代表20 nt的目标特定间隔序列
<220>
<221> misc_feature
<222> (21)..(96)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (97)..(103)
<223> 终止子
<400> 40
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt ttt 103
<210> 41
<211> 170
<212> DNA
<213> 人工序列
<220>
<223> 2xMS2_3'
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(96)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (97)..(102)
<223> 延伸
<220>
<221> misc_feature
<222> (103)..(121)
<223> MS2 (C5 变体)
<220>
<221> misc_feature
<222> (122)..(131)
<223> 延伸
<220>
<221> misc_feature
<222> (132)..(150)
<223> MS2 (C5 变体)
<220>
<221> misc_feature
<222> (151)..(163)
<223> 延伸
<220>
<221> misc_feature
<222> (164)..(170)
<223> 终止子
<400> 41
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcggga gcacatgagg atcacccatg 120
tgccacgagc gacatgagga tcacccatgt cgctcgtgtt cccttttttt 170
<210> 42
<211> 133
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2_TL
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(37)
<223> 延伸
<220>
<221> misc_feature
<222> (38)..(56)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (57)..(66)
<223> 延伸
<220>
<221> misc_feature
<222> (67)..(126)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (127)..(133)
<223> 终止子
<400> 42
nnnnnnnnnn nnnnnnnnnn gttttagagc taggccaaca tgaggatcac ccatgtctgc 60
agggcctagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt 120
cggtgctttt ttt 133
<210> 43
<211> 128
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2_3'
<220>
<221> misc_feature
<222> (1)..(20)
<223> N代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(96)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (97)..(100)
<223> 延伸
<220>
<221> misc_feature
<222> (101)..(119)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (120)..(121)
<223> 延伸
<220>
<221> misc_feature
<222> (122)..(128)
<223> 终止子
<400> 43
nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60
cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat cacccatgtg 120
cttttttt 128
<210> 44
<211> 117
<212> DNA
<213> 人工序列
<220>
<223> 7bp 延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(39)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (40)..(43)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (44)..(50)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (51)..(110)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (111)..(117)
<223> 终止子
<400> 44
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttg aaaaacagca tagcaagtta 60
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc ttttttt 117
<210> 45
<211> 184
<212> DNA
<213> 人工序列
<220>
<223> 2xMS2_3' 7bp_延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(39)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (40)..(43)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (44)..(50)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (51)..(110)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (111)..(116)
<223> 延伸
<220>
<221> misc_feature
<222> (117)..(135)
<223> MS2 (C5 变体)
<220>
<221> misc_feature
<222> (136)..(145)
<223> 延伸
<220>
<221> misc_feature
<222> (146)..(164)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (165)..(177)
<223> 延伸
<220>
<221> misc_feature
<222> (178)..(184)
<223> 终止子
<400> 45
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttg aaaaacagca tagcaagtta 60
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc gggagcacat 120
gaggatcacc catgtgccac gagcgacatg aggatcaccc atgtcgctcg tgttcccttt 180
tttt 184
<210> 46
<211> 147
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2-TL _7bp 延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(39)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (40)..(44)
<223> 延伸
<220>
<221> misc_feature
<222> (45)..(63)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (64)..(73)
<223> 延伸
<220>
<221> misc_feature
<222> (74)..(80)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (81)..(140)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (141)..(147)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (141)..(147)
<223> 终止子
<400> 46
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttg gccaacatga ggatcaccca 60
tgtctgcagg gccaacagca tagcaagtta aaataaggct agtccgttat caacttgaaa 120
aagtggcacc gagtcggtgc ttttttt 147
<210> 47
<211> 132
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2-3'_2bp 延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(34)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (35)..(38)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (39)..(40)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (41)..(100)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (101)..(104)
<223> 延伸
<220>
<221> misc_feature
<222> (105)..(123)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (124)..(126)
<223> 延伸
<220>
<221> misc_feature
<222> (127)..(132)
<223> 终止子
<400> 47
nnnnnnnnnn nnnnnnnnnn gttttagagc tatggaaaca tagcaagtta aaataaggct 60
agtccgttat caacttgaaa aagtggcacc gagtcggtgc gcgcacatga ggatcaccca 120
tgtgcttttt tt 132
<210> 48
<211> 138
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2-3'_5bp-延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(37)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (38)..(41)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (42)..(46)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (47)..(106)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (107)..(110)
<223> 延伸
<220>
<221> misc_feature
<222> (111)..(129)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (130)..(131)
<223> 延伸
<220>
<221> misc_feature
<222> (132)..(138)
<223> 终止子
<400> 48
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctggaa acagcatagc aagttaaaat 60
aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc acatgaggat 120
cacccatgtg cttttttt 138
<210> 49
<211> 142
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2-3'_7bp-延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N denotes the 20 nt target specific spacer序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(39)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (40)..(43)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (44)..(50)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (51)..(110)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (111)..(114)
<223> 延伸s
<220>
<221> misc_feature
<222> (111)..(133)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (134)..(135)
<223> 延伸
<220>
<221> misc_feature
<222> (136)..(142)
<223> 延伸
<220>
<221> misc_feature
<222> (136)..(142)
<223> 终止子
<400> 49
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttg aaaaacagca tagcaagtta 60
aaataaggct agtccgttat caacttgaaa aagtggcacc gagtcggtgc gcgcacatga 120
ggatcaccca tgtgcttttt tt 142
<210> 50
<211> 148
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2-3'_10bp-延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(42)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (43)..(46)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (47)..(56)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (57)..(116)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (117)..(120)
<223> 延伸
<220>
<221> misc_feature
<222> (121)..(139)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (140)..(141)
<223> 延伸
<220>
<221> misc_feature
<222> (142)..(148)
<223> 终止子
<400> 50
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttt tggaaacaaa acagcatagc 60
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcgcgc 120
acatgaggat cacccatgtg cttttttt 148
<210> 51
<211> 147
<212> DNA
<213> 人工序列
<220>
<223> 1xMS2-SL2_7bp-延伸_US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(39)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (40)..(43)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (44)..(50)
<223> the 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (51)..(86)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (87)..(91)
<223> 延伸
<220>
<221> misc_feature
<222> (92)..(110)
<223> MS2 (C5 变体) 适体
<220>
<221> misc_feature
<222> (111)..(120)
<223> 延伸
<220>
<221> misc_feature
<222> (121)..(140)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (141)..(147)
<223> 终止子
<400> 51
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttg aaaaacagca tagcaagtta 60
aaataaggct agtccgttat caacttggcc aacatgagga tcacccatgt ctgcagggcc 120
aagtggcacc gagtcggtgc ttttttt 147
<210> 52
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> 2xMS2_C5-SL2_f6-3'_7bp 延伸-US
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (21)..(32)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (33)..(39)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (40)..(43)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (44)..(50)
<223> 延伸 重复:反重复序列
<220>
<221> misc_feature
<222> (51)..(86)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (87)..(91)
<223> 延伸
<220>
<221> misc_feature
<222> (92)..(110)
<223> f6 适体
<220>
<221> misc_feature
<222> (111)..(120)
<223> 延伸
<220>
<221> misc_feature
<222> (121)..(140)
<223> 恒定sgRNA序列
<220>
<221> misc_feature
<222> (141)..(144)
<223> 延伸
<220>
<221> misc_feature
<222> (145)..(158)
<223> f6 适体
<220>
<221> misc_feature
<222> (159)..(160)
<223> 延伸
<220>
<221> misc_feature
<222> (161)..(167)
<223> 终止子
<400> 52
nnnnnnnnnn nnnnnnnnnn gttttagagc tatgctgttg aaaaacagca tagcaagtta 60
aaataaggct agtccgttat caacttggcc aacatgagga tcacccatgt ctgcagggcc 120
aagtggcacc gagtcggtgc gcgcccacag tcactggggc ttttttt 167
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 位点2
<400> 53
gaacacaaag catagactgc 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列位点3
<400> 54
ggcccagact gagcacgtga 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 CTNNB1
<400> 55
ctggactctg gaatccattc 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 EGFR
<400> 56
atcacgcagc tcatgccctt 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 PCSK9
<400> 57
caggttccac gggatgctct 20
<210> 58
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 FANCF
<400> 58
ggaatccctt ctgcagcacc 20
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 TRAC
<400> 59
ttcgtatctg taaaaccaag 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNa 目标位点序列 B2M
<400> 60
cttaccccac ttaactatct 20
<210> 61
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CR0118_PDCD1
<400> 61
cagttccaaa ccctggtggt 20
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CR0107_PDCD1
<400> 62
gggggttcca gggcctgtct 20
<210> 63
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CR0057-TRAC_EX3
<400> 63
ttcgtatctg taaaaccaag 20
<210> 64
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CR0151_CD2
<400> 64
gttcagccaa aacctcccca 20
<210> 65
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CR0121_PDCD1
<400> 65
ggagtctgag agatggagag 20
<210> 66
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CR0165_CIITA
<400> 66
cagctcacag tgtgccacca 20
<210> 67
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 TRAC_22550571
<400> 67
ttcaaaacct gtcagtgatt 20
<210> 68
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 PDCD1_241852953
<400> 68
gggggttcca gggcctgtct 20
<210> 69
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> sgRNA 目标位点序列 CTNNB1
<400> 69
ctggactctg gaatccattc 20
<210> 70
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 位点2 Forward Primer
<400> 70
tggcccttca agttactgca 20
<210> 71
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 位点2反向引物
<400> 71
agcacatgac agttaaggtt tgt 23
<210> 72
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 位点3 正向引物
<400> 72
aaacgcccat gcaattagtc 20
<210> 73
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 位点3反向引物
<400> 73
agcccctgtc taggaaaagc 20
<210> 74
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> CTNNB1 正向引物
<400> 74
caatgggtca tatcacagat tctt 24
<210> 75
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> CTNNB1反向引物
<400> 75
ccagctactt gttcttgagt gaa 23
<210> 76
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> EGFR 正向引物
<400> 76
tcatgcgtct tcacctggaa 20
<210> 77
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> EGFR反向引物
<400> 77
cgcacacaca tatccccatg 20
<210> 78
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PCSK9 正向引物
<400> 78
cactagcagg gacaaggtgg 20
<210> 79
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PCSK9反向引物
<400> 79
attcagctca gatggggtgg 20
<210> 80
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> FANCF 正向引物
<400> 80
cgctgggaga ttgacatgca 20
<210> 81
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> FANCF反向引物
<400> 81
ctcttgcctc cactggttgt 20
<210> 82
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC 正向引物
<400> 82
acctacccca tccccagaag 20
<210> 83
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC反向引物
<400> 83
tccctaaacc ccactcccag 20
<210> 84
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> B2M 正向引物
<400> 84
tgggtttcat ccatccgaca t 21
<210> 85
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> B2M反向引物
<400> 85
atgggatggg actcattcag g 21
<210> 86
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成crRNA序列
<220>
<221> misc_feature
<222> (1)..(20)
<223> N 代表20 nt的目标特定间隔物序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 2'OMe (2'-O-甲基核苷酸)和硫代磷酸酯改性的残基
<220>
<221> misc_feature
<222> (2)..(2)
<223> 2'OMe (2'-O-甲基核苷酸)和硫代磷酸酯改性的残基
<400> 86
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 87
<211> 99
<212> DNA
<213> 人工序列
<220>
<223> 合成1xMS2 tracrRNA-适体序列
<220>
<221> misc_feature
<222> (97)..(98)
<223> 2'OMe (m) 和硫代磷酸酯(*)修饰的残基
<220>
<221> misc_feature
<222> (97)..(98)
<223> 2'OMe 和硫代磷酸酯修饰的残基
<400> 87
aacagcauag caaguuaaaa uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag 60
ucggugcgcg cacaugagga ucacccaugu gcuuuuuuu 99
<210> 88
<211> 141
<212> DNA
<213> 人工序列
<220>
<223> 合成2xMS2 tracrRNA-适体序列
<220>
<221> misc_feature
<222> (139)..(140)
<223> 2'OMe and phosphorothioate modified residue
<220>
<221> misc_feature
<222> (139)..(140)
<223> 2'OMe 和硫代磷酸酯修饰的残基
<400> 88
aacagcauag caaguuaaaa uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag 60
ucggugcggg agcacaugag gaucacccau gugccacgag cgacaugagg aucacccaug 120
ucgcucgugu ucccuuuuuu u 141
<210> 89
<211> 167
<212> DNA
<213> 人工序列
<220>
<223> Lentiviral sgRNA序列
<220>
<221> misc_feature
<222> (1)..(20)
<223> n's 表示20个碱基目标特异性序列
<220>
<221> misc_feature
<222> (1)..(2)
<223> residues 1 and 2 是经硫代磷酸酯改性的
<220>
<221> misc_feature
<222> (1)..(2)
<223> r基1和2是2'OME改性的
<220>
<221> misc_feature
<222> (168)..(169)
<223> 残基168和169是被硫代磷酸酯改性的
<220>
<221> misc_feature
<222> (168)..(169)
<223> 残基168和169是2'OME修饰的
<400> 89
nnnnnnnnnn nnnnnnnnnn guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcggga gcacaugagg aucacccaug 120
ugccacgagc gacaugagga ucacccaugu cgcucguguu cccuuuu 167
<210> 90
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_1 sgRNA 引导序列
<400> 90
cacagcccaa gatagttaag 20
<210> 91
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_2 sgRNA 引导序列
<400> 91
acagcccaag atagttaagt 20
<210> 92
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_3 sgRNA 引导序列
<400> 92
ttaccccact taactatctt 20
<210> 93
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_4 sgRNA 引导序列
<400> 93
cttaccccac ttaactatct 20
<210> 94
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_5 sgRNA 引导序列
<400> 94
actcacgctg gatagcctcc 20
<210> 95
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_6 sgRNA 引导序列
<400> 95
ttggagtacc tgaggaatat 20
<210> 96
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_7 sgRNA 引导序列
<400> 96
tcgatctatg aaaaagacag 20
<210> 97
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> B2M_8 sgRNA 引导序列
<400> 97
aacctgaaaa gaaaagaaaa 20
<210> 98
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_1 sgRNA 引导序列
<400> 98
gtacaggtaa gagcaacgcc 20
<210> 99
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_2 sgRNA 引导序列
<400> 99
ctcctcctac agatacaaac 20
<210> 100
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_3 sgRNA 引导序列
<400> 100
cagatacaaa ctggactctc 20
<210> 101
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_4 sgRNA 引导序列
<400> 101
ctcttacctg taccataacc 20
<210> 102
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_5 sgRNA 引导序列
<400> 102
gtatctgtag gaggagaagt 20
<210> 103
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_6 sgRNA 引导序列
<400> 103
tgtatctgta ggaggagaag 20
<210> 104
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> CD52_7 sgRNA 引导序列
<400> 104
gtccagtttg tatctgtagg 20
<210> 105
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_1 sgRNA 引导序列
<400> 105
aacaaatgtg tcacaaagta 20
<210> 106
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_2 sgRNA 引导序列
<400> 106
cttcttcccc agcccaggta 20
<210> 107
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_3 sgRNA 引导序列
<400> 107
ttcttcccca gcccaggtaa 20
<210> 108
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_4 sgRNA 引导序列
<400> 108
agcccaggta agggcagctt 20
<210> 109
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_5 sgRNA 引导序列
<400> 109
tttcaaaacc tgtcagtgat 20
<210> 110
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_6 sgRNA 引导序列
<400> 110
ttcaaaacct gtcagtgatt 20
<210> 111
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_7 sgRNA 引导序列
<400> 111
ccgaatcctc ctcctgaaag 20
<210> 112
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_8 sgRNA 引导序列
<400> 112
cttacctggg ctggggaaga 20
<210> 113
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRAC_9 sgRNA 引导序列
<400> 113
ttcgtatctg taaaaccaag 20
<210> 114
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_1 sgRNA 引导序列
<400> 114
ccacacccaa aaggccacac 20
<210> 115
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_2 sgRNA 引导序列
<400> 115
cccaccagct cagctccacg 20
<210> 116
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_3 sgRNA 引导序列
<400> 116
cgctgtcaag tccagttcta 20
<210> 117
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_4 sgRNA 引导序列
<400> 117
gctgtcaagt ccagttctac 20
<210> 118
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_5 sgRNA 引导序列
<400> 118
agtccagttc tacgggctct 20
<210> 119
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_6 sgRNA 引导序列
<400> 119
cacccagatc gtcagcgccg 20
<210> 120
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_7 sgRNA 引导序列
<400> 120
acctgctcta ccccaggcct 20
<210> 121
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1/2_8 sgRNA 引导序列
<400> 121
ccactcacct gctctacccc 20
<210> 122
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_1 sgRNA 引导序列
<400> 122
cacggacccg cagcccctca 20
<210> 123
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_2 sgRNA 引导序列
<400> 123
gcgggggttc tgccagaagg 20
<210> 124
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_3 sgRNA 引导序列
<400> 124
gttgcggggg ttctgccaga 20
<210> 125
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_4 sgRNA 引导序列
<400> 125
atgacgagtg gacccaggat 20
<210> 126
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_5 sgRNA 引导序列
<400> 126
tgacgagtgg acccaggata 20
<210> 127
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_6 sgRNA 引导序列
<400> 127
acctgctcta ccccaggcct 20
<210> 128
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_7 sgRNA 引导序列
<400> 128
ccaacagtgt cctaccagca 20
<210> 129
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_8 sgRNA 引导序列
<400> 129
caacagtgtc ctaccagcaa 20
<210> 130
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_9 sgRNA 引导序列
<400> 130
aacagtgtcc taccagcaag 20
<210> 131
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_10 sgRNA 引导序列
<400> 131
gtctgaaaga aagcagggag 20
<210> 132
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_11 sgRNA 引导序列
<400> 132
ccacagtctg aaagaaagca 20
<210> 133
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_12 sgRNA 引导序列
<400> 133
gccacagtct gaaagaaagc 20
<210> 134
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_13 sgRNA 引导序列
<400> 134
gacactgttg gcacggagga 20
<210> 135
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_14 sgRNA 引导序列
<400> 135
gtaggacact gttggcacgg 20
<210> 136
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_15 sgRNA 引导序列
<400> 136
taccatggcc atcaacacaa 20
<210> 137
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC1_16 sgRNA 引导序列
<400> 137
ttaccatggc catcaacaca 20
<210> 138
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_1 sgRNA 引导序列
<400> 138
ccagctcagc tccacgtggt 20
<210> 139
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_2 sgRNA 引导序列
<400> 139
cacagacccg cagcccctca 20
<210> 140
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_3 sgRNA 引导序列
<400> 140
gcgggggttc tgccagaagg 20
<210> 141
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_4 sgRNA 引导序列
<400> 141
gttgcggggg ttctgccaga 20
<210> 142
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_5 sgRNA 引导序列
<400> 142
atgacgagtg gacccaggat 20
<210> 143
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_6 sgRNA 引导序列
<400> 143
tgacgagtgg acccaggata 20
<210> 144
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_7 sgRNA 引导序列
<400> 144
acctgctcta ccccaggcct 20
<210> 145
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_8 sgRNA 引导序列
<400> 145
tcaacagagt cttaccagca 20
<210> 146
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_9 sgRNA 引导序列
<400> 146
caacagagtc ttaccagcaa 20
<210> 147
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_10 sgRNA 引导序列
<400> 147
aacagagtct taccagcaag 20
<210> 148
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_11 sgRNA 引导序列
<400> 148
cacagtctga aagaaaacag 20
<210> 149
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_12 sgRNA 引导序列
<400> 149
ccacagtctg aaagaaaaca 20
<210> 150
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> TRBC2_13 sgRNA 引导序列
<400> 150
gccacagtct gaaagaaaac 20
<210> 151
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_1 sgRNA 引导序列
<400> 151
tccaggcatg cagatcccac 20
<210> 152
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_2 sgRNA 引导序列
<400> 152
tgcagatccc acaggcgccc 20
<210> 153
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_3 sgRNA 引导序列
<400> 153
cgactggcca gggcgcctgt 20
<210> 154
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_4 sgRNA 引导序列
<400> 154
acgactggcc agggcgcctg 20
<210> 155
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_5 sgRNA 引导序列
<400> 155
accgcccaga cgactggcca 20
<210> 156
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_6 sgRNA 引导序列
<400> 156
caccgcccag acgactggcc 20
<210> 157
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_7 sgRNA 引导序列
<400> 157
tgtagcaccg cccagacgac 20
<210> 158
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_8 sgRNA 引导序列
<400> 158
gggcggtgct acaactgggc 20
<210> 159
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_9 sgRNA 引导序列
<400> 159
cggtgctaca actgggctgg 20
<210> 160
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_10 sgRNA 引导序列
<400> 160
ctacaactgg gctggcggcc 20
<210> 161
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_11 sgRNA 引导序列
<400> 161
cacctaccta agaaccatcc 20
<210> 162
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> =PDCD1_12 sgRNA 引导序列
<400> 162
ggggttccag ggcctgtctg 20
<210> 163
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_13 sgRNA 引导序列
<400> 163
gggggttcca gggcctgtct 20
<210> 164
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_14 sgRNA 引导序列
<400> 164
ggggggttcc agggcctgtc 20
<210> 165
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_15 sgRNA 引导序列
<400> 165
cagcaaccag acggacaagc 20
<210> 166
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_16 sgRNA 引导序列
<400> 166
cccgaggacc gcagccagcc 20
<210> 167
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_17 sgRNA 引导序列
<400> 167
ggaccgcagc cagcccggcc 20
<210> 168
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_18 sgRNA 引导序列
<400> 168
cgtgtcacac aactgcccaa 20
<210> 169
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_19 sgRNA 引导序列
<400> 169
gtgtcacaca actgcccaac 20
<210> 170
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_20 sgRNA 引导序列
<400> 170
cgcagatcaa agagagcctg 20
<210> 171
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_21 sgRNA 引导序列
<400> 171
gcagatcaaa gagagcctgc 20
<210> 172
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_22 sgRNA 引导序列
<400> 172
agccggccag ttccaaaccc 20
<210> 173
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_23 sgRNA 引导序列
<400> 173
cggccagttc caaaccctgg 20
<210> 174
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_24 sgRNA 引导序列
<400> 174
cagttccaaa ccctggtggt 20
<210> 175
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_25 sgRNA 引导序列
<400> 175
ggacccagac tagcagcacc 20
<210> 176
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_26 sgRNA 引导序列
<400> 176
cacctaccta agaaccatcc 20
<210> 177
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_27 sgRNA 引导序列
<400> 177
ggagtctgag agatggagag 20
<210> 178
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_28 sgRNA 引导序列
<400> 178
tctggaaggg cacaaaggtc 20
<210> 179
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_29 sgRNA 引导序列
<400> 179
ttctctctgg aagggcacaa 20
<210> 180
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_30 sgRNA 引导序列
<400> 180
tgacgttacc tcgtgcggcc 20
<210> 181
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_31 sgRNA 引导序列
<400> 181
tccctgcaga gaaacacact 20
<210> 182
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_32 sgRNA 引导序列
<400> 182
gagactcacc aggggctggc 20
<210> 183
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_33 sgRNA 引导序列
<400> 183
tctttgagga gaaagggaga 20
<210> 184
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PDCD1_34 sgRNA 引导序列
<400> 184
ttctttgagg agaaagggag 20
<210> 185
<211> 99
<212> RNA
<213> 人工序列
<220>
<223> 1x MS2_3 tracrRNA (F-5)
<220>
<221> misc_feature
<222> (77)..(77)
<223> x = 2AdP (2-aminopurine)
<220>
<221> misc_feature
<222> (97)..(97)
<223> U 用2'OME和硫代磷酸酯修饰
<220>
<221> misc_feature
<222> (98)..(98)
<223> U 用2'OME和硫代磷酸酯修饰
<400> 185
aacagcauag caaguuaaaa uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag 60
ucggugcgcg gcccggngga ucaccacggg ccuuuuuuu 99
<210> 186
<211> 1981
<212> PRT
<213> 人工序列
<220>
<223>RNA支架介导的募集系统的蛋白质序列 (2
xUGI)
<220>
<221> MISC_FEATURE
<222> (1)..(7)
<223> 核定位信号(NLS)
<220>
<221> MISC_FEATURE
<222> (8)..(235)
<223> APOBEC1
<220>
<221> MISC_FEATURE
<222> (236)..(261)
<223> 接头
<220>
<221> MISC_FEATURE
<222> (262)..(378)
<223> MCP
<220>
<221> MISC_FEATURE
<222> (382)..(399)
<223> T2A 肽
<220>
<221> MISC_FEATURE
<222> (402)..(408)
<223> 核定位信号(NLS)
<220>
<221> MISC_FEATURE
<222> (409)..(1775)
<223> nCAS9D10A
<220>
<221> MISC_FEATURE
<222> (1786)..(1868)
<223> UGI
<220>
<221> MISC_FEATURE
<222> (1879)..(1961)
<223> UGI
<220>
<221> MISC_FEATURE
<222> (1976)..(1982)
<223> 核定位信号(NLS)
<400> 186
Lys Lys Lys Arg Lys Val Met Ser Ser Glu Thr Gly Pro Val Ala Val
1 5 10 15
Asp Pro Thr Leu Arg Arg Arg Ile Glu Pro His Glu Phe Glu Val Phe
20 25 30
Phe Asp Pro Arg Glu Leu Arg Lys Glu Thr Cys Leu Leu Tyr Glu Ile
35 40 45
Asn Trp Gly Gly Arg His Ser Ile Trp Arg His Thr Ser Gln Asn Thr
50 55 60
Asn Lys His Val Glu Val Asn Phe Ile Glu Lys Phe Thr Thr Glu Arg
65 70 75 80
Tyr Phe Cys Pro Asn Thr Arg Cys Ser Ile Thr Trp Phe Leu Ser Trp
85 90 95
Ser Pro Cys Gly Glu Cys Ser Arg Ala Ile Thr Glu Phe Leu Ser Arg
100 105 110
Tyr Pro His Val Thr Leu Phe Ile Tyr Ile Ala Arg Leu Tyr His His
115 120 125
Ala Asp Pro Arg Asn Arg Gln Gly Leu Arg Asp Leu Ile Ser Ser Gly
130 135 140
Val Thr Ile Gln Ile Met Thr Glu Gln Glu Ser Gly Tyr Cys Trp Arg
145 150 155 160
Asn Phe Val Asn Tyr Ser Pro Ser Asn Glu Ala His Trp Pro Arg Tyr
165 170 175
Pro His Leu Trp Val Arg Leu Tyr Val Leu Glu Leu Tyr Cys Ile Ile
180 185 190
Leu Gly Leu Pro Pro Cys Leu Asn Ile Leu Arg Arg Lys Gln Pro Gln
195 200 205
Leu Thr Phe Phe Thr Ile Ala Leu Gln Ser Cys His Tyr Gln Arg Leu
210 215 220
Pro Pro His Ile Leu Trp Ala Thr Gly Leu Lys Glu Leu Lys Thr Pro
225 230 235 240
Leu Gly Asp Thr Thr His Thr Ser Pro Pro Cys Pro Ala Pro Glu Leu
245 250 255
Leu Gly Gly Pro Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp
260 265 270
Asn Gly Gly Thr Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn
275 280 285
Gly Ile Ala Glu Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys
290 295 300
Val Thr Cys Ser Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr
305 310 315 320
Ile Lys Val Glu Val Pro Lys Gly Ala Trp Arg Ser Tyr Leu Asn Met
325 330 335
Glu Leu Thr Ile Pro Ile Phe Ala Thr Asn Ser Asp Cys Glu Leu Ile
340 345 350
Val Lys Ala Met Gln Gly Leu Leu Lys Asp Gly Asn Pro Ile Pro Ser
355 360 365
Ala Ile Ala Ala Asn Ser Gly Ile Tyr Gly Ser Gly Glu Gly Arg Gly
370 375 380
Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Thr
385 390 395 400
Pro Lys Lys Lys Arg Lys Val Asp Lys Lys Tyr Ser Ile Gly Leu Ala
405 410 415
Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys
420 425 430
Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His Ser
435 440 445
Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr
450 455 460
Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg
465 470 475 480
Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met
485 490 495
Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe Leu
500 505 510
Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn Ile
515 520 525
Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His Leu
530 535 540
Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile
545 550 555 560
Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu Ile
565 570 575
Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe Ile
580 585 590
Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn
595 600 605
Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys
610 615 620
Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys
625 630 635 640
Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro
645 650 655
Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu
660 665 670
Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile
675 680 685
Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp
690 695 700
Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr Lys
705 710 715 720
Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His Gln
725 730 735
Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu Lys
740 745 750
Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr
755 760 765
Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro
770 775 780
Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu Asn
785 790 795 800
Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile
805 810 815
Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln
820 825 830
Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys
835 840 845
Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly
850 855 860
Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr
865 870 875 880
Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
885 890 895
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys
900 905 910
Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn
915 920 925
Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro Ala
930 935 940
Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe Lys
945 950 955 960
Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys
965 970 975
Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp Arg
980 985 990
Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile Lys
995 1000 1005
Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
1010 1015 1020
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile
1025 1030 1035
Glu Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val
1040 1045 1050
Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu
1055 1060 1065
Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys
1070 1075 1080
Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn
1085 1090 1095
Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu Asp
1100 1105 1110
Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
1115 1120 1125
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile
1130 1135 1140
Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
1145 1150 1155
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn
1160 1165 1170
Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys
1175 1180 1185
Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys
1190 1195 1200
Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr
1205 1210 1215
Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu
1220 1225 1230
Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp His Ile Val
1235 1240 1245
Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
1250 1255 1260
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1265 1270 1275
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1280 1285 1290
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1295 1300 1305
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1310 1315 1320
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1325 1330 1335
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1340 1345 1350
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1355 1360 1365
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1370 1375 1380
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1385 1390 1395
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1400 1405 1410
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1415 1420 1425
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1430 1435 1440
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1445 1450 1455
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1460 1465 1470
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1475 1480 1485
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1490 1495 1500
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1505 1510 1515
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1520 1525 1530
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1535 1540 1545
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1550 1555 1560
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1565 1570 1575
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1580 1585 1590
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1595 1600 1605
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1610 1615 1620
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1625 1630 1635
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1640 1645 1650
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1655 1660 1665
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1670 1675 1680
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1685 1690 1695
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1700 1705 1710
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1715 1720 1725
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1730 1735 1740
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1745 1750 1755
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1760 1765 1770
Asp Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr Asn Leu Ser
1775 1780 1785
Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val Ile Gln Glu
1790 1795 1800
Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val Ile Gly Asn
1805 1810 1815
Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr Asp Glu Ser
1820 1825 1830
Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala Pro Glu Tyr
1835 1840 1845
Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly Glu Asn Lys
1850 1855 1860
Ile Lys Met Leu Ser Gly Gly Ser Gly Gly Ser Gly Gly Ser Thr
1865 1870 1875
Asn Leu Ser Asp Ile Ile Glu Lys Glu Thr Gly Lys Gln Leu Val
1880 1885 1890
Ile Gln Glu Ser Ile Leu Met Leu Pro Glu Glu Val Glu Glu Val
1895 1900 1905
Ile Gly Asn Lys Pro Glu Ser Asp Ile Leu Val His Thr Ala Tyr
1910 1915 1920
Asp Glu Ser Thr Asp Glu Asn Val Met Leu Leu Thr Ser Asp Ala
1925 1930 1935
Pro Glu Tyr Lys Pro Trp Ala Leu Val Ile Gln Asp Ser Asn Gly
1940 1945 1950
Glu Asn Lys Ile Lys Met Leu Ser Gly Gly Ser Lys Arg Thr Ala
1955 1960 1965
Asp Gly Ser Glu Phe Glu Pro Lys Lys Lys Arg Lys Val
1970 1975 1980

Claims (33)

1.一种RNA支架,其包含:
(a)tracrRNA;和
(b)具有延伸序列的RNA基序。
2.根据权利要求1所述的RNA支架,其中,所述支架还包含含有向导RNA序列的crRNA。
3.根据权利要求1或权利要求2所述的RNA支架,其中,所述支架包含一个或多个修饰。
4.根据权利要求1或权利要求2所述的RNA支架,其中,所述RNA基序经由接头连接至所述tracrRNA的3’末端。
5.根据权利要求4所述的RNA支架,其中,所述接头是单链RNA或化学连接。
6.根据前述权利要求中任一项所述的RNA支架,其中,所述tracrRNA与含有向导RNA序列的所述crRNA融合,形成单个RNA分子。
7.根据前述权利要求中任一项所述的RNA支架,其中,所述tracrRNA和含有向导RNA序列的所述crRNA作为分开的RNA分子合成。
8.根据前述权利要求中任一项所述的RNA支架,其中,所述tracrRNA通过重复-反重复区域与所述crRNA杂交。
9.根据前述权利要求中任一项所述的RNA支架,其中,所述重复-反重复区域是延伸的。
10.根据权利要求9所述的RNA支架,其中,所述重复-反重复区域包含上部茎,所述上部茎是延伸的,包含20至26个核苷酸的总长度。
11.根据权利要求10所述的RNA支架,其中,所述重复:反重复区域上部茎在作为一个单一RNA分子合成时包含22个核苷酸的总长度。
12.根据权利要求10所述的RNA支架,其中,所述重复:反重复区域上部茎在作为两个单独的RNA分子合成时包含25个核苷酸的总长度。
13.根据前述权利要求中任一项所述的RNA支架,其中,所述RNA支架包含一个或多个RNA基序。
14.根据前述权利要求中任一项所述的RNA支架,其中,所述一个或多个RNA基序包含一个或多个修饰。
15.根据权利要求14所述的RNA支架,其中,所述一个或多个修饰在所述一个或多个RNA基序的5’末端和/或3’末端。
16.根据权利要求14所述的RNA支架,其中,所述一个或多个修饰是在10位的A碱基被取代为2-氨基嘌呤(2AP)。
17.根据权利要求16所述的RNA支架,其中,2-氨基嘌呤(2AP)是2’脱氧-2-氨基嘌呤或2’核糖2-氨基嘌呤。
18.根据权利要求3所述的RNA支架,其中,所述一个或多个修饰针对所述RNA支架的主链和/或糖部分。
19.根据前述权利要求中任一项所述的RNA支架,其中,所述RNA基序的所述延伸序列是双链延伸。
20.根据前述权利要求中任一项所述的RNA支架,其中,所述RNA基序的所述延伸序列包含2至24个核苷酸,其中所述募集RNA基序的总长度为23至45个核苷酸。
21.根据前述权利要求中任一项所述的RNA支架,其中,单链RNA接头包含0至10个核苷酸,优选2至6个核苷酸。
22.根据前述权利要求中任一项所述的RNA支架,其中,所述一个或多个RNA基序与适体结合分子结合。
23.根据前述权利要求中任一项所述的RNA支架,其中,所述一个或多个RNA基序选自以下适体:MS2、Ku、PP7、SfMu和Sm7。
24.根据权利要求22或权利要求23所述的RNA支架,其中,所述MS2适体与MCP蛋白结合。
25.根据权利要求23所述的RNA支架,其中,所述MS2适体是野生型MS2、突变型MS2或其变体。
26.根据权利要求25所述的RNA支架,其中,所述突变型MS2是C-5、F-5杂合体和/或F-5突变体。
27.根据前述权利要求中任一项所述的RNA支架,其中,所述RNA基序募集效应子模块。
28.根据权利要求27所述的RNA支架,其中,所述效应子模块包含能够与所述RNA基序结合的RNA结合结构域和效应子结构域。
29.根据权利要求28所述的RNA支架,其中,所述效应子结构域选自:报告子、标签、分子、蛋白质、微粒和纳米颗粒。
30.根据权利要求28所述的RNA支架,其中,所述效应子结构域是DNA修饰酶。
31.根据权利要求30所述的RNA支架,其中,所述DNA修饰酶选自:AID、CDA、APOBEC1、APOBEC3A、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F或其他APOBEC家族酶、ADA、ADAR家族酶或tRNA腺苷脱氨酶。
32.根据前述权利要求中任一项所述的RNA支架,其中,所述RNA支架包含选自表4中的序列的序列。
33.根据前述权利要求中任一项所述的RNA支架,其中,所述RNA基序具有选自SEQ IDNO:21至SEQ ID NO:24的序列。
CN202180054125.0A 2020-07-10 2021-07-09 Rna支架 Pending CN116507629A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB2010692.8A GB202010692D0 (en) 2020-07-10 2020-07-10 RNA scaffolds
GB2010692.8 2020-07-10
PCT/US2021/041045 WO2022011232A1 (en) 2020-07-10 2021-07-09 Rna scaffolds

Publications (1)

Publication Number Publication Date
CN116507629A true CN116507629A (zh) 2023-07-28

Family

ID=72139978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180054125.0A Pending CN116507629A (zh) 2020-07-10 2021-07-09 Rna支架

Country Status (7)

Country Link
US (1) US20230203502A1 (zh)
EP (1) EP4178971A1 (zh)
JP (1) JP2023543108A (zh)
CN (1) CN116507629A (zh)
CA (1) CA3183129A1 (zh)
GB (1) GB202010692D0 (zh)
WO (1) WO2022011232A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3234338A1 (en) 2021-10-08 2023-04-13 Pencil Biosciences Limited Synthetic genome editing system

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3219799A1 (en) * 2016-03-17 2017-09-20 IMBA-Institut für Molekulare Biotechnologie GmbH Conditional crispr sgrna expression
US10767175B2 (en) * 2016-06-08 2020-09-08 Agilent Technologies, Inc. High specificity genome editing using chemically modified guide RNAs

Also Published As

Publication number Publication date
EP4178971A1 (en) 2023-05-17
CA3183129A1 (en) 2022-01-13
WO2022011232A1 (en) 2022-01-13
US20230203502A1 (en) 2023-06-29
GB202010692D0 (en) 2020-08-26
JP2023543108A (ja) 2023-10-13

Similar Documents

Publication Publication Date Title
CN113631708B (zh) 编辑rna的方法和组合物
AU2022215269A1 (en) Genetically engineered cells and methods of making the same
CN113939591A (zh) 编辑rna的方法和组合物
JP2022550599A (ja) 操作されたデュアルガイド核酸を有するcrisprシステム
JP2019532674A (ja) TCRαホーミングエンドヌクレアーゼバリアント
CA3151279A1 (en) Highly efficient dna base editors mediated by rna-aptamer recruitment for targeted genome modification and uses thereof
CN116507629A (zh) Rna支架
AU2022324118A1 (en) Method for producing genetically modified cells
KR20230130635A (ko) 세포에서 mhc 클래스 ii를 감소시키기 위한 조성물및 방법
US20240067954A1 (en) Method for producing genetically modified cells
US20240060088A1 (en) Guide RNA Designs and Complexes for Type V Cas Systems
US20230235315A1 (en) Method for producing genetically modified cells
US20230023791A1 (en) Gene editing systems comprising a crispr nuclease and uses thereof
CN117222743A (zh) 向导RNA设计和用于无Tracr V型Cas系统的复合物
WO2023183434A2 (en) Compositions and methods for generating cells with reduced immunogenicty
WO2023137233A2 (en) Compositions and methods for editing genomes
WO2022256448A2 (en) Compositions and methods for targeting, editing, or modifying genes
WO2023225035A2 (en) Compositions and methods for engineering cells
WO2024081383A2 (en) Compositions and methods for targeting, editing, or modifying genes
CN116802274A (zh) 用于减少细胞中ii类mhc的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination